Naziv
Odabrana poglavlja obrade prirodnog jezika
Organizacijska jedinica
Odsjek za informacijske i komunikacijske znanosti
ECTS bodovi
5
Šifra
118070
Semestri izvođenja
zimski
Satnica
Predavanja
30
Seminar
30

Cilj
Automatska izgradnja bilo kojeg resursa prirodnog jezika zahtijeva dobro razumijevanje svojstava tog prirodnog jezika te lingvističkih i statističkih metoda obrade prirodnog jezika. Studenti će usvojiti lingvističke i statističke koncepte koji se koriste u obradi jezika i svladati automatske metode izgradnje primarnih i sekundarnih resursa za hrvatski jezik. Studenti stječu kompetencije, znanja i vještine u primjeni metoda automatske obrade prirodnog jezika te stječu znanje o brojnim temama i sustavima koji se bave različitim problemima obrade hrvatskog i drugih prirodnih jezika.
Sadržaj
  1. Opis kolegija i uvod u analizu sentimenta.
  2. Uloga leksikona u analizi sentimenta: WordNet
  3. Leksikoni sentimenta: SentiWordNet, WordNet Affect
  4. Metode analize sentimenta i leksikoni
  5. Klasične metode sažimanja: Ručno sažimanje.
  6. Klasične metode sažimanja: povrsinska razina
  7. Klasične metode sažimanja: razina entiteta
  8. Klasične metode sažimanja: Razina diskursa
  9. Kolokvij 1
  10. Analiza rezultata višestrukog označavanja
  11. Mjerenje dogovora između označitelja
  12. Diceov koeficijent – Dice's coefficient
  13. Cohenova kappa – Cohen's kappa
  14. Ekstrakcija pozitivnih, odnosno negativnih termina mjerom međusobne informacije
  15. Kolokvij 2

Ishodi učenja
  1. Objasniti razlike sustava automatskog sažimanje teksta statističkim i lingvističkim metodama
  2. Opisati sustave za analizu sentimenta
  3. Opisati sustave za prepoznavanje naziva
  4. Primijeniti tehnke izrade morfoloških leksikona flektivnih jezika
Metode podučavanja
Predavanja, seminari, praktičan rad.
Metode ocjenjivanja
Seminarski rad, praktičan rad, pismeni ispit

Obavezna literatura
  1. B. Liu. Sentiment Analysis and Subjectivity. A Chapter in Handbook of Natural Language Processing, 2nd Edition, 2010. http://www.cs.uic.edu/~liub/FBS/NLP-handbook-sentiment-analysis.pdf Hatzivassiloglou, V. & McKeown, K. Predicting the Semantic Orientation of Adjectives: http://acl.ldc.upenn.edu/P/P97/P97-1023.pdf
  2. Wiebe, J. Learning Subjective Adjectives from Corpora http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.30.2615&rank=1
  3. Turney, P. Thumbs Up or Thumbs Down? Semantic Orientation Applied to Unsupervised Classification of Reviews http://acl.ldc.upenn.edu/P/P02/P02-1053.pdf
  4. Yu, H. & Hatzivassiloglou, V. Towards Answering Opinion Questions: Separating Facts from Opinions and Identifying the Polarity of Opinion Sentences http://acl.ldc.upenn.edu/W/W03/W03-1017.pdf
  5. Mani, I: Automatic Summarization (2001).
Dopunska literatura
  1. Marcu. D: Theory and practice of Discourse Parsing and Summarization (2000). (knjiga je dostupna u zip formatu na Omegi)

Izborni predmet na studijima
  1. Informacijske znanosti, sveučilišni diplomski jednopredmetni studij
  2. Informacijske znanosti, sveučilišni diplomski dvopredmetni studij
Fakultetska ponuda
  • Diplomski studij: Zimski semestar