Naziv
Računarska lingvistika
Organizacijska jedinica
Odsjek za informacijske i komunikacijske znanosti
ECTS bodovi
6
Šifra
117614
Semestri izvođenja
zimski
Jezik izvođenja
hrvatski
Satnica
Predavanja
30
Seminar
30

Cilj
Opće i specifične kompetencije (znanje i vještine) Student će dobiti temeljna znanja iz discipline obrade prirodnih jezika i bit će osposobljen da može samostalno modelirati postupke leksičke i sintaksne analize prirodnih jezika. Također će znati koristiti alate za ekstrahiranje informacija iz tekstova rečenica napisanih u prirodnom jeziku.
Sadržaj
  1. Računala i lingvistika
  2. NooJ alat za obradu prirodnih jezika.
  3. Prepoznavač i označivač
  4. Jezični formalizmi: pismo, abeceda, rječnik
  5. POS označavanje i (ne)statistički pristup
  6. Flektivne i derivacijske gramatike - opis paradigmi
  7. Ugniježđena pravila
  8. Jezične varijacije i višesložni izrazi
  9. Višerazinska obrada jezika i generativna gramatika
  10. Regularni izrazi i regularna gramatika - primjena
  11. Beskontekstna i kontekstna gramatika - primjena
  12. Korpusi i pretraživanje teksta.
  13. Metode vrednovanja sustava za obradu jezika
  14. Izrada seminarskih radova
  15. ZAVRŠNI ISPIT: Obrana seminarskog rada.

Ishodi učenja
  1. Opisati leksička, sintaksna i semantička svojstva prirodnih jezika.
  2. Modelirati beskontekstnu gramatiku osnovne strukture rečenica prirodnog jezika.
  3. Izabrati postupak parsiranja ili prepoznavanja rečenica prirodnog jezika.
  4. Oblikovati i realizirati vlastite algoritme za leksičku i sintaksnu analizu tekstova rečenica napisanih u prirodnom jeziku.
Metode podučavanja
Predavanja: kombinirano, klasično (ploča) i prikazom primjera izvedbom na PCu i projiciranjem uz istodobno pisanje ili analizu primjera programa od strane studenata na svojim računalima. Seminar: rješavanje zadanog projektnog (seminarskog) rada uz konzultiranje s predmetnim nastavnikom.
Metode ocjenjivanja
Praćenje rada i aktivnosti studenata tijekom semestra: - pohađanje predavanja – 10 bodova, Seminarski rad: - Obrana seminarskog rada – 90 bodova Skala ocjena: dovoljno (2) 50% - 59% dobro (3) 60% - 69% vrlo dobro (4) 70% - 79% izvrsno (5) 80% - 100%

Obavezna literatura
  1. Bird, S.; Klein, E.; Loper, E.: Natural Language Processing with Python, O’Reilly Media, 2009.
  2. Grishman, R.: Computational Linguistics: An Introduction, Cambridge University Press, 1994.
  3. Hoard, J.E.: Language Understanding and the Emerging Alignment of Linguistics and Natural Language Processing, u Using Computers in Linguistics, A Practical Guide, (ur.) J. Lawler and H.Aristar Dry, Routledge, London, str. 197-226, 1998.
  4. Hockey, S.: Textual databases u Using Computers in Linguistics, A Practical Guide, (ur.) J. Lawler and H.Aristar Dry, Routledge, London, str. 101-137, 1998.
  5. Silberztein, M.: Formalizing Natural Languages: The NooJ Approach, Wiley-iSTE, London, 2016.
Dopunska literatura
  1. Harris, M.D.: Introduction to Natural Language Processing. Prentice Hall, 1985.
  2. Dovedan Han, Z.: FORMALNI JEZICI I PREVODIOCI • prevođenje i primjene, Element, Zagreb, 2013.
  3. Dovedan Han, Z.: FORMALNI JEZICI I PREVODIOCI • regularni izrazi, gramatike, automati, Element, Zagreb, 2012.
  4. Dovedan Han, Z.: FORMALNI JEZICI I PREVODIOCI • sintaksna analiza i primjene, Element, Zagreb, 2012.
  5. Monteleone, M.: NooJ Grammars and Ethical Algorithms: Tackling on-line hate speech, NooJ 2018.

Izborni predmet na studijima
  1. Informacijske znanosti, sveučilišni diplomski jednopredmetni studij
  2. Informacijske znanosti, sveučilišni diplomski dvopredmetni studij