Naziv
Računarska lingvistika
Organizacijska jedinica
Odsjek za informacijske i komunikacijske znanosti
ECTS bodovi
6
Šifra
117614
Semestri izvođenja
zimski
Jezik izvođenja
hrvatski
Satnica
Predavanja
30
Seminar
30

Cilj
Opće i specifične kompetencije (znanje i vještine) Student će dobiti temeljna znanja iz discipline obrade prirodnih jezika i bit će osposobljen da može samostalno modelirati postupke leksičke i sintaksne analize prirodnih jezika. Također će znati koristiti alate za ekstrahiranje informacija iz tekstova rečenica napisanih u prirodnom jeziku.
Sadržaj
 1. Računala i lingvistika
 2. NooJ alat za obradu prirodnih jezika.
 3. Prepoznavač i označivač
 4. Jezični formalizmi: pismo, abeceda, rječnik
 5. POS označavanje i (ne)statistički pristup
 6. Flektivne i derivacijske gramatike - opis paradigmi
 7. Ugniježđena pravila
 8. Jezične varijacije i višesložni izrazi
 9. Višerazinska obrada jezika i generativna gramatika
 10. Regularni izrazi i regularna gramatika - primjena
 11. Beskontekstna i kontekstna gramatika - primjena
 12. Korpusi i pretraživanje teksta.
 13. Metode vrednovanja sustava za obradu jezika
 14. Izrada seminarskih radova
 15. ZAVRŠNI ISPIT: Obrana seminarskog rada.

Ishodi učenja
 1. Opisati leksička, sintaksna i semantička svojstva prirodnih jezika.
 2. Modelirati beskontekstnu gramatiku osnovne strukture rečenica prirodnog jezika.
 3. Izabrati postupak parsiranja ili prepoznavanja rečenica prirodnog jezika.
 4. Oblikovati i realizirati vlastite algoritme za leksičku i sintaksnu analizu tekstova rečenica napisanih u prirodnom jeziku.
Metode podučavanja
Predavanja: kombinirano, klasično (ploča) i prikazom primjera izvedbom na PCu i projiciranjem uz istodobno pisanje ili analizu primjera programa od strane studenata na svojim računalima. Seminar: rješavanje zadanog projektnog (seminarskog) rada uz konzultiranje s predmetnim nastavnikom.
Metode ocjenjivanja
Praćenje rada i aktivnosti studenata tijekom semestra: - pohađanje predavanja – 10 bodova, Seminarski rad: - Obrana seminarskog rada – 90 bodova Skala ocjena: dovoljno (2) 50% - 59% dobro (3) 60% - 69% vrlo dobro (4) 70% - 79% izvrsno (5) 80% - 100%

Obavezna literatura
 1. Bird, S.; Klein, E.; Loper, E.: Natural Language Processing with Python, O’Reilly Media, 2009.
 2. Grishman, R.: Computational Linguistics: An Introduction, Cambridge University Press, 1994.
 3. Hoard, J.E.: Language Understanding and the Emerging Alignment of Linguistics and Natural Language Processing, u Using Computers in Linguistics, A Practical Guide, (ur.) J. Lawler and H.Aristar Dry, Routledge, London, str. 197-226, 1998.
 4. Hockey, S.: Textual databases u Using Computers in Linguistics, A Practical Guide, (ur.) J. Lawler and H.Aristar Dry, Routledge, London, str. 101-137, 1998.
 5. Silberztein, M.: Formalizing Natural Languages: The NooJ Approach, Wiley-iSTE, London, 2016.
Dopunska literatura
 1. Harris, M.D.: Introduction to Natural Language Processing. Prentice Hall, 1985.
 2. Dovedan Han, Z.: FORMALNI JEZICI I PREVODIOCI • prevođenje i primjene, Element, Zagreb, 2013.
 3. Dovedan Han, Z.: FORMALNI JEZICI I PREVODIOCI • regularni izrazi, gramatike, automati, Element, Zagreb, 2012.
 4. Dovedan Han, Z.: FORMALNI JEZICI I PREVODIOCI • sintaksna analiza i primjene, Element, Zagreb, 2012.
 5. Monteleone, M.: NooJ Grammars and Ethical Algorithms: Tackling on-line hate speech, NooJ 2018.

Izborni predmet na studijima
 1. Informacijske znanosti, sveučilišni diplomski jednopredmetni studij
 2. Informacijske znanosti, sveučilišni diplomski dvopredmetni studij