Naziv
Računarska lingvistika
Organizacijska jedinica
Odsjek za informacijske i komunikacijske znanosti
ECTS bodovi
6
Šifra
117614
Semestri izvođenja
zimski
Jezik izvođenja
hrvatski
Satnica
Predavanja
30
Seminar
30

Cilj
Opće i specifične kompetencije (znanje i vještine) Student će dobiti temeljna znanja iz discipline obrade prirodnih jezika i bit će osposobljen da može samostalno modelirati postupke leksičke i sintaksne analize prirodnih jezika. Također će znati koristiti alate za ekstrahiranje informacija iz tekstova rečenica napisanih u prirodnom jeziku.
Sadržaj
  1. Računala i lingvistika
  2. NooJ alat za obradu prirodnih jezika.
  3. Prepoznavač i označivač
  4. Jezični formalizmi: pismo, abeceda, rječnik
  5. POS označavanje i (ne)statistički pristup
  6. Flektivne i derivacijske gramatike - opis paradigmi
  7. Ugniježđena pravila
  8. Jezične varijacije i višesložni izrazi
  9. Višerazinska obrada jezika i generativna gramatika
  10. Regularni izrazi i regularna gramatika - primjena
  11. Beskontekstna i kontekstna gramatika - primjena
  12. Korpusi i pretraživanje teksta.
  13. Metode vrednovanja sustava za obradu jezika
  14. Izrada seminarskih radova
  15. ZAVRŠNI ISPIT: Obrana seminarskog rada.

Ishodi učenja
  1. Opisati leksička, sintaksna i semantička svojstva prirodnih jezika.
  2. Modelirati beskontekstnu gramatiku osnovne strukture rečenica prirodnog jezika.
  3. Izabrati postupak parsiranja ili prepoznavanja rečenica prirodnog jezika.
  4. Oblikovati i realizirati vlastite algoritme za leksičku i sintaksnu analizu tekstova rečenica napisanih u prirodnom jeziku.
Metode podučavanja
Predavanja: kombinirano, klasično (ploča) i prikazom primjera izvedbom na PCu i projiciranjem uz istodobno pisanje ili analizu primjera programa od strane studenata na svojim računalima. Seminar: rješavanje zadanog projektnog (seminarskog) rada uz konzultiranje s predmetnim nastavnikom.
Metode ocjenjivanja
Praćenje rada i aktivnosti studenata tijekom semestra: - pohađanje predavanja – 10 bodova, Seminarski rad: - Obrana seminarskog rada – 90 bodova Skala ocjena: dovoljno (2) 50% - 59% dobro (3) 60% - 69% vrlo dobro (4) 70% - 79% izvrsno (5) 80% - 100%

Obavezna literatura
  1. Bird, S.; Klein, E.; Loper, E.: Natural Language Processing with Python, O’Reilly Media, 2009.
  2. Grishman, R.: Computational Linguistics: An Introduction, Cambridge University Press, 1994.
  3. Hoard, J.E.: Language Understanding and the Emerging Alignment of Linguistics and Natural Language Processing, u Using Computers in Linguistics, A Practical Guide, (ur.) J. Lawler and H.Aristar Dry, Routledge, London, str. 197-226, 1998.
  4. Hockey, S.: Textual databases u Using Computers in Linguistics, A Practical Guide, (ur.) J. Lawler and H.Aristar Dry, Routledge, London, str. 101-137, 1998.
  5. Silberztein, M.: Formalizing Natural Languages: The NooJ Approach, Wiley-iSTE, London, 2016.
Dopunska literatura
  1. Harris, M.D.: Introduction to Natural Language Processing. Prentice Hall, 1985.
  2. Dovedan Han, Z.: FORMALNI JEZICI I PREVODIOCI • prevođenje i primjene, Element, Zagreb, 2013.
  3. Dovedan Han, Z.: FORMALNI JEZICI I PREVODIOCI • regularni izrazi, gramatike, automati, Element, Zagreb, 2012.
  4. Dovedan Han, Z.: FORMALNI JEZICI I PREVODIOCI • sintaksna analiza i primjene, Element, Zagreb, 2012.
  5. Monteleone, M.: NooJ Grammars and Ethical Algorithms: Tackling on-line hate speech, NooJ 2018.

Obavezan predmet na studijima
  1. Informacijske znanosti, sveučilišni diplomski jednopredmetni studij
Izborni predmet na studijima
  1. Informacijske znanosti, sveučilišni diplomski dvopredmetni studij
  2. Informacijske znanosti, sveučilišni diplomski jednopredmetni studij