Računarska lingvistika

Naziv
Računarska lingvistika
Organizacijska jedinica
Odsjek za informacijske i komunikacijske znanosti
ECTS bodovi
6
Šifra
117614
Semestri izvođenja
zimski
Jezik izvođenja
Hrvatski
Satnica
Predavanja
30
Seminar
30

Cilj
Opće i specifične kompetencije (znanje i vještine) Student će dobiti temeljna znanja iz discipline obrade prirodnih jezika i bit će osposobljen da može samostalno modelirati postupke leksičke i sintaksne analize prirodnih jezika. Također će znati koristiti alate za ekstrahiranje informacija iz tekstova rečenica napisanih u prirodnom jeziku.
Sadržaj
  1. Uvod u obradu prirodnih jezika: token, leksičke kategorije, rečenica, korpus.
  2. NLTK, Pythonov alat za obradu prirodnih jezika.
  3. Pretraživanje teksta.
  4. Pristupanje tekstualnim korpusima i leksički resursi.
  5. Semantičke mreže riječi.
  6. Komadanje (chunking) uz pomoć regularnih izraza.
  7. Sintaksna analiza rečenica engleskog jezika: parsiranjem (rekurzivni spust) i prepoznavanjem (prepoznavač jezika sa svojstvima).
  8. Rad na seminarskom zadatku.
  9. Rad na seminarskom zadatku.
  10. Rad na seminarskom zadatku.
  11. Rad na seminarskom zadatku.
  12. Rad na seminarskom zadatku.
  13. Rad na seminarskom zadatku.
  14. Rad na seminarskom zadatku.
  15. ZAVRŠNI ISPIT: Obrana seminarskog rada.

Ishodi učenja
  1. Opisati leksička, sintaksna i semantička svojstva prirodnih jezika.
  2. Modelirati beskontekstnu gramatiku osnovne strukture rečenica prirodnog jezika.
  3. Izabrati postupak parsiranja ili prepoznavanja rečenica prirodnog jezika.
  4. Oblikovati i realizirati vlastite algoritme za leksičku i sintaktsnu analizu tekstova rečenica napisanih u prirodnom jeziku.
Metode podučavanja
Predavanja: kombinirano, klasično (ploča) i prikazom primjera izvedbom na PCu i projiciranjem uz istodobno pisanje ili analizu primjera programa od strane studenata na svojim računalima. Seminar: rješavanje zadanog projektnog (seminarskog) rada uz konzultiranje s predmetnim nastavnikom.
Metode ocjenjivanja
Praćenje rada i aktivnosti studenata tijekom semestra: - pohađanje predavanja – 10 bodova, Seminarski rad: - Obrana seminarskog rada – 90 bodova Skala ocjena: dovoljno (2) 50% - 59% dobro (3) 60% - 69% vrlo dobro (4) 70% - 79% izvrsno (5) 80% - 100%

Obavezna literatura
  1. Bird, S.; Klein, E.; Loper, E.: Natural Language Processing with Python, O’Reilly Media, 2009.
Dopunska literatura
  1. Harris, M.D.: Introduction to Natural Language Processing. Prentice Hall, 1985.
  2. Dovedan Han, Z.: FORMALNI JEZICI I PREVODIOCI • prevođenje i primjene, Element, Zagreb, 2013.
  3. Dovedan Han, Z.: FORMALNI JEZICI I PREVODIOCI • regularni izrazi, gramatike, automati, Element, Zagreb, 2012.
  4. Dovedan Han, Z.: FORMALNI JEZICI I PREVODIOCI • sintaksna analiza i primjene, Element, Zagreb, 2012.

Obavezan predmet na studijima
  1. Informacijske znanosti, sveučilišni diplomski jednopredmetni studij
Izborni predmet na studijima
  1. Informacijske znanosti, sveučilišni diplomski dvopredmetni studij
  2. Informacijske znanosti, sveučilišni diplomski jednopredmetni studij