Jezične tehnologije

Naziv
Jezične tehnologije
Organizacijska jedinica
Odsjek za lingvistiku
ECTS bodovi
5
Šifra
117625
Semestri izvođenja
zimski
Jezik izvođenja
Hrvatski
Nastavnici
Satnica
Predavanja
30
Seminar
15

Cilj
Polaznici se osposobljavaju za suvereno snalaženje unutar područja jezičnih tehnologija te za primjenu jezičnih resursa i alata, ali i komercijalnih proizvoda s područja jezičnih tehnologija.
Sadržaj
  1. Razlika između računalne lingvistike i strojne obradbe jezika
  2. Tehnologija i jezične tehnologije (JT)
  3. Industrijalizacija jezika, razvitak pismenosti i (tele)komunikacija
  4. Podjela JT-a: jezični resursi, jezični alati, (komercijalni) proizvodi
  5. Razvitak JT-a za pojedini jezik
  6. Primjeri uporabe JT: pretraživanje dokumenata, crpljenje obavijesti, prepoznavanje naziva...
  7. JT za hrvatski jezik: stanje, projekti, perspektive
  8. JT resursi: korpusi, rječnici
  9. JT alati na raznim jezičnim razinama: fonološka razina (n-grami pismena)
  10. JT alati na raznim jezičnim razinama: morfološka razina (generatori, analizatori, lematizatori, označivači)
  11. JT alati na raznim jezičnim razinama: sintaktička razina (plitki, duboki, robustni parseri, razdjelnici (chunkeri), generativne i ovisnosne banke stabala)
  12. JT alati na raznim jezičnim razinama: semantička razina (FrameNet i WordNet)
  13. Komercijalni proizvodi: rječnici, provjernici (pravopisa, gramatike, stila), sustavi za diktiranje, strojno (potpomognuto) prevođenje (M(A)T)
  14. Računalno potpomognuto učenje jezika (CALL): HR4EU, mrežni portal za učenje hrvatskoga jezika
  15. Pregled relevantnih europskih projekata: CLARIN, ACCURAT, Let'sMT!, CESAR, XLike

Ishodi učenja
  1. Usvojiti razliku između računalne lingvistike i strojne obradbe jezika
  2. Usvojiti i objasniti podjelu jezičnih tehnologija na jezične resurse, jezične alate i komercijalne proizvode
  3. Objasniti kako se razvijaju jezične tehnologije za pojedini jezik
  4. Nabrojiti primjere uporabe jezičnih tehnologija
  5. Nabrojiti postojeće jezične resurse i alate za hrvatski jezik
  6. Primijeniti jezične tehnologije za hrvatski jezik u vlastitim istraživanjima
Metode podučavanja
Predavanje, rasprava, rješavanje zadataka
Metode ocjenjivanja
Pisani ispit i obavljanje praktičnoga zadatka

Obavezna literatura
  1. Fellbaum, C. (ur.) (1998) Wordnet: An Electronic Lexical Database, MIT Press, Cambridge MA.
  2. Hausser, R. R. (2001) Foundations of Computational Linguistics: Human-Computer Communication in Natural Language. Springer Verlag.
  3. Jurafsky, D. & Martin, J. H. (2000) Speech and Language Processing. An Introduction to Natural Language Processing. Computational Linguistics, and Speech Recognition. Prentice Hall.
  4. Mitkov, R. (ur.) (2003) The Oxford Handbook of Computational Linguistics, OUP, Oxford.
  5. Tadić, M.(2003) Jezične tehnologije i hrvatski jezik, Exlibris, Zagreb.
  6. Tadić, M., Brozović-Rončević, D., Kapetanić, A. (2012) Hrvatski jezik u digitalnom dobu / The Croatian Language in the Digital Age, Springer Verlag.
Dopunska literatura
  1. Tadić, M. (1992) Problemi računalne obrade imeničnih oblika u hrvatskome. Suvremena lingvistika 34, str. 301-308
  2. Tadić, M. (2003) Building the Croatian Morphological Lexicon. Proceedings of the EACL2003 Workshop on Morphological Processing of Slavic Languages, ACL, str. 41-46.
  3. Odabrani članci prema seminarskim potrebama.

Obavezan predmet na studijima
  1. Lingvistika, sveučilišni diplomski dvopredmetni studij
Izborni predmet na studijima
  1. Lingvistika, sveučilišni diplomski dvopredmetni studij
  2. Švedski jezik i kultura, sveučilišni diplomski dvopredmetni studij