Strojno prevođenje

Naziv
Strojno prevođenje
Organizacijska jedinica
Odsjek za informacijske i komunikacijske znanosti
ECTS bodovi
6
Šifra
52647
Semestri izvođenja
zimski
Jezik izvođenja
Hrvatski
Satnica
Predavanja
30
Seminar
30

Cilj
Cilj je kolegija upoznati studente s automatskim i poluautomatskim računalnim prevođenjem. Kolegij "Strojno prevođenje uključuje teorijski rad, samostalan praktičan rad i seminare. Teorijski dio obuhvaća povijesni razvoj računalnog prevođenja s jednog prirodnog jezika na drugi. Računalno potpomognuto prevođenje uključuje primjenu različitih alata: od standardnih alata za obradu teksta, do prijevodnih memorija, programa za prevođenje, elektronskih rječnika, terminoloških baza, tezaurusa. Studenti će steći znanja iz teorijskog dijela, a u praktičnome radu steći će iskustvo rada u praktičnoj primjeni na postojećim alatima, provesti evaluaciju područjima istraživanja. Kroz seminarski rad koji se izrađuje samostalno ili u paru, studenti će steći iskustvo u provedbi istraživanja na području računalnog prevođenja, koje će se prezentiranja na nastavi.
Sadržaj
 1. Uvod u strojno i strojno potpomognuto prevođenje; Ciljevi; Razlozi za razvojem računalnog prevođenja; primjena, zablude, ograničenja;
 2. Jezične tehnologije - interdisciplinarno područje; Tehnologije za hrvatski; Europski projekti, konferencije, istraživanja.
 3. Počeci razvoja; Prvi programi za obradu jezika; Prve razvojne faze računalnog prevođenja (1. i 2.faza razvoja; Prikaz i analiza programa; Daljnje faze razvoja računalnog prevođenja (3. i 4. Faza); Prikaz programa, analiza;
 4. Semantički Web; Ontologije; analiza izvora za hrvatski i strane jezike; Uloga i primjena računalnih korpusa; Rad na korpusima, analiza primjene u računalnom prevođenju
 5. Besplatni prevodilački alati na Internetu; Prikaz i analiza; Uloga pod-domene i ograničenosti na područja; Analiza različitih alata i evaluacija
 6. Prevodilački izvori na webu (rječnici, enciklopedije, tezaurusi, korpusi, glosari i dr.). Analiza izvora za hrvatski i strane jezike; Prikaz izvora za hrvatski-X jezični par. Stupnjevi automatizacije.
 7. Priprema teksta za računalno prevođenje. Prikaz alata Systran: razvoj, primjena, analiza programa; Analiza i tipologija pogrešaka; Prevodilački problemi u računalnom prevođenju.
 8. Primjena tehnologije u prevođenju u EU: stanje, potrebe; Prikaz alata za prevođenje u EU - Euramis. Online priručnici za hrvatski.
 9. Alati za prevođenje titlova; Alati za naknadno uređivanje; Alati za prepoznavanje govora - komercijalni i besplatni; Zahtjevi u EU.
 10. Evaluacija sustava za računalno prevođenje prema više kriterija; Razrada kriterija i provedba evaluacije
 11. Statističko računalno prevođenje. Strategije prevođenja. Stupnjevi automatizacije. Integrirani sustavi automatskog prevođenja i drugih pristupa (prijevodne memorije, prepoznavanje govora i dr.)
 12. Prijevodne memorija: način rada i integriranost s automatskim računalnim prevođenjem; Prikaz rada prijevodnih memorija (ovisno o raspoloživom alatu)
 13. Uloga lokalizacije; Digitalni jezični standardi i resursi; Jezične tehnologije - stanje i perspektiva
 14. Prikaz kolegija na drugim europskim sveučilištima Itegriranost kolegija – primjer u nastavi; Analiza
 15. Budućnost računalnog i računalno potpomognutog prevođenja; Završno predavanje

Ishodi učenja
 1. Primjena teorijskih modela u samostalnom ili timskom provođenju istraživanja, analizira praktične primjene i provođenje komparativne analize rezultata
 2. Praktičan rad, svijest o korisnosti i ograničenjima, razvoj metoda evaluacije i odgovarajućih metrika
 3. Primjena, kritička procjena i povezivanje znanja iz upravljanja složenim informacijskim sustavima te povezivanje s integriranim sustavima automatskog prevođenja
 4. Usvajanje znanja i svijesti o primjeni i postojećim ograničenjima automatskog računalnog prevođenja i računalno potpomognutog prevođenja u postupcima obrade dokumenta i pristupu informacijama
 5. Analiza potreba, uvjeta i ishoda unutar radne jedinice prilikom uvođenja tehnologije za računalno prevođenje
 6. Rad s alatima i resursima za automatsko prevođenje i računalno potpomognuto prevođenje
 7. Primjena i integracija različitih alata za automatsko i računalno potpomognuto prevođenje koji se koriste u EU (DGT) te analiza izvora za hrvatski jezik
 8. Primjena i analiza korpusa u izradi izvora potrebnih za računalno prevođenje
 9. Analiza ograničenja na domenu, provođenje istraživanja i evaluacija rezultata
 10. Prepoznavanje mogućnosti integracije različitih alata u postupku obrade dokumenta ili softvera
 11. Provođenje evaluacije uz kritički pristup softvera za automatsko računalno prevođenje, prijevodnih memorija i terminoloških baza
 12. Računalo opismenjavanje novim integriranim alatima za automatsko i računalno potpomognuto prevođenje kroz samostalni i timski pristup
Metode podučavanja
Metode poučavanja: klasično i primjenom sustava za e-učenje - Predavanja – teorijski dio - Vježbe – kroz samostalne zadatke - Seminar – kroz samostalni ili timski rad
Metode ocjenjivanja
Ocjenjivanje: – Pohađanje nastave 10% – Izvršeni zadaci na vježbama 10& – Seminarski rad 20% – Pismeni/ usmeni 60% Način ocjenjivanja pismenog: 90-100% = odličan(5) 75-90% = vrlo dobar (4) 60-75% = dobar(3) 50-60% = dovoljan(2)

Obavezna literatura
 1. Seljan, Sanja. Translation Technology as Challenge in Education and Business // Informatologia 44 (2011), 4, 279-286
 2. European Commission, DGT. Translation Tools and Workflow, 2012.
 3. Seljan, Sanja. Translation Technology as Challenge in Education and Business // Informatologia 44 (2011), 4, 279-286
 4. Dovedan, Zdravko; Seljan, Sanja; Vučković, Kristina. Strojno prevođenje kao pomoć u procesu komunikacije. Str. 283-291. Informatologia 35 (4), 2002, 283-291
 5. Introduction to Machine Translation: An Online Tutorial, 2008.
 6. Seljan, Sanja; Gašpar, Angelina. Primjena prevoditeljskih alata u EU i potreba za hrvatskim tehnologijama // Jezična politika i jezična stvarnost / Granić, Jagoda (ur.). Zagreb : HDPL, 2009, 617-625.
 7. Kučiš, Vlasta; Seljan, Sanja; Klasnić, Ksenija. Evaluation of Electronic Translation Tools Through Quality Parameters // The Future of Information Sciences: INFuture2009 - Digital Resources and Knowledge Sharing . Zagreb : Odsjek za informacijske znanosti, 2009, 341-351
 8. Seljan, Sanja. Hrvatski jezik i računalno prevođenje: Hrvatski online. InfoTrend.hr - onLINE, 2014.
 9. Seljan, Sanja; Vičić, Tomislav; Brkić, Marija. BLEU Evaluation of Machine-Translated English- Croatian Legislation // Proceedings of LREC'12. Istanbul, Turkey : European Language Resources Association (ELRA), 2012.
 10. Praktičan rad na nekoliko različitih softvera za automatsko prevođenje, rad s jezičnim resursima (online terminološke baze, rječnici višejezični i jednojezični), integracija s prijevodnom memorijom
Dopunska literatura
 1. Zetzshe, Jost: A Translator's Tool Box - A Computer Primer. International Writer's Group, 2014.
 2. Nirenburg, S; Somers, H; Wilks, Y. Readings in Machine Translation. MIT, 2003
 3. Maegaard, Bente, ed. MT Summit VIII: Machine Translation in the Information Age. Proceedings, Santiago de Compsotela, Spain, 2001.
 4. Richardon, S. D. Machine Translation: From Research to Real Users. 5th Conference of the AMTA, 2002.
 5. Seljan, Sanja. Tehnologija i jezik // Informacijske znanosti u procesu promjena / Lasić-Lazić, Jadranka (ur.). Zagreb : Filozofski fakultet, Zavod za informacijske studije, Odsjek za informacijske znanosti, 2005. Str. 24-44
 6. Wong, Sylvia: Machine Translation Techniques
 7. MT 2000. Machine Translation and Multilingual Applications in the New Millenium. British Computer Society, 2000.
 8. Schmidt Rio-Valle, Regina.Machine Translation today - An evaluation, 1999.
 9. Seljan, Sanja. Sublanguage in Machine Translation. Proceedings of 23rd International Convention MIRO 2000: Computers in Intelligent Systems CIS + CTS . Str.17-20. Rijeka: Liniavera, 2000.
 10. Allen, James. Natural Language Understanding (Knjižnica Odsjeka za informacijske znanosti)

Obavezan predmet na studijima
 1. Germanistika, sveučilišni diplomski dvopredmetni studij
 2. Informacijske znanosti, sveučilišni preddiplomski jednopredmetni studij, 5. semestar
Izborni predmet na studijima
 1. Informacijske znanosti, sveučilišni preddiplomski dvopredmetni studij, 5. semestar