Naziv
Digitalni resursi i prijevodne memorije
Organizacijska jedinica
Odsjek za informacijske i komunikacijske znanosti
ECTS
5
Šifra
170356
Semestri
zimski
Nastavnici
Satnica
Predavanja
15
Seminar
15
Vježbe u praktikumu
15

Cilj
Cilj kolegija jest upoznati studente s alatima i resursima potrebnima za izgradnju sustava računalno potpomognuto prevođenje (eng. Computer-Assisted Translation - CAT). CAT sustavi promatraju se kroz primjenu tehnologije u svrhu prijenosa informacija između dva jezika, u postupcima lokalizacije softvera, dokumentacije i aplikacija. Unutar CAT sustava provest će se integracija različitih vrsta resursa i tehnologija: prijevodnih memorija, terminoloških baza, sustava za automatsko za strojno prevođenje i dr. Provest će se samostalna izgradnja sustava, zatim evaluacija te analiza mogućnosti primjene, ograničenja i integracije s tehnologijama i resursima. Stečeno znanje praktično će primijeniti upotrebom različitog softvera.
Sadržaj
  1. Uvodno predavanje, sadržaj kolegija, obaveze, način polaganja ispita
  2. Prijevodne memorije (eng. translation memories) – uloga, primjena, alati, formati.
  3. Ograničenja, prednosti i nedostaci prijevodnih memorija. Prikaz alata za izgranju prijevodnih memorija. Prikaz funkcionalnosti. Potpuna i nepotpuna podudarnost.
  4. Segmentacija, sravnjivanje (eng. alignment) i izgradnja prijevodnih memorija. Primjena postojećih izvora u postupku sravnjivanja i izgradnje prijevodnih memorija, integracija više memorija, dijeljenje resursa. Naknadno uređivanje (post-editing).
  5. Samostalan rad alatom za izgradnju prijevodnim memorija.
  6. Digitalni resursi u EU; DGT-TM. Analiza i primjena EU prijevodnih memorija. Prijevodne memorije na n jezika. Ekstrakcija resursa.
  7. Prikupljanje paralelnih korpusa. Online rječnici, glosari. Ekstrakcija terminologije iz korpusa. Analiza i evaluacija.
  8. Integracija prijevodnih memorija, terminologije i alata za automatsko strojno prevođenje. Odabir i primjena odabranog CAT alata.
  9. Usluge u oblaku (eng. cloud computing). Vrste oblaka i vrste usluga. Analiza podataka u CAT sustavu.
  10. Lokalizacija – definicije, primjena, razlozi. Primjena alata za lokalizaciju.
  11. Evaluacija prijevodnih memorija i integriranih CAT sustava. Fuzzy-match logika. AV tehnologija.
  12. Upravljanje projektom. Upravljanje kvalitetom (Total quality management - TQM). Podaci u poslovnoj inteligenciji (eng. business intelligence).
  13. Projektni zadatak: prikupljanje resursa za izgradnja CAT sustava.
  14. Projektni zadatak: izgradnja CAT sustava, poboljšanje sustava, evaluacija.
  15. Projektni zadatak: izlaganje i prikaz rada CAT sustava.

Ishodi učenja
  1. primjena različitih tehnologija za računalno-potpomognuto prevođenje (eng. Computer-Assisted Translation)
  2. identifikacija resursa, prikupljanje i priprema paralelnih korpusa, sravnjivanje (eng. alignment) i izgradnja prijevodnih memorija (eng. translation memories)
  3. primjena CAT tehnologije kroz različite alate i resurse, ispitivanje interoperabilnosti među sustavima
  4. primjena procesa lokalizacije uz korištenje integriranih digitalnih resursa
  5. analiza procesa upravljanja projektom, cjelokupno upravljanje kvalitetom (eng. Total Quality Management - TQM)
  6. samostalna izgradnja CAT sustava i integracija različitih vrsta resura, evaluacija i kritička procjena mogućnosti i ograničenja
  7. evaluacija CAT sustava
  8. samostalna izgradnja CAT sustava, evaluacija i kritička procjena mogućnosti i ograničenja
  9. - primjena istraživačkih i prezentacijskih vještina
  10. Analizirati i rješavati informatičke potrebe korisnika
  11. Predlagati koncepte, mogućnosti i razviti baze podataka i sustave za pretraživanje informacija u informacijskom sustavu
  12. Upravljati složenim informacijskim sustavima
  13. Koristiti, primjenjivati i prenositi znanja iz upravljanja složenim informacijskim sustavima
  14. Sintetizirati, integrirati i predlagati primjenu informatičkih, informacijskih i logičkih modela u procesu jezičnog inženjeringa, računalne obrade jezika, leksikografije i strojnog i strojno potpomognutog prevođenja te prenosi u nastavni proces
  15. Sintetizirati, integrirati i predlagati primjenu informatičkih, informacijskih i logičkih modela u procesu jezičnog inženjeringa, računalne obrade jezika, leksikografije i strojnog i strojno potpomognutog prevođenja
  16. Koristiti prevoditeljska pomagala kao npr. rječnike, terminološke baze, paralelne tekstove
  17. Koristiti prevoditeljske alate kao npr. različite programe za prevođenje i prijevodne memorije
Metode podučavanja
Predavanja, samostalne vježbe, projektni zadatak kroz timski rad.
Metode ocjenjivanja
Konačnu ocjena čini ukupnost bodova stečenih kroz ispunjene samostalne zadatke, projektni zadatak (istraživanje, prezentacija, izlaganje) i pismeni ispit.

Obavezna literatura
  1. Seljan, S.; Gašpar, A.; Pavuna, D. Sentence Alignment as the Basis For Translation Memory Database. Zagreb: Odsjek za informacijske znanosti, Filozofski fakultet, 2007
  2. Seljan, S.; Tadić, M.; Agić, Ž.; Šnajder, J.; Dalbelo Bašić, B.; Osmann; V. Corpus Aligner (CorAl) Evaluation on English-Croatian Parallel Corpora. (LREC’10),2010, Malta.
  3. Seljan, S.; Pavuna, D. Translation Memory Database in the Translation Process // Information and Intelligent Systems IIS 2006. Varaždin : FOI, 2006. 327-332.
  4. Seljan, S.; Škof Erdelja, N.; Kučiš, V.; Dunđer, I.; Pejić Bach, M. Quality assurance in computer-assisted translation in business environment // Natural Language Processing for Global and Local Business / Pinarbași, Fatih ; Nurdan Oncel Taskiran, M. (ur.). Hershey, PA: IGI Global, 2021. str. 247-270 doi:10.4018/978-1-7998-4240-8
  5. The DGT Multilingual Translation Memory of the Acquis Communautaire: DGT-TM
  6. Lenker, M., Anastasiou, D., Buckley J. Workflow Specification for Enterprise Localisation. Localisation Focus, Vol.9, Issue 1, 2011, 26-35, ISSN 1649-2358
  7. Kanavos, P.; Kartsaklis, D. Integrating machine translation with translation memory: A practical approach. JEC 2010, 11-20
  8. Seljan, S.; Stančić, H.; Dunđer, I. Extracting Terminology by Language Independent Methods. Peter Lang GmbH, 2017. 141-147
  9. Format standards: http://www.opentag.com/tmx.htm, https://www.gala-global.org/resources/industry-standards
Dopunska literatura
  1. Anastasiou, D. The Impact of Localisation on Semantic Web Standards. European Journal of ePractice. N. 12, 2011, 42-52.
  2. Seljan, S.; Agić, Ž.; Tadić, M. Evaluating Sentence Alignment on Croatian-English Parallel Corpora // Proceedings of the 6th International Conference on Formal Approaches to South Slavic and Balkan Languages. Zagreb : Croatian Language Technologies Society, 2008. 101-108
  3. Lenker, M., Anastasiou, D., Buckley J. Workflow Specification for Enterprise Localisation. Localisation Focus, Vol.9, Issue 1, 2011, 26-35
  4. Seljan, S.; Dunđer, I. Combined Automatic Speech Recognition and Machine Translation in Business Correspondence Domain for English-Croatian. World Academy of Science, Engineering and Technoloy (WASET), Journal of Computer, Information, Systems and Control Engineering. Vol. 8, 2014
  5. Seljan, S.; Dalbelo Bašić, B.; Šnajder, J.; Delač, D.; Šamec-Gjurin, M.; Crnec, D.Comparative Analysis of Automatic Term and Collocation Extraction. INFuture 2009, 219-228
  6. Francie Gow. Metrics for Evaluating Translation Memory Software, 2003
  7. Callison-Burch; C. Bannard; J. Schroeder. A Compact Data Structure for Searchable Translation Memories. EAMT, 2005. 59–65
  8. Cruz-Lara, S.; Bellalem, N.; Ducret, J.; Kramer, I. Interoperability between translation memories and localization tools by using the MultiLingual Information Framework, EAMT 2006.

Obavezan predmet na studijima
  1. Informacijske znanosti, sveučilišni diplomski jednopredmetni studij
  2. Germanistika, sveučilišni diplomski dvopredmetni studij
Izborni predmet na studijima
  1. Informacijske znanosti, sveučilišni diplomski jednopredmetni studij
  2. Informacijske znanosti, sveučilišni diplomski dvopredmetni studij
Fakultetska ponuda
  • Diplomski studij: Zimski semestar