Digitalni resursi i prijevodne memorije

Naziv
Digitalni resursi i prijevodne memorije
Organizacijska jedinica
Odsjek za informacijske i komunikacijske znanosti
ECTS bodovi
5
Šifra
170356
Semestri izvođenja
zimski
Jezik izvođenja
Hrvatski
Nastavnici
Satnica
Predavanja
15
Seminar
15
Vježbe u praktikumu
15

Cilj
Cilj kolegija jest upoznati studente s alatima i resursima potrebnima za izgradnju sustava za prijenos informacija između dva jezika i u postupcima lokalizacije softvera, dokumentacije i aplikacija. Koristit će se integrirani sustavi za strojno prevođenje, prijevodne memorije i drugi dodatni resursi. Studenti će se upoznati s ulogom, načinom izrade i integracijom prijevodnih memorija, mogućnostima rada i istraživanja te mogućnostima integracije s drugim alatima i izvorima. Stečeno znanje praktično će primijeniti upotrebom različitog softvera i provesti evaluaciju.
Sadržaj
  1. Uvodno predavanje, sadržaj kolegija, obaveze, način polaganja ispita
  2. Prijevodne memorije – uloga, primjena, alati
  3. Ograničenja, prednosti i nedostaci, formati za razmjenu podataka
  4. Segmentacija, sravnjivanje i izgradnja prijevodnih memorija.
  5. Rad s prijevodnom memorijom, ažuriranje. Dijeljenje podataka.
  6. Digitalni resursi u EU. Analiza i primjena resursa.
  7. Ekstrakcija terminologije iz korpusa. Analiza i evaluacija.
  8. Integracija prijevodnih memorija, terminologije i strojnog prevođenja
  9. Prikaz drugih resursa na internetu. Integracija s alatima za strojno prevođenje i drugim resursima na internetu
  10. Upravljanje projektom u postupku izgradnje višejezičnog sustava
  11. Primjena softvera za upravljanje projektom
  12. Lokalizacija – definicije, primjena, razlozi
  13. Primjena i analiza alata za lokalizaciju aplikacija
  14. Evaluacija prijevodnih memorija i integriranih sustava
  15. Primjena integriranih sustava u poslovanju. Završno predavanje

Ishodi učenja
  1. - primjena tehnologije i resursa u pripremi, izradi i integraciji prijevodnih memorija
  2. - identifikacija resursa, rukovanje alatima za segmentaciju i sravnjivanje teksta
  3. - uočavanje različitosti u XML zapisima prijevodnih memorija kroz različite alate i ispitivanje interoperabilnosti među sustavima za upravljanje prijevodnim memorijama i integraciji s drugim resursima
  4. - primjena i rukovanje alatima za ekstrakciju i integraciju terminologije na vlastitom prikupljenom paralelnom korpusu
  5. - primjena procesa lokalizacije aplikacija uz korištenje integriranih digitalnih resursa
  6. - analiza postupka upravljanja projektom
  7. - evaluacija sustava
  8. - povezivanje znanja iz područja upravljanja projektima, pripreme i obrade digitalnog sadržaja u procesu pripreme dokumentacije i pronalaženja informacija
  9. - primjena istraživačkih i prezentacijskih vještina
Metode podučavanja
predavanja, vježbe, seminari
Metode ocjenjivanja

Obavezna literatura
  1. 4. Seljan, S.; Gašpar, A.; Pavuna, D. Sentence Alignment as the Basis For Translation Memory Database. Zagreb: Odsjek za informacijske znanosti, Filozofski fakultet, 2007
  2. 3. Seljan, S.; Tadić, M.; Agić, Ž.; Šnajder, J.; Dalbelo Bašić, B.; Osmann; V. Corpus Aligner (CorAl) Evaluation on English-Croatian Parallel Corpora. (LREC’10),2010, Malta.
  3. 1. Seljan, S.; Pavuna, D. Translation Memory Database in the Translation Process // Information and Intelligent Systems IIS 2006. Varaždin : FOI, 2006. 327-332.
  4. 2. Cruz-Lara, S.; Bellalem, N.; Ducret, J.; Kramer, I. Interoperability between translation memories and localization tools by using the MultiLingual Information Framework, EAMT 2006.
  5. The DGT Multilingual Translation Memory of the Acquis Communautaire: DGT-TM
  6. 6. Lenker, M., Anastasiou, D., Buckley J. Workflow Specification for Enterprise Localisation. Localisation Focus, Vol.9, Issue 1, 2011, 26-35, ISSN 1649-2358
  7. 7. Kanavos, P.; Kartsaklis, D. Integrating machine translation with translation memory: A practical approach. JEC 2010, 11-20
  8. 8. Seljan, S.; Stančić, H.; Dunđer, I. Extracting Terminology by Language Independent Methods. Peter Lang GmbH, 2017. 141-147
  9. 9. Format standards: http://www.opentag.com/tmx.htm, https://www.gala-global.org/resources/industry-standards
Dopunska literatura
  1. Anastasiou, D. The Impact of Localisation on Semantic Web Standards. European Journal of ePractice. N. 12, 2011, 42-52.
  2. 2. Seljan, S.; Agić, Ž.; Tadić, M. Evaluating Sentence Alignment on Croatian-English Parallel Corpora // Proceedings of the 6th International Conference on Formal Approaches to South Slavic and Balkan Languages. Zagreb : Croatian Language Technologies Society, 2008. 101-108
  3. 3. Lenker, M., Anastasiou, D., Buckley J. Workflow Specification for Enterprise Localisation. Localisation Focus, Vol.9, Issue 1, 2011, 26-35
  4. 4. Seljan, S.; Dunđer, I. Combined Automatic Speech Recognition and Machine Translation in Business Correspondence Domain for English-Croatian. World Academy of Science, Engineering and Technoloy (WASET), Journal of Computer, Information, Systems and Control Engineering. Vol. 8, 2014
  5. 5. Seljan, S.; Dalbelo Bašić, B.; Šnajder, J.; Delač, D.; Šamec-Gjurin, M.; Crnec, D.Comparative Analysis of Automatic Term and Collocation Extraction. INFuture 2009, 219-228
  6. Francie Gow. Metrics for Evaluating Translation Memory Software, 2003
  7. 7. Callison-Burch; C. Bannard; J. Schroeder. A Compact Data Structure for Searchable Translation Memories. EAMT, 2005. 59–65

Obavezan predmet na studijima
  1. Informacijske znanosti, sveučilišni diplomski jednopredmetni studij
Izborni predmet na studijima
  1. Informacijske znanosti, sveučilišni diplomski dvopredmetni studij
  2. Informacijske znanosti, sveučilišni diplomski jednopredmetni studij
  3. Švedski jezik i kultura, sveučilišni diplomski dvopredmetni studij