Naziv
Računalna obrada povijesnih tekstova
Organizacijska jedinica
Odsjek za informacijske i komunikacijske znanosti
ECTS bodovi
3
Šifra
161136
Semestri izvođenja
ljetni
Jezik izvođenja
hrvatski
Nastavnici
Satnica
Seminar
30

Cilj
Osnovni pojmovi računalne obrade tekstualnih i jezičnih podataka. Relacijski model podataka i jezici za označavanje. Vrste jezičnih baza podataka: korpusi – pojavnice, različnice, leme – lematizacija. Jezični alati. Načela strojne obrade i analize digitalizirane povijesne građe Analiza i segmentacija digitaliziranih tekstova s jezičnim sadržajem. Statistička analiza teksta. Mogućnosti rječničke, jezične, gramatičke, terminološke, usporedne i temporalne analize. Mogućnosti primjene u drugim područjima. / Studenti će upoznati mogućnosti automatske statističke i jezične obrade teksta te njihove primjene u znanstvenim i stručnim povijesnim istraživanjima. / Ispit: Izrada seminarskog rada u kojem će se pomoću dostupnih alata načiniti analiza odabranih konkretnih povijesnih tekstova.
Sadržaj
  1. Uvodno predavanje.
  2. Uvod u obradu prirodnog jezika.
  3. Definiranje povijesnog jezika i povijesnog teksta.
  4. Značajke suvremenih i povijesnih jezika u kontekstu obrade prirodnog jezika.
  5. Definiranje i analiza povijesnog teksta kao materijala za seminarski rad.
  6. Definiranje i analiza povijesnog teksta kao materijala za seminarski rad.
  7. Definiranje teme seminarskog rada.
  8. Definiranje teme seminarskog rada.
  9. Analiza problematike računalne obrade povijesnih tekstova na primjeru seminarskog rada.
  10. Analiza problematike računalne obrade povijesnih tekstova na primjeru seminarskog rada.
  11. Analiza problematike računalne obrade povijesnih tekstova na primjeru seminarskog rada.
  12. Izlaganje seminarskih radova.
  13. Izlaganje seminarskih radova.

Ishodi učenja
  1. Objasniti značajke suvremenih i povijesnih jezika u kontekstu obrade prirodnog jezika.
  2. Definirati pojmove iz područja računalne povijesne leksikografije.
  3. Objasniti osnovne probleme računalne obrade povijesnih tekstova.
Metode podučavanja
Predavanje "ex cathedra". Seminarsko istraživanje. Izlaganje seminarskih radova. E-učenje.
Metode ocjenjivanja
Seminarski rad. Izlaganje seminarskog rada.

Obavezna literatura
  1. Piotrowski, Michael. "Natural language processing for historical texts." Synthesis Lectures on Human Language Technologies 5.2 (2012): 1-157.
  2. Bibliografska i rječnička baza znanstveno-istraživačkog projekta "Hrvatska rječnička baština i prikaz rječničkoga znanja", Odsjek za informacijske znanosti Filozofskog fakulteta u Zagrebu, Zagreb, 2004 (računalno dostupna)
Dopunska literatura
  1. Tadić, Marko. Jezične tehnologije i hrvatski jezik. Zagreb: Ex libris, 2003.

Izborni predmet na studijima
  1. Pedagogija, sveučilišni diplomski jednopredmetni studij, 2. semestar
  2. Povijest, sveučilišni diplomski dvopredmetni studij
Fakultetska ponuda
  • Diplomski studij: Ljetni semestar