Naziv
Prepoznavanje obavijesti u tekstu
Organizacijska jedinica
Odsjek za lingvistiku
ECTS
4
Šifra
265522
Semestri
ljetni
Nastavnici
Satnica
Predavanja
30
Seminar
15

Cilj
Uputiti studente u osnove teorijske postavke kodiranja obavijesti u jeziku. Osposobiti studenta za samostalnu izradu sustava za prepoznavanje obavijesti na konkretnoj jezičnoj građi.
Sadržaj
  1. Opis pojma obavijesti, definiranje obavijesti u tekstu, što je naziv.
  2. Prepoznavanje i klasifikacija naziva u kontekstu lingvistike i računalne lingvistike.
  3. Odnos crpljenja obavijesti i pronalaženja obavijesti.
  4. Stupanj strukturiranosti podataka: usporedba baza podataka i slobodnog teksta
  5. Opis sustava za prepoznavanje i klasifikaciju naziva zasnovanih na pravilima.
  6. Opis sustava za prepoznavanje i klasifikaciju naziva zasnovanih na statistici.
  7. Opis hibridnih sustava za prepoznavanje i klasifikaciju naziva.
  8. Mjere evaluacije sustava: preciznost, odziv i f-mjera.
  9. Strategije izrade i osobine pravila sustava za prepoznavanje i klasifikaciju naziva.
  10. Konferencije o razumijevanju poruka.
  11. Individualna izrada pravila sustava za prepoznavanje i klasifikaciju naziva.
  12. Individualna izrada pravila sustava za prepoznavanje i klasifikaciju naziva.

Ishodi učenja
  1. Identificirati temeljne nosioce obavijesti u tekstu prema konvencionalnoj specifikaciji.
  2. Opisati razliku između sustava za prepoznavanje i klasifikaciju naziva zasnovanih na pravilima i sustava zasnovanih na strojnom učenju.
  3. Kritički proširiti dijelove teksta koji mogu biti od osobitog značaja istraživaču ovisno o području koje se istražuje.
  4. Odrediti strategije i usvojiti metodologiju za izradu gramatika za prepoznavanje i klasifikaciju naziva.
  5. Vrjednovati izrađena pravila na samostalno prikupljenom korpusu za evaluaciju.
Metode podučavanja
Predavanja
Seminari i radionice
Samostalni zadaci
Metode ocjenjivanja
Ocjenjuje se seminarski rad, kolokvij i usmeni ispit.

Obavezna literatura
  1. Grishman, Ralph (2003), Information Extraction, Handbook of Computational Linguistics, urednik Ruslan Mitkov
  2. Gross, Maurice (1997), The Construction of Local Grammars, Finite State Devices for Natural Language Processing, (urednici: Roche, E.; Schabes, Y.), MIT Press, Cambridge, MA
  3. Hobbs, Jerry R.; Douglas E. Appelt; John Bear; David Israel; Megumi Kameyama; Mark Stickel; Mabry Tyson (1997), FASTUS: A cascaded finite-state transducer for extracting information from natural language text, Finite State Devices for Natural Language Processing, (urednici: Roche, E.; Schabes, Y.), MIT Press, Cambridge, MA
Dopunska literatura
  1. McDonald, David (1996), Internal and external evidence in the identification and semantic categorization of proper names, Corpus Processing for Lexical Acquisition, poglavlje 2, urednici: Boguraev; Pustejovsky, The MIT Press, Cambridge, MA

Izborni predmet na studijima
Novi i reformirani studiji
  1. Etnologija i kulturna antropologija, sveučilišni prijediplomski dvopredmetni studij, 4. semestar
  2. Filozofija, sveučilišni prijediplomski dvopredmetni studij, 2. semestar
  3. Lingvistika, sveučilišni prijediplomski dvopredmetni studij, 2., 4. semestar
  4. Poljski jezik i književnost, sveučilišni prijediplomski dvopredmetni studij, 4. semestar
  5. Portugalski jezik i književnost, sveučilišni prijediplomski dvopredmetni studij, 2., 4. semestar
  6. Povijest, sveučilišni prijediplomski dvopredmetni studij, 4. semestar
  7. Rumunjski jezik i književnost, sveučilišni prijediplomski dvopredmetni studij, 4. semestar
  8. Sinologija, sveučilišni prijediplomski dvopredmetni studij, 4. semestar