Studente se uvodi u područje korpusne lingvistike, upoznaje s ulogom korpusa u današnjim istraživanjima jezika/teksta, posebno u kontekstu neofiloloških istraživanja, te daje praktično znanje pretraživanja korpusa.
Studente se uvodi u područje korpusne lingvistike, upoznaje s ulogom korpusa u današnjim istraživanjima jezika/teksta, posebno u kontekstu neofiloloških istraživanja, te daje praktično znanje pretraživanja korpusa.
1. Studenti će usvojiti definiciju korpusa kako ga vidi suvremena korpusna lingvistika. 2. Studenti će moći objasniti razliku između zbirke tekstova, korpusa i računalnog korpusa. 3. Studenti će moći opisati različite vrste korpusa. 4. Studenti će moći objasniti i uočiti važnost primjene korpusa i korpusnolingvističkih metoda u neofilološkim istraživanjima.
1. Povijest korpusnih istraživanja u svijetu i u nas 2. Uloga korpusa u istraživanju jezika 3. Definicija korpusa 4. Računalno podržan korpus 5. Korpusni parametri 6. Postupci u sastavljanju korpusa: uzorkovanje, reprezentativnost 7. Vrste podataka pretraživih iz korpusa: abecedariji, čestotnici, konkordancije 8. Postupci obradbe korpusa: nelingvističko obilježavanje i standardi digitalnoga zapisa 9. Postupci obradbe korpusa: lingvističko obilježavanje (segmentacija i označavanje) 10. Postupci obradbe korpusa: lingvističko obilježavanje (označavanje vrsta riječi, lematizacija, MSD-označavanje) 11. Postupci obradbe korpusa: lingvističko obilježavanje (označavanje sintaktičkih uloga – banke stabala; označavanje značenja riječi i semantičkih uloga) 12. Postupci obradbe korpusa: statističke metode 13. Praktičan rad na pretrazi korpusa: Hrvatski nacionalni korpus i drugi (nacionalni) korpusi 14. Praktičan rad na pretrazi korpusa: Sketch Engine / No Sketch Engine / CQL i regularni izrazi 15. Praktičan rad na pretrazi korpusa: korpusi u neofilološkim istraživanjima
1. Biber, D. (1998) Corpus Linguistics: Investigate Language Structure and Use, CUP, Cambridge.
2. Kennedy, G. (1998) Introduction to Corpus Linguistics, Longman, London.
3. McEnery, T. & Wilson A. (2001) Corpus linguistics, Edinburgh Univ. Press, Edinburgh.
4. Tadić, M. (1997) Računalna obradba hrvatskih korpusa: povijest, stanje i perspektive, Suvremena lingvistika 43-44, 387-394.
5. Tadić, M. (2003) Jezične tehnologije. Ex Libris, Zagreb.
6. Tognini-Bonelli, E. (2001) Corpus Linguistics at Work, Benjamins, Amsterdam.
7. Tadić, M. (1991) Od korpusa do čestotnoga rječnika hrvatskoga književnog jezika, Radovi Zavoda za slavensku filologiju, 27, 169-78.
8. Tadić, M. (1996) Računalna obradba hrvatskoga i nacionalni korpus, Suvremena lingvistika 41-42, 603-611.
9. Tadić, M. (1998) Raspon, opseg i sastav korpusa hrvatskoga jezika, Filologija 30-31, 337-347.
10. Tadić, M. (2009) New version of the Croatian National Corpus, u: Hlaváčková, D. ; Horák, A.; Osolsobě, K.; Rychlý, P. (ur.) After Half a Century of Slavonic Natural Language Processing, Masaryk University, Brno, str. 199-205
Pohađanje nastave, pisani ispit, praktični zadatak