Govorna tehnologija

Naziv
Govorna tehnologija
Organizacijska jedinica
Odsjek za fonetiku
ECTS bodovi
4
Šifra
35851
Semestri izvođenja
zimski, ljetni
Jezik izvođenja
Hrvatski
Satnica
Predavanja
15
Seminar
15
Laboratorijske vježbe
30

Cilj
Cilj kolegija je osposobiti studenta za samostalan stručni rad i istraživanje govornoga i uopće zvuka služeći se raspoloživom računalskom tehnologijom. Poseban naglasak na uporabi računala u analizi, obradi i sintezi zvuka.
Sadržaj
 1. P: Uvodno o kolegiju. Analogni i digitalni zapis zvuka. S: Povijest snimanja zvuka, podjela na analogne i digitalno zapisane oblike. V: Upoznavanje s opremom. Osnove rada s računalom. Upoznavanje s programom Praat.
 2. P: Zvuk. Prijenos zvuka kroz medij. S: Refleksija. Ogib. V: Generiranje zvuka na računalu. Stvaranje čistih frekvencija. Snimanje i reprodukcija zvuka na računalu (mikrofoni i zvučnici).
 3. P: Rezonantne frekvencije. F0. S: Nyquistova frekvencija, izjednačavanje različitih frekvencija nakon uzorkovanja. V: Obrada zvuka. Označavanje segmenata zvuka. F0. Intenzitet.
 4. P: Spektrogrami. FFT. S: Studio za snimanje na Odsjeku za fonetiku. V: Spektrogrami na kompjuteru. Oblikovanje prozora za FFT. Spektar zvuka. LTAS.
 5. P: Filtri. Analogni filtri. Digitalni filtri. S: Formanti. LPC. V: Priprema analiziranog materijala za prezentaciju. Iscrtavanje spektrograma, F0 i ostalog matrijala na računalu.
 6. P: Mehaničko snimanje zvuka na gramofonske ploče. S: Brzine vrtnje ploča i utjecaj na zvuk. Stereo. V: Snimanje s gramofona na računalo.
 7. P: Snimanje na magnetske medije.Trake, kazete, DAT. S: Razlike u magnetskom mediju. V: Analiza zvuka snimljenog na računalo.
 8. P: Snimanje na optičke medije. CD. Struktura zapisa. S: CD-text i ostale ekstenzije standarda zapisa. V: Prebacivanje zvuka sa CD-a na računalo. Analogno i digitalno.
 9. P: Minidisk. Osnovni pojmovi psihoakustike za Minidisk. S: ATRAC i struktura zapisa. V: Oblikovanje F0 i trajanja u Praat-u. PSOLA.
 10. P: MP3. S: Ostali oblici zapisa zvuka bazirani na psihoakustici. V: Pretvorba mp3 i ostalih formata u zapis pogodan za analizu u Praat-u.
 11. P: DVD. S: Formati zapisa zvuka na DVD-u. V: Izvlačenje zvuka sa DVD-a.
 12. P: Artikulacijska sinteza. S: Metode i istraživanja u svijetu na temu artikulacijske sinteze. V: Primjeri artikulacijske sinteze u Praatu. Skriptovi u Praatu.
 13. P: Formantna sinteza govora S: Karakteristike vokala i parametri potrebni za sintezu. V: Sinteza Klattovim sintetizatorom.
 14. P: Korpusna sinteza govora. Difonska sinteza govora. MBROLA. S: Repertoar baze za difonsku sintezu. SAMPA. V: Difonska sinteza pomoću sustava Mbrola.
 15. P: Neuronske mreže. S: Neuronske mreže u analizi zvuka. V: Primjena neuronskih mreža.

Ishodi učenja
 1. samostalno napraviti računalno snimanje, prikazivanje i analiziranje govornoga zvuka te osnovnu sintezu govora
 2. primijeniti računalne programe u analizi govornoga zvuka i sintezi govoru sličnoga zvuka
 3. razlikovati analogne i digitalne zapise zvuka na različitim medijima, te znati snimiti na računalo
 4. razlikovati tipove sinteze govora i objasniti razlike
 5. segmentirati zvuk na računalu, te po potrebi modificirati
Metode podučavanja
Metode ocjenjivanja
Ispit se izvodi u dva dijela. Praktični dio na računalu i usmeni dio.

Obavezna literatura
 1. Morse, Phillip M. Vibration and sound / Phillip M. Morse, 2nd ed. New York: McGraw-Hill Book Company, 1948.
 2. Horga, Damir. Obrada fonetskih obavijesti. Zagreb : Hrvatsko filološko društvo, 1996.
 3. Robinson, Tony. Speech Analysis. 1998 http://svr-www.eng.cam.ac.uk/~ajr/SA95/SpeechAnalysis.html (2.5.2005)
 4. Internet stranice s građom koja se odnosi na snimanje, analizu i manipulaciju zvuka
Dopunska literatura

Obavezan predmet na studijima
 1. Fonetika, sveučilišni preddiplomski dvopredmetni studij, 2. semestar