Govorna tehnologija

Naziv
Govorna tehnologija
Organizacijska jedinica
Odsjek za fonetiku
ECTS bodovi
4
Šifra
35851
Semestri izvođenja
zimski, ljetni
Jezik izvođenja
Hrvatski
Satnica
Predavanja
15
Seminar
15
Laboratorijske vježbe
30

Cilj
Cilj kolegija je osposobiti studenta za samostalan stručni rad i istraživanje govornoga i uopće zvuka služeći se raspoloživom računalskom tehnologijom. Poseban naglasak na uporabi računala u analizi, obradi i sintezi zvuka.
Sadržaj
  1. P: Uvodno o kolegiju. Analogni i digitalni zapis zvuka. S: Povijest snimanja zvuka, podjela na analogne i digitalno zapisane oblike. V: Upoznavanje s opremom. Osnove rada s računalom. Upoznavanje s programom Praat.
  2. P: Zvuk. Prijenos zvuka kroz medij. S: Refleksija. Ogib. V: Generiranje zvuka na računalu. Stvaranje čistih frekvencija. Snimanje i reprodukcija zvuka na računalu (mikrofoni i zvučnici).
  3. P: Rezonantne frekvencije. F0. S: Nyquistova frekvencija, izjednačavanje različitih frekvencija nakon uzorkovanja. V: Obrada zvuka. Označavanje segmenata zvuka. F0. Intenzitet.
  4. P: Spektrogrami. FFT. S: Studio za snimanje na Odsjeku za fonetiku. V: Spektrogrami na kompjuteru. Oblikovanje prozora za FFT. Spektar zvuka. LTAS.
  5. P: Filtri. Analogni filtri. Digitalni filtri. S: Formanti. LPC. V: Priprema analiziranog materijala za prezentaciju. Iscrtavanje spektrograma, F0 i ostalog matrijala na računalu.
  6. P: Mehaničko snimanje zvuka na gramofonske ploče. S: Brzine vrtnje ploča i utjecaj na zvuk. Stereo. V: Snimanje s gramofona na računalo.
  7. P: Snimanje na magnetske medije.Trake, kazete, DAT. S: Razlike u magnetskom mediju. V: Analiza zvuka snimljenog na računalo.
  8. P: Snimanje na optičke medije. CD. Struktura zapisa. S: CD-text i ostale ekstenzije standarda zapisa. V: Prebacivanje zvuka sa CD-a na računalo. Analogno i digitalno.
  9. P: Minidisk. Osnovni pojmovi psihoakustike za Minidisk. S: ATRAC i struktura zapisa. V: Oblikovanje F0 i trajanja u Praat-u. PSOLA.
  10. P: MP3. S: Ostali oblici zapisa zvuka bazirani na psihoakustici. V: Pretvorba mp3 i ostalih formata u zapis pogodan za analizu u Praat-u.
  11. P: DVD. S: Formati zapisa zvuka na DVD-u. V: Izvlačenje zvuka sa DVD-a.
  12. P: Artikulacijska sinteza. S: Metode i istraživanja u svijetu na temu artikulacijske sinteze. V: Primjeri artikulacijske sinteze u Praatu. Skriptovi u Praatu.
  13. P: Formantna sinteza govora S: Karakteristike vokala i parametri potrebni za sintezu. V: Sinteza Klattovim sintetizatorom.
  14. P: Korpusna sinteza govora. Difonska sinteza govora. MBROLA. S: Repertoar baze za difonsku sintezu. SAMPA. V: Difonska sinteza pomoću sustava Mbrola.
  15. P: Neuronske mreže. S: Neuronske mreže u analizi zvuka. V: Primjena neuronskih mreža.

Ishodi učenja
  1. samostalno napraviti računalno snimanje, prikazivanje i analiziranje govornoga zvuka te osnovnu sintezu govora
  2. primijeniti računalne programe u analizi govornoga zvuka i sintezi govoru sličnoga zvuka
  3. razlikovati analogne i digitalne zapise zvuka na različitim medijima, te znati snimiti na računalo
  4. razlikovati tipove sinteze govora i objasniti razlike
  5. segmentirati zvuk na računalu, te po potrebi modificirati
Metode podučavanja
Metode ocjenjivanja
Ispit se izvodi u dva dijela. Praktični dio na računalu i usmeni dio.

Obavezna literatura
  1. Morse, Phillip M. Vibration and sound / Phillip M. Morse, 2nd ed. New York: McGraw-Hill Book Company, 1948.
  2. Horga, Damir. Obrada fonetskih obavijesti. Zagreb : Hrvatsko filološko društvo, 1996.
  3. Robinson, Tony. Speech Analysis. 1998 http://svr-www.eng.cam.ac.uk/~ajr/SA95/SpeechAnalysis.html (2.5.2005)
  4. Internet stranice s građom koja se odnosi na snimanje, analizu i manipulaciju zvuka
Dopunska literatura

Obavezan predmet na studijima
  1. Fonetika, sveučilišni preddiplomski dvopredmetni studij, 2. semestar