Naziv
Multivarijatna analiza podataka
Organizacijska jedinica
Primijenjena kognitivna znanost
ECTS
5
Šifra
266317
Semestri
ljetni
Satnica
Predavanja
45
Auditorne vježbe
15

Cilj
Multivarijatna analiza podataka čini jedan od osnovnih stupova znanosti o podacima i poopćenje je univarijatnih i bivarijatnih statističkih metoda. Multivarijatna analiza namijenjena je simultanoj analizi i vizualizaciji složenih skupova podataka sa velikim brojem nezavisnih i/ili zavisnih varijabli koje su u različitim stupnjevima međusobne koreliranosti, a njihovi se raznovrsni učinci ne mogu interpretirati zasebno. Sadržaj premeta grupiran je u tri cjeline. Prva cjelina sadrži osnovne pojmove i temeljne tehnike koje prethode samoj multivarijatnoj analizi, druga cjelina je vezana za različite naprednije regresijske tehnike i njihovo razumijevanje (s osvrtom na visokodimenzionalne podatke), a treća za tehnike temeljene na matričnim dekompozicijama (rastav na svojstvene vrijednosti i rastav na singularne vrijednosti). Cilj ovog predmeta je dati studentima pregled multivarijatnih metoda, omogućiti razumijevanje teorijskih osnova, razumijevanje mogućnosti primjene tih metoda, njihovih pretpostavki i ograničenja.
Sadržaj
  1. Cilj multivarijatne statističke analize. Podaci, objekti, varijable i skale (Stevensova klasifikacija). Klasificiranje multivarijantnih tehnika, Sažimanje, opisivanje i grafički prikaz multivarijatnih podataka.
  2. Manipuliranje podacima prije multivarijantne analize (izgubljeni podaci, outlier detekcija, transformacija podataka, standardizacija, normalnost, linearnost, homoscesivnost, homoegenost), Podaci koji su prikladni za multivarijatnu analizu: podaci, korelacija, varijantna kovarijanca, suma kvadrata i unakrsnih proizvoda matrica, ostatak, udaljenosti (statistička i Mehalanobis).
  3. Geometrija uzorka i slučajno uzorkovanje.
  4. Primijenjena korelacijska i regresijska analiza, interpretacija i odnos prema analizi varijance (ANOVA).
  5. Diskriminantna analiza.
  6. Logistička regresija.
  7. Analiza glavnih komponenata.
  8. Međuispit.
  9. Eksploratorna faktorska analiza.
  10. Analiza grupiranja.
  11. Multidimenzionalno skaliranje.
  12. Analiza korespodencije.
  13. Analiza preživljenja.
  14. Lasso metoda za visoko-dimenzionalne podatke (Lasso za linearne modele. generalizirani linearni modeli i Lasso, grupni Lasso).
  15. Završni ispit.

Ishodi učenja
  1. Definirati glavne pojmove u multivarijantnoj analizi podataka
  2. Objasniti matematičke pozadine glavnih procedura u multivarijantnoj statistici
  3. Primijeniti linearnu višestruku regresijsku analizu
  4. Razlikovati analizu glavnih komponenti i faktorsku analizu
  5. Objasniti prikladnost različitih metoda multivarijantne statistike za različite probleme
  6. Objasniti rezultate multivarijantne analize podataka i objasniti njihovo praktično značenje
Metode podučavanja
Predavanja, Vježbe
Metode ocjenjivanja
Pohađanje nastave, Kolokvij, Pismeni ispit

Obavezna literatura
  1. 1. Johnson, R. A., and D. W. Wichern, Applied Multivariate Statistical Analysis, 5th Edition, Prentice Hall (2002)
  2. 2. B.G. Tabachnick, L.S. Fidell, Using multivariate statistics, 6th Edition, Pearson (2018)
Dopunska literatura

Izborni predmet na studijima
Novi i reformirani studiji
  1. Primijenjena kognitivna znanost, sveučilišni diplomski jednopredmetni studij, 2., 4. semestar