Naziv
Veliki podatci
Organizacijska jedinica
Odsjek za informacijske i komunikacijske znanosti
ECTS
4
Šifra
198915
Semestri
zimski
Satnica
Predavanja
15
Seminar
30

Cilj
Cilj ovog kolegija je pružiti studentima sveobuhvatno razumijevanje povijesti i razvoja velikih podataka, uključujući datafikaciju i metode prikupljanja podataka. Studenti će naučiti prepoznati i analizirati različite izvore velikih podataka, kao što su strojevi, ljudi i institucije, te će se upoznati s tehnikama upravljanja velikim količinama podataka, uključujući spajanje različitih skupova podataka i rješavanje problema podatkovnih “grobnica” i ispušnih plinova. Kolegij će obuhvatiti analizu osnovnih i dodatnih karakteristika velikih podataka te procjenu njihove vrijednosti u različitim kontekstima. Studenti će se upoznati s ulogom podatkovne znanosti i podatkovnih znanstvenika, razvijati strategije za učinkovito upravljanje i korištenje velikih podataka, te ovladati procesima analize, rudarenja podataka i prediktivne analitike. Posebna pažnja bit će posvećena etičkim pitanjima i izazovima zaštite podataka u eri velikih podataka, kao i konceptu “dark data”. Na kraju, studenti će na teoretskoj razini steći osnovna znanja o sustavima velikih podataka i osnovama programiranja potrebnim za rad s velikim podacima.
Sadržaj
  1. Kako smo došli do ere velikih podataka
  2. Gdje se sve koriste veliki podatci
  3. Izvori velikih podataka: strojno proizvedeni podatci
  4. Izvori velikih podataka: podatci koje proizvodi čovjek
  5. Izvori velikih podataka: institucijski proizvedeni podatci
  6. Svojstva velikih podataka: količina
  7. Svojstva velikih podataka: varijabilnost i brzina
  8. Svojstva velikih podataka: različitost i valencija
  9. Podatkovna znanost
  10. Proces analize velikih podataka: 5 koraka
  11. Programski modeli za velike podatke (DFS i skalarno računalstvo)
  12. Hadoop, YARN i MapReduce
  13. Rudarenje podataka i prediktivna analitika
  14. Prikupljanje podataka i zakoni
  15. Algoritmi i etika

Ishodi učenja
  1. Identificirati izvore velikih podataka
  2. Primijeniti algoritme grupiranja, klasificiranja i predlaganja
  3. Definirati karakteristike velikih podataka
  4. Primijeniti 5 koraka analize podataka na zadanom problemu
  5. Instalirati virtualnu mašinu i pokrenuti pripremljeni MapReduce program
Metode podučavanja
1. izravno poučavanje
2. samostalno učenje
3. poučavanje vođenim otkrivanjem i raspravom
4. ERR okvir za poučavanje
Metode ocjenjivanja
1. kratki testovi znanja
2. projektni zadatci
3. sudjelovanje na nastavi

Obavezna literatura
  1. Jules J. Berman: Principles of big data: preparing, sharing, and analyzing complex information, 2013.
  2. Jared Dean: Big data, data mining and machine learning: value creation for business leaders and practicioners, 2014.
  3. Kristina Kocijan: Big data: kako smo došli do velikih podataka i kamo nas oni vode, 2014
  4. Davis Kord, Doug Patterson: Ethics of big data, 2012.
Dopunska literatura
  1. John W. Foreman: Data Smart: using data science to transform information into insight, 2014
  2. Guy Harrison: Next generation databases: NoSQL, NewSQL, and Big Data, 2015
  3. Rob Kitchin: The Data Revolution, 2014
  4. Rick Smolan, Jennifer Erwitt: The human face of big data, 2012
  5. Pete Warden: Big data Glossary, 2011.
  6. Cthy O'Neil: Wapons of Math Destruction: How Big Data Increases Inequality and Threatens Democracy, 2016.

Fakultetska ponuda
  • Diplomski studij: Zimski semestar