CILJEVI PREDMETA:
Glavni cilj predmeta je razvoj tehnike matematičkog modeliranja i prikladnih matematičkih metoda za probleme složene analize podataka. Fokus je na glavnom problemu podatkovnih znanosti - kako iz neke (obično ogromne) kolekcije sirovih podataka izlučiti dodatnu, kvalitetniju informaciju. Na konkretnim primjerima primjena iz realnog svijeta (npr. pretraživači Interneta, obrada podataka vezanih za strukture proteina, obrada slike-algoritamsko prepoznavanje lica i algoritamsko čitanje) će se pokazati kako objekte iz realnog svijeta i veze među njima opisati matematičkim objektima i funkcijama nad njima. Pokazuje se kako nizom sasvim elementarnih razmatranja dolazimo do visoko sofisticiranih matematičkih modela koji kombiniraju tehnike statistike, numeričke matematike, teorije grafova, multilinearne algebre itd. U tom smislu je kolegij dobra vježba integralne primjene naučenih matematičkih tehnika na probleme iz realnih primjena, a glavna dodana vrijednost je svladavanje modernih tehnika podatkovnih znanosti iz područja redukcije dimenzije, klasteriranja, analize strukture mreža.
NASTAVNI SADRŽAJI:
1. Vektorski model podataka (motivacija i primjeri - tekstualni podaci, slika, video, itd.)
2. Metode klasteriranja (k-sredine s varijacijama, spektralna relaksacija k-sredina)
3. SVD dekompozicija i primjene na redukciju dimenzije i uklanjanje šuma, te steganografiju.
4. Klasteriranje pomocu spektralnih rezova u tezinskom grafu
5. Google page rank algoritam s detaljnom analizom koja ukljucuje elemente teorije stohastickih i nenegativnih matrica
6. Centralnost i druge tezinske mjere vrhova u grafu
7. Tenzori i tenzorske dekompozicije
8. Tenzorski SVD i kompresija tenzora s primjenama
9. Nenegativne matricne faktorizacije s primjenama u klasteriranju
10 Studijski primjeri
|