Ova radionica je 2. modul programa Certified Data Scientist.

Cilj i opis modula:

Cilj ovog modula je osobama koje matematiku i statistiku poznaju samo na osnovnoj razini pružiti uvod u statističku analizu podataka. Ovdje se misli na one čije poznavanje ovih struka je na razini srednjoškolskog obrazovanja te kraćeg (jedan ili eventualno nekoliko kolegija) tijekom fakultetskog studija ekonomije ili drugih studija.
Tijekom ovog dvodnevnog modula polaznicima će se objasniti svrha, namjena i upotrebljivost statistike u ekonomiji i drugim znanostima postupnim uvođenjem u način statističkog razmišljanja, kroz niz primjera iz svakodnevne poslovne i znanstvene prakse. S obzirom na ranije definirani cilj, od polaznika se ne očekuje određena razina predznanja osim osnovnog poznavanja matematičkih pojmova.

SADRŽAJ RADIONICE

1. DAN

Osnovno o statistici kao znanosti
•    Vrste podataka, načini mjerenja i zapisa
•    Organiziranje podataka za statističku analizu

Deskriptivne (opisne) metode i mjere varijabilnosti podataka
•    Normalnost razdiobe
•    Grafički prikaz

Vjerojatnost i distribucije vjerojatnosti
•    Inferencijalna statistika
•    Uzorak i uzorkovanje (sampling)

Zavisni i nezavisni uzorci
•    Usporedba dvaju uzoraka

2. DAN

Rekapitulacija i ponavljanje gradiva iz prvog dana
•    Pristup u analizi kvalitativnih, semikvantitativnih i kvantitativnih podataka
•    Parametrijski i neparametrijski testovi
•    Omjer šansi

Osjetljivost i specifičnost
•    Usporedba više skupina
•    Korelacija i regresija – osnovni koncepti
•    Jednostavna linearna regresija
•    Multipla regresija
•    Ordinalna i logistička regresija

Analiza preživljenja i njena primjena u ekonomiji
•    Vremenske serije
•    Dizajn ispitivanja
•    Izračun uzorka

Zamke u statističkoj obradi
•    Programska podrška analizi i prikazu podataka

PRAKTIČNE VJEŽBE:
Svi navedeni pojmovi i koncepti analizirat će se kroz niz vježbi u softverskom paketu SPSS, korištenjem skupova podataka (datasets) koji dolaze s programom te onih koji se nalaze u vlasništvu autora modula i/ili predstavljaju standardne datasetove kojima se ilustriraju pristupi organiziranju i analizi podataka.
Na kraju drugog dana modula polaznici će moći samostalno pristupiti rješavanju jednostavnijih statističkih problema korištenjem navedenog softvera.