Statistik för stora datamängder

Kursplan fastställd 2015-02-11 av programansvarig (eller motsvarande).

Kursöversikt

Engelskt namnStatistical learning for big data
KurskodMVE440
Omfattning7,5 Högskolepoäng
ÄgareMPENM
UtbildningsnivåAvancerad nivå
HuvudområdeMatematik
InstitutionMATEMATISKA VETENSKAPER
BetygsskalaTH - Fem, Fyra, Tre, Underkänd

Kurstillfälle 1

Undervisningsspråk Engelska
Anmälningskod 20130
Max antal deltagare120
Min. antal deltagare3
Sökbar för utbytesstudenterJa

Poängfördelning

Modul	LP1	LP2	LP3	LP4	Sommar	Ej LP	Tentamensdatum
0115 Tentamen 7,5 hp Betygsskala: TH				7,5 hp			Kontakta examinator Kontakta examinator Kontakta examinator

I program

Examinator

Rebecka Jörnsten
Professor, Tillämpad matematik och statistik, Matematiska vetenskaper
Kontakt

Gå till kurshemsidan

Behörighet

Information saknas

Särskild behörighet

För kurser på avancerad nivå gäller samma grundläggande och särskilda behörighetskrav som till det kursägande programmet. (När kursen är på avancerad nivå men ägs av ett grundnivåprogram gäller dock tillträdeskrav för avancerad nivå.)
Undantag från tillträdeskraven: Sökande med en programregistrering på ett program där kursen ingår i programplanen undantas från ovan krav.

Kursspecifika förkunskaper

En grundläggande kurs i statistisk slutledning och MVE190 Linjära Statistiska Modeller. Studenter kan också kontakta kursläraren för tillstånd att ta kursen.

Syfte

Kursen skall ge förståelse för och övning i tekniker för statistisk analys av stora datamängder.

Lärandemål (efter fullgjord kurs ska studenten kunna)

visa förståelse för centrala begrepp och ideer rörande klassifikation, klustering och dimensionsreducering
lösa högdimensionella dataanalys-övningar och tolka resultaten av sådana analyser

Innehåll

Överblick över högdimensionell dataanalys
Klassifikation: Bayes regel, diskriminantanalys-metoder, närmaste granne klassifikator, klassifikations- och regressions-träd.
Kostfunktioner, greedy searches, gradient descent, korsvalidering.
Logistisk regression
Regulariseringsmetoder. Gles logistisk regression, gles diskriminantanalys.
Ensemble-metoder: bagging, random projections, random forests.
Klustering: k-means, hierarkisk klustering, modell-baserad klutering, spektrala metoder.
Dimensionsreduktion: PCA, kanonisk korrelation, multi-dimensional scaling.
Speciella teman (urval av följande): nätverk och grafiska modeller, gles kovariansestimering, klustering av nätverk och community detection, nevrala nätverk, matriskomplettering, collaborative filtering.
Stor-skala lärning: stochastic searches, batch-metoder, online learning.

Organisation

Föreläsningar, diskussioner och läsuppgifter.

Litteratur

Meddelas senare.

Examination inklusive obligatoriska moment

Muntlig och/eller skriftlig examen.

Kursplan för Statistik för stora datamängder

Kursöversikt

Kurstillfälle 1

Poängfördelning

I program

Examinator

Behörighet

Särskild behörighet

Kursspecifika förkunskaper

Syfte

Lärandemål (efter fullgjord kurs ska studenten kunna)

Innehåll

Organisation

Litteratur

Examination inklusive obligatoriska moment

Kursöversikt