Kursplan för Inlärning från data

Kursplan fastställd 2022-02-02 av programansvarig (eller motsvarande).

Kursöversikt

  • Engelskt namnLearning from data
  • KurskodTIF285
  • Omfattning7,5 Högskolepoäng
  • ÄgareMPPHS
  • UtbildningsnivåAvancerad nivå
  • HuvudområdeTeknisk fysik
  • InstitutionFYSIK
  • BetygsskalaTH - Mycket väl godkänd (5), Väl godkänd (4), Godkänd (3), Underkänd

Kurstillfälle 1

  • Undervisningsspråk Engelska
  • Anmälningskod 85120
  • Max antal deltagare60
  • Blockschema
  • Sökbar för utbytesstudenterJa

Poängfördelning

0119 Projekt 7,5 hp
Betygsskala: TH
7,5 hp

I program

Examinator

Gå till kurshemsidan (Öppnas i ny flik)

Behörighet

Grundläggande behörighet för avancerad nivå
Sökande med en programregistrering på ett program där kursen ingår i programplanen undantas från ovan krav.

Särskild behörighet

Engelska 6
Sökande med en programregistrering på ett program där kursen ingår i programplanen undantas från ovan krav.

Kursspecifika förkunskaper

- Grundläggande kunskaper i matematik på kandidatnivå (Flervariabelanalys, Linjär algebra, Matematisk statistik)
- Grundläggande programmeringskunskaper (Programmeringsspråket Python kommer att användas i kursen. Tidigare erfarenhet från Matlab eller liknande interpreterat programmeringsspråk skall räcka för att kunna följa kursen.) - Allmän fysikkunskap (Inledande fysik från kandidatnivå underlättar inlärningen genom att erbjuda en djupare förståelse av de vetenskapliga exempel som kommer att studeras.)

Syfte

Kursen syftar till att introducera och lära studenterna att använda ett antal algoritmer och metoder inom statistisk inferens och maskininlärning, vilka i sin tur är centrala inom vetenskaplig dataanalys. Stort fokus ligger på praktiska tillämpningar av Bayesiansk inferens inom ingenjörs- och naturvetenskap, dvs förmågan att kunna kvantifiera styrkan hos induktiv inferens från fakta (t.ex. experimentell data) till propositioner såsom vetenskapliga hypoteser och modeller.
Kursen är projektbaserad och studenterna kommer att exponeras för modern naturvetenskaplig forskning genom olika projekt. Ett delsyfte är att lära studenterna att utveckla och strukturera datorprogram för att kunna genomföra pålitlig och vetenskaplig dataanalys. Mer specifikt kommer projektuppgifter att utföras med programmeringsspråket Python i kombination med användbara, och fritt tillgängliga, programbibliotek.

Lärandemål (efter fullgjord kurs ska studenten kunna)

- utföra vetenskaplig dataanalys genom att utnyttja grundläggande koncept i Bayesiansk statistik tillsammans med kunskap kring vanligt förekommande statistiska fördelningar.
- kunna förklara centrala aspekter hos Monte Carlo-metoder och Markovkedjor, samt tillämpa dessa för att numeriskt sampla multivariata sannolikhetsfördelningar.
- kritiskt granska och kvantifiera osäkerheter hos modellparametrar från en statistisk analys av experimentell data; jämföra teoretiska modeller utifrån ett Bayesianskt synsätt.
- förstå och numeriskt implementera flera grundläggande algoritmer som används inom dataanalys och maskininlärning, som linjära regressions- och klassificeringsmetoder, enkla neurala nätverk och gaussprocesser.
- använda python för vetenskaplig dataanalys med statistiska inferensmetoder och för maskininlärning, samt för att visualisera resultat.
- skriva välstrukturerade tekniska rapporter där resultat och slutsatser från en vetenskaplig dataanalys presenteras klart och tydligt.
- vidhålla ett vetenskapligt och etiskt arbetssätt i processen att analysera data och att skriva datorprogram.

Innehåll

Kursen består av två huvudsakliga delar:
1. Bayesiansk inferens för modellering och dataanalys
2. Maskininlärningsmetoder för dataanalys

Följande ämnen kommer att behandlas:
- Repetition av grundläggande koncept från statistik: förväntansvärden, varians, kovarians, betingad sannolikhet; diskreta och kontinuerliga sannolikhetsfördelningar; multivariata fördelningar och kovarians;
- Centrala delar av Bayesiansk statistik;
- Monte Carlo-metoder, Markovkedjor, Metropolis-Hastingsalgoritmen;
- Linjära regressions- och klassificeringsmetoder;
- Gaussprocesser;
- Neurala nätverk, bayesianska neurala nätverk.

Organisation

Föreläsningar.
Handlett arbete i datorsal (grupparbeten med numeriska projekt)
Analytiska och numeriska hemuppgiftsproblem.
Två beräkningsprojekt med skriftlig rapportredovisning.

Litteratur

Föreläsningsanteckningar.

Rekommenderad lärobok:
Phil Gregory, Bayesian Logical Data Analysis for the Physical Sciences, Cambridge University Press, 2010

Extra litteratur: 
David J.C. MacKay, Information Theory, Inference, and Learning Algorithms, Cambridge University Press, 4th printing, 2005
Trevor Hastie, Robert Tibshirani, Jerome H. Friedman, The Elements of Statistical Learning, Springer, 2nd edition, 2009
Andrew Gelman et al, Bayesian Data Analysis, CRC Press, 3rd edition, 2014
Aurelien Geron, Hands‑On Machine Learning with Scikit‑Learn and TensorFlow, O'Reilly, 1st edition, 2017

Examination inklusive obligatoriska moment

Slutbetyget bestäms genom en kombination av de rättade hemuppgifterna och de skriftliga rapporterna.

Kursens examinator får examinera enstaka studenter på annat sätt än vad som anges ovan om särskilda skäl föreligger, till exempel om en student har ett beslut från Chalmers om pedagogiskt stöd på grund av funktionsnedsättning.