Kursplan fastställd 2021-02-26 av programansvarig (eller motsvarande).
Kursöversikt
- Engelskt namnLearning from data
- KurskodTIF285
- Omfattning7,5 Högskolepoäng
- ÄgareMPPHS
- UtbildningsnivåAvancerad nivå
- HuvudområdeTeknisk fysik
- InstitutionFYSIK
- BetygsskalaTH - Mycket väl godkänd (5), Väl godkänd (4), Godkänd (3), Underkänd
Kurstillfälle 1
- Undervisningsspråk Engelska
- Anmälningskod 85116
- Max antal deltagare60
- Blockschema
- Sökbar för utbytesstudenterJa
Poängfördelning
Modul | LP1 | LP2 | LP3 | LP4 | Sommar | Ej LP | Tentamensdatum |
---|---|---|---|---|---|---|---|
0119 Projekt 7,5 hp Betygsskala: TH | 7,5 hp |
I program
Examinator
- Christian Forssén
- Professor, Subatomär, högenergi- och plasmafysik, Fysik
Behörighet
Grundläggande behörighet för avancerad nivåSökande med en programregistrering på ett program där kursen ingår i programplanen undantas från ovan krav.
Särskild behörighet
Engelska 6Sökande med en programregistrering på ett program där kursen ingår i programplanen undantas från ovan krav.
Kursspecifika förkunskaper
- Grundläggande kunskaper i matematik på kandidatnivå (Flervariabelanalys, Linjär algebra, Matematisk statistik)- Grundläggande programmeringskunskaper (Programmeringsspråket Python kommer att introduceras och användas i kursen. Det är tillräckligt med tidigare erfarenhet från Matlab eller liknande interpreterat programmeringsspråk.)
- Allmän fysikkunskap (Inledande fysik från kandidatnivå underlättar inlärningen genom att erbjuda en djupare förståelse av de vetenskapliga exempel som kommer att studeras.)
Syfte
Kursen syftar till att introducera och lära studenterna att använda ett antal algoritmer och metoder inom statistisk inferens och maskininlärning, vilka i sin tur är centrala inom vetenskaplig dataanalys. Stort fokus ligger på praktiska tillämpningar av Bayesiansk inferens inom ingenjörs- och naturvetenskap, dvs förmågan att kunna kvantifiera styrkan hos induktiv inferens från fakta (t.ex. experimentell data) till propositioner såsom vetenskapliga hypoteser och modeller.Kursen är projektbaserad och studenterna kommer att exponeras för modern naturvetenskaplig forskning genom olika projekt. Ett delsyfte är att lära studenterna att utveckla och strukturera datorprogram för att kunna genomföra pålitlig och vetenskaplig dataanalys. Mer specifikt kommer projektuppgifter att utföras med programmeringsspråket Python i kombination med användbara, och fritt tillgängliga, programbibliotek.
Lärandemål (efter fullgjord kurs ska studenten kunna)
- utföra vetenskaplig dataanalys genom att utnyttja grundläggande koncept i Bayesiansk statistik tillsammans med kunskap kring vanligt förekommande statistiska fördelningar.
- kunna förklara centrala aspekter hos Monte Carlo-metoder och Markovkedjor, samt tillämpa dessa för att numeriskt sampla multivariata sannolikhetsfördelningar.
- kritiskt granska och kvantifiera osäkerheter hos modellparametrar från en statistisk analys av experimentell data; jämföra teoretiska modeller utifrån ett Bayesianskt synsätt.
- förstå och numeriskt implementera flera grundläggande algoritmer som används inom dataanalys och maskininlärning, som linjära regressions- och klassificeringsmetoder, enkla neurala nätverk och gaussprocesser.
- använda python för vetenskaplig dataanalys med statistiska inferensmetoder och för maskininlärning, samt för att visualisera resultat.
- skriva välstrukturerade tekniska rapporter där resultat och slutsatser från en vetenskaplig dataanalys presenteras klart och tydligt.
- vidhålla ett vetenskapligt och etiskt arbetssätt i processen att analysera data och att skriva datorprogram.
Innehåll
Kursen består av två huvudsakliga delar:
1. Bayesiansk inferens och dataanalys
2. Maskininlärningsmetoder för dataanalys
Följande ämnen kommer att behandlas:
- Grundläggande koncept från statistik: förväntansvärden, varians, kovarians, korrelationsfunktioner och fel; diskreta och kontinuerliga sannolikhetsfördelningar;
- Genomgång av enkla statistiska modeller, binomialfördelning, Poissonfördelning, enkel och multivariat normalfördelning;
- Centrala delar av Bayesiansk statistik;
- Monte Carlo-metoder, Markovkedjor, Metropolis-Hastingsalgoritmen;
- Linjära regressions- och klassificeringsmetoder;
- Gauss- och Dirichletprocesser;
- Neurala nätverk.
Organisation
Föreläsningar.
Handlett arbete i datorsal (grupparbeten med numeriska projekt)
Ett antal mindre analytiska och numeriska hemuppgiftsproblem.
Två beräkningsprojekt med skriftlig rapportredovisning.
Litteratur
Föreläsningsanteckningar.
Rekommenderad lärobok:
Phil Gregory, Bayesian Logical Data Analysis for the Physical Sciences, Cambridge University Press, 2010
Extra litteratur:
David J.C. MacKay, Information Theory, Inference, and Learning Algorithms, Cambridge University Press, 4th printing, 2005
Trevor Hastie, Robert Tibshirani, Jerome H. Friedman, The Elements of Statistical Learning, Springer, 2nd edition, 2009
Andrew Gelman et al, Bayesian Data Analysis, CRC Press, 3rd edition, 2014
Aurelien Geron, Hands‑On Machine Learning with Scikit‑Learn and TensorFlow, O'Reilly, 1st edition, 2017
Examination inklusive obligatoriska moment
Slutbetyget bestäms genom en kombination av de rättade hemuppgifterna och de skriftliga rapporterna.Kursens examinator får examinera enstaka studenter på annat sätt än vad som anges ovan om särskilda skäl föreligger, till exempel om en student har ett beslut från Chalmers om pedagogiskt stöd på grund av funktionsnedsättning.