Kursplan för Sannolikhetsteori och statistisk inlärning med Python

Kursplan fastställd 2022-02-02 av programansvarig (eller motsvarande).

Kursöversikt

  • Engelskt namnProbability and statistical learning using Python
  • KurskodMVE137
  • Omfattning7,5 Högskolepoäng
  • ÄgareMPICT
  • UtbildningsnivåAvancerad nivå
  • HuvudområdeElektroteknik, Matematik
  • InstitutionELEKTROTEKNIK
  • BetygsskalaTH - Mycket väl godkänd (5), Väl godkänd (4), Godkänd (3), Underkänd

Kurstillfälle 1

  • Undervisningsspråk Engelska
  • Anmälningskod 13120
  • Blockschema
  • Sökbar för utbytesstudenterJa

Poängfördelning

0121 Tentamen 7,5 hp
Betygsskala: TH
7,5 hp
  • 27 Okt 2023 fm J
  • 03 Jan 2024 em J
  • 29 Aug 2024 em J

I program

Examinator

Gå till kurshemsidan (Öppnas i ny flik)

Behörighet

Grundläggande behörighet för avancerad nivå
Sökande med en programregistrering på ett program där kursen ingår i programplanen undantas från ovan krav.

Särskild behörighet

Engelska 6
Sökande med en programregistrering på ett program där kursen ingår i programplanen undantas från ovan krav.

Kursspecifika förkunskaper

Kunskaper på kandidatnivå om sannolikhetslära och Python. För studenter utan förkunskaper om Python kommer tips till handledning att ges.

Syfte

Kursen ger deltagarna en solid grund för sannolikhetsteori och statistiskt lärande. I synnerhet kommer deltagarna att bli bekanta med viktiga probabilistiska och statistiska begrepp inom datavetenskapen och lära sig att tillämpa dem för att analysera datamängder och dra meningsfulla slutsatser från data. Kursen kommer att behandla både teoretiska och praktiska aspekter, med målet att förbereda deltagarna för att tillämpa den förvärvade kunskapen i praktiken. Deltagarna kommer att ha möjlighet att experimentera med och öva på de begrepp som lärs ut i kursen via Python-program och Jupyter Notebook-plattformen.

Lärandemål (efter fullgjord kurs ska studenten kunna)

  • Förklara sannolikhetsbegrepp som svanssannolikhetsgränser, momentgenererande funktioner och deras applikationer, Markov-kedjor och centrala gränssatser.
  • Förklara statistiska modeller och metoder som används för förutsägelse inom vetenskap och teknik, till exempel regressions- och klassificeringsmodeller.
  • Välja lämpliga statistiska modeller för att analysera befintliga datamängder, tillämpa statistiska metoder och utföra analyser med Python.
  • Diskutera användningen av vanliga Python-bibliotek som Numpy, Matplotlib, Jupyter Notebook, Pandas, för att utföra dataanalys.
  • Designa Python-program som använder sannolikhets- och statistiska inlärningskoncept som presenteras i kursen för att dra meningsfulla slutsatser från data.

Innehåll

Sannolikhetsteori

Diskreta stokastiska variabler och väntevärde

  • Sannolikhetsaxiom
  • Stokastiska variabler och väntevärde
  • Bernoulli och Binomial stokastiska variabler
  • Betingat väntevärde
  • Den geometriska fördelningen
Moment och avvikelser
  • Markovs olikhet
  • Varians och moment för en stokastisk variabel
  • Chebyshevs olikhet
  • Chernoff och Hoeffding
Markov-kedjor och random walk
  • Markov-kedjor: definitioner och representationer
  • Klassificering av tillstånd
  • Stationär fördelning
  • Random walks
Kontinuerlig fördelning och Poisson-processen
  • Kontinuerliga stokastiska variabler
  • Likformig sannolikhetsfördelning
  • Den exponentiella fördelningen
  • Poisson-processen
  • Markov-processer i kontinuerlig tid
  • Markoviska köer

Grunden för statistiskt lärande

Översikt av supervised learning

  • Minsta kvadrat och närmaste granne
  • Statistisk beslutsteori
  • Lokala metoder i högre dimensioner
  • Statistical model supervised learning och funktionsapproximering
  • Strukturerad regressionsmodell
  • Klasser av begränsade skattare
Linjära metoder för regression
  • Linjära regressionsmodeller och minst kvadratmetoden
  • Urval av delmängder
  • Krympningsmetoder
  • Metoder som använder härledda inmatningsriktningar
Linjära metoder för klassificering
  • Linjär diskriminantanalys
  • Logistisk regression
  • Separering av hyperplan
Modellbedömning och urval
  • Bias, varians och modellkomplexitet
  • Nedbrytning av bias-varians
  • Effektivt antal parametrar
  • Bayesiansk strategi och BIC
  • Korsvalideringar
  • Bootstrap-metoder

Organisation

Föreläsningar och problemlösningssessioner

Litteratur

  • G. R. Grimmett and D. R. Stirzaker, Probability and Random Processes, 3rd ed. Oxford, U.K.: Oxford Univ. Press, 2001.
  • Michael Mitzenmacher and Eli Upfal, Probability and Computing: Randomization and Probabilistic Techniques in Algorithms and Data Analysis, Cambridge University Press, 2017.
  • T. Hastie, R. Tibshirani, and J. Friedma, The elements of statistical learning: Data minining, inference, and prediction, 2nd ed. Springer, 2008

Examination inklusive obligatoriska moment

Det slutliga betyget baseras på poäng från veckoliga hemuppgifter och Python-laborationer såväl som den skriftliga tentamen.

Kursens examinator får examinera enstaka studenter på annat sätt än vad som anges ovan om särskilda skäl föreligger, till exempel om en student har ett beslut från Chalmers om pedagogiskt stöd på grund av funktionsnedsättning.