Sannolikhetsteori och statistisk inlärning med Python

Kursplan fastställd 2022-02-02 av programansvarig (eller motsvarande).

Kursöversikt

Engelskt namnProbability and statistical learning using Python
KurskodMVE137
Omfattning7,5 Högskolepoäng
ÄgareMPICT
UtbildningsnivåAvancerad nivå
HuvudområdeElektroteknik, Matematik
InstitutionELEKTROTEKNIK
BetygsskalaTH - Mycket väl godkänd (5), Väl godkänd (4), Godkänd (3), Underkänd

Kurstillfälle 1

Undervisningsspråk Engelska
Anmälningskod 13120
Blockschema
Sökbar för utbytesstudenterJa

Poängfördelning

Modul	LP1	LP2	LP3	LP4	Sommar	Ej LP	Tentamensdatum
0121 Tentamen 7,5 hp Betygsskala: TH	7,5 hp						27 Okt 2023 fm J 03 Jan 2024 em J 29 Aug 2024 em J

I program

Examinator

Giuseppe Durisi
Professor, Kommunikation, Antenner och Optiska Nätverk, Elektroteknik
Kontakt

Gå till kurshemsidan

Behörighet

Grundläggande behörighet för avancerad nivå
Sökande med en programregistrering på ett program där kursen ingår i programplanen undantas från ovan krav.

Särskild behörighet

Engelska 6
Sökande med en programregistrering på ett program där kursen ingår i programplanen undantas från ovan krav.

Kursspecifika förkunskaper

Kunskaper på kandidatnivå om sannolikhetslära och Python. För studenter utan förkunskaper om Python kommer tips till handledning att ges.

Syfte

Kursen ger deltagarna en solid grund för sannolikhetsteori och statistiskt lärande. I synnerhet kommer deltagarna att bli bekanta med viktiga probabilistiska och statistiska begrepp inom datavetenskapen och lära sig att tillämpa dem för att analysera datamängder och dra meningsfulla slutsatser från data. Kursen kommer att behandla både teoretiska och praktiska aspekter, med målet att förbereda deltagarna för att tillämpa den förvärvade kunskapen i praktiken. Deltagarna kommer att ha möjlighet att experimentera med och öva på de begrepp som lärs ut i kursen via Python-program och Jupyter Notebook-plattformen.

Lärandemål (efter fullgjord kurs ska studenten kunna)

Förklara sannolikhetsbegrepp som svanssannolikhetsgränser, momentgenererande funktioner och deras applikationer, Markov-kedjor och centrala gränssatser.
Förklara statistiska modeller och metoder som används för förutsägelse inom vetenskap och teknik, till exempel regressions- och klassificeringsmodeller.
Välja lämpliga statistiska modeller för att analysera befintliga datamängder, tillämpa statistiska metoder och utföra analyser med Python.
Diskutera användningen av vanliga Python-bibliotek som Numpy, Matplotlib, Jupyter Notebook, Pandas, för att utföra dataanalys.
Designa Python-program som använder sannolikhets- och statistiska inlärningskoncept som presenteras i kursen för att dra meningsfulla slutsatser från data.

Innehåll

Sannolikhetsteori

Diskreta stokastiska variabler och väntevärde

Sannolikhetsaxiom
Stokastiska variabler och väntevärde
Bernoulli och Binomial stokastiska variabler
Betingat väntevärde
Den geometriska fördelningen

Moment och avvikelser

Markovs olikhet
Varians och moment för en stokastisk variabel
Chebyshevs olikhet
Chernoff och Hoeffding

Markov-kedjor och random walk

Markov-kedjor: definitioner och representationer
Klassificering av tillstånd
Stationär fördelning
Random walks

Kontinuerlig fördelning och Poisson-processen

Kontinuerliga stokastiska variabler
Likformig sannolikhetsfördelning
Den exponentiella fördelningen
Poisson-processen
Markov-processer i kontinuerlig tid
Markoviska köer

Grunden för statistiskt lärande

Översikt av supervised learning

Minsta kvadrat och närmaste granne
Statistisk beslutsteori
Lokala metoder i högre dimensioner
Statistical model supervised learning och funktionsapproximering
Strukturerad regressionsmodell
Klasser av begränsade skattare

Linjära metoder för regression

Linjära regressionsmodeller och minst kvadratmetoden
Urval av delmängder
Krympningsmetoder
Metoder som använder härledda inmatningsriktningar

Linjära metoder för klassificering

Linjär diskriminantanalys
Logistisk regression
Separering av hyperplan

Modellbedömning och urval

Bias, varians och modellkomplexitet
Nedbrytning av bias-varians
Effektivt antal parametrar
Bayesiansk strategi och BIC
Korsvalideringar
Bootstrap-metoder

Organisation

Föreläsningar och problemlösningssessioner

Litteratur

G. R. Grimmett and D. R. Stirzaker, Probability and Random Processes, 3rd ed. Oxford, U.K.: Oxford Univ. Press, 2001.
Michael Mitzenmacher and Eli Upfal, Probability and Computing: Randomization and Probabilistic Techniques in Algorithms and Data Analysis, Cambridge University Press, 2017.
T. Hastie, R. Tibshirani, and J. Friedma, The elements of statistical learning: Data minining, inference, and prediction, 2nd ed. Springer, 2008

Examination inklusive obligatoriska moment

Det slutliga betyget baseras på poäng från veckoliga hemuppgifter och Python-laborationer såväl som den skriftliga tentamen.

Kursens examinator får examinera enstaka studenter på annat sätt än vad som anges ovan om särskilda skäl föreligger, till exempel om en student har ett beslut från Chalmers om riktat pedagogiskt stöd på grund av funktionsnedsättning.

Kursplan för Sannolikhetsteori och statistisk inlärning med Python

Kursöversikt

Kurstillfälle 1

Poängfördelning

I program

Examinator

Behörighet

Särskild behörighet

Kursspecifika förkunskaper

Syfte

Lärandemål (efter fullgjord kurs ska studenten kunna)

Innehåll

Organisation

Litteratur

Examination inklusive obligatoriska moment

Kursöversikt