Kursplan fastställd 2021-02-12 av programansvarig (eller motsvarande).
Kursöversikt
- Engelskt namnProbability and statistical learning using Python
- KurskodMVE137
- Omfattning7,5 Högskolepoäng
- ÄgareMPCOM
- UtbildningsnivåAvancerad nivå
- HuvudområdeElektroteknik, Matematik
- InstitutionELEKTROTEKNIK
- BetygsskalaTH - Mycket väl godkänd (5), Väl godkänd (4), Godkänd (3), Underkänd
Kurstillfälle 1
- Undervisningsspråk Engelska
- Anmälningskod 13123
- Blockschema
- Sökbar för utbytesstudenterJa
Poängfördelning
Modul | LP1 | LP2 | LP3 | LP4 | Sommar | Ej LP | Tentamensdatum |
---|---|---|---|---|---|---|---|
0121 Tentamen 7,5 hp Betygsskala: TH | 7,5 hp |
|
I program
- MPCOM - KOMMUNIKATIONSSYSTEM, MASTERPROGRAM, Årskurs 1 (obligatorisk)
- MPEES - INBYGGDA ELEKTRONIKSYSTEM, MASTERPROGRAM, Årskurs 2 (valbar)
- MPSYS - SYSTEMTEKNIK, REGLERTEKNIK OCH MEKATRONIK, MASTERPROGRAM, Årskurs 2 (valbar)
Examinator
- Giuseppe Durisi
- Professor, Kommunikation, Antenner och Optiska Nätverk, Elektroteknik
Behörighet
Grundläggande behörighet för avancerad nivåSökande med en programregistrering på ett program där kursen ingår i programplanen undantas från ovan krav.
Särskild behörighet
Engelska 6Sökande med en programregistrering på ett program där kursen ingår i programplanen undantas från ovan krav.
Kursspecifika förkunskaper
Kunskaper på kandidatnivå om sannolikhetslära och Python. För studenter utan förkunskaper om Python kommer tips till handledning att ges.Syfte
Kursen ger deltagarna en solid grund för sannolikhetsteori och statistiskt lärande. I synnerhet kommer deltagarna att bli bekanta med viktiga probabilistiska och statistiska begrepp inom datavetenskapen och lära sig att tillämpa dem för att analysera datamängder och dra meningsfulla slutsatser från data. Kursen kommer att behandla både teoretiska och praktiska aspekter, med målet att förbereda deltagarna för att tillämpa den förvärvade kunskapen i praktiken. Deltagarna kommer att ha möjlighet att experimentera med och öva på de begrepp som lärs ut i kursen via Python-program och Jupyter Notebook-plattformen.Lärandemål (efter fullgjord kurs ska studenten kunna)
- Förklara sannolikhetsbegrepp som svanssannolikhetsgränser, momentgenererande funktioner och deras applikationer, Markov-kedjor och centrala gränssatser.
- Förklara statistiska modeller och metoder som används för förutsägelse inom vetenskap och teknik, till exempel regressions- och klassificeringsmodeller.
- Välja lämpliga statistiska modeller för att analysera befintliga datamängder, tillämpa statistiska metoder och utföra analyser med Python.
- Diskutera användningen av vanliga Python-bibliotek som Numpy, Matplotlib, Jupyter Notebook, Pandas, för att utföra dataanalys.
- Designa Python-program som använder sannolikhets- och statistiska inlärningskoncept som presenteras i kursen för att dra meningsfulla slutsatser från data.
Innehåll
SannolikhetsteoriDiskreta stokastiska variabler och väntevärde
- Sannolikhetsaxiom
- Stokastiska variabler och väntevärde (Jensen)
- Bernoulli och Binomial stokastiska variabler
- Betingat väntevärde
- Den geometriska fördelningen
- Markovs olikhet
- Varians och moment för en stokastisk variabel
- Chebyshevs olikhet
- Median och medelvärde
- Markov-kedjor: definitioner och representationer
- Klassificering av tillstånd
- Stationär fördelning
- Random walks
- Kontinuerliga stokastiska variabler
- Likformig sannolikhetsfördelning
- Den exponentiella fördelningen
- Poisson-processen
- Markov-processer i kontinuerlig tid
- Markoviska köer
- Normalfördelningen
- Gränsvärdet av binomialfördelningen
- Den centrala gränsvärdessatsen
- Flervariat normalfördelning
- Maximum likelihood-estimat
Översikt av supervised learning
- Minsta kvadrat och närmaste granne
- Statistisk beslutsteori
- Lokala metoder i högre dimensioner
- Statistical model supervised learning och funktionsapproximering
- Strukturerad regressionsmodell
- Klasser av begränsade skattare
- Linjära regressionsmodeller och minst kvadratmetoden
- Urval av delmängder
- Krympningsmetoder
- Metoder som använder härledda inmatningsriktningar
- Linjär diskriminantanalys
- Logistisk regression
- Separering av hyperplan
- Bias, varians och modellkomplexitet
- Nedbrytning av bias-varians
- Effektivt antal parametrar
- Bayesiansk strategi och BIC
- Korsvalideringar
- Bootstrap-metoder
Organisation
Föreläsningar och problemlösningssessioner
Litteratur
- G. R. Grimmett and D. R. Stirzaker, Probability and Random Processes, 3rd ed. Oxford, U.K.: Oxford Univ. Press, 2001.
- Michael Mitzenmacher and Eli Upfal, Probability and Computing: Randomization and Probabilistic Techniques in Algorithms and Data Analysis, Cambridge University Press, 2017.
- T. Hastie, R. Tibshirani, and J. Friedma, The elements of statistical learning: Data minining, inference, and prediction, 2nd ed. Springer, 2008
Examination inklusive obligatoriska moment
Skriftlig tentamen
Kursens examinator får examinera enstaka studenter på annat sätt än vad som anges ovan om särskilda skäl föreligger, till exempel om en student har ett beslut från Chalmers om pedagogiskt stöd på grund av funktionsnedsättning.