Kursplanen innehåller ändringar
Se ändringarKursplan fastställd 2019-02-21 av programansvarig (eller motsvarande).
Kursöversikt
- Engelskt namnTechniques for large-scale data
- KurskodDAT346
- Omfattning7,5 Högskolepoäng
- ÄgareMPDSC
- UtbildningsnivåAvancerad nivå
- HuvudområdeDatateknik, Informationsteknik
- InstitutionDATA- OCH INFORMATIONSTEKNIK
- BetygsskalaTH - Fem, Fyra, Tre, Underkänd
Kurstillfälle 1
- Undervisningsspråk Engelska
- Anmälningskod 87114
- Max antal deltagare30
- Blockschema
- Sökbar för utbytesstudenterNej
- Endast studenter med kurstillfället i programplan.
Poängfördelning
Modul | LP1 | LP2 | LP3 | LP4 | Sommar | Ej LP | Tentamensdatum |
---|---|---|---|---|---|---|---|
0119 Tentamen 4 hp Betygsskala: TH | 4 hp |
| |||||
0219 Inlämningsuppgift 3,5 hp Betygsskala: UG | 3,5 hp |
I program
- MPALG - DATAVETENSKAP - ALGORITMER, PROGRAMSPRÅK OCH LOGIK, MASTERPROGRAM, Årskurs 1 (valbar)
- MPDSC - DATA SCIENCE OCH AI, MASTERPROGRAM, Årskurs 1 (obligatoriskt valbar)
Examinator
- Alexander Schliep
- Universitetslektor, Data Science och AI, Data- och informationsteknik
Ersätter
- DAT345 Tekniker för storskalig datahantering
Behörighet
Information saknasSärskild behörighet
För kurser på avancerad nivå gäller samma grundläggande och särskilda behörighetskrav som till det kursägande programmet. (När kursen är på avancerad nivå men ägs av ett grundnivåprogram gäller dock tillträdeskrav för avancerad nivå.)Undantag från tillträdeskraven: Sökande med en programregistrering på ett program där kursen ingår i programplanen undantas från ovan krav.
Kursspecifika förkunskaper
Det krävs krävs minst 15 hp i programmering, samt en kurs i databaser om minst 7,5 hp, t. ex. TDA357 Databaser.Syfte
Kursens mål är att fördjupa studenternas kunskaper och färdigheter inom den tekniska sidan av data science, inklusive de relevanta datamodellerna, samt lämpliga mjukvaru- och hårdvarumiljöer.Lärandemål (efter fullgjord kurs ska studenten kunna)
Efter godkänd kurs ska studenten kunna:Kunskap och förståelse
- diskutera de viktigaste teknologiska aspekterna vid design och implementering avsystem för analys av storskaliga data,
- diskutera indexstrukturer och nyttan med dem,
- beskriva datamodeller och mjukvarustandarder för internetdelning av data.
- implementera tillämpningar för att transformera och analysera storskaliga data med hjälp av tillämpbara mjukvaruramverk,,
- tillgängliggöra och utnyttja strukturerade data över internet med hjälp av lämpliga datamodeller och mjukvaruverktyg.
- föreslå lämpliga tekniska infrastrukturer för dataanalytiska uppgifter och argumentera fördelar och nackdelar med dessa,
- diskutera metoder för parallellism och återställning i databassystem,
- diskutera effektiviteten för sökfrågeplaner,
- diskutera storskalig datahantering utifrån ett etiskt perspektiv.
Innehåll
Framför allt kommer kursen att innefatta- en överblick av datorarkitekturer, algoritmiska tillvägagångssätt, och högpresterande beräkningsinfrastrukturer, med ett fokus på de begränsningar som finns vid behandling av storskaliga data,
- en inledning till de relevanta ramverken för bearbetning av data med hjälp av datorkluster,
- implementering av dataanalysverktyg på ett kluster med hjälp av Python och lämpliga mjukvaruramverk,
- indexstrukturer, hantering och optimering av sökfrågor; parallellism, återställning,
- en överblick över ickerelationella databasteknologier,
- Semantic Web och besläktade teknologier,
- en översikt över etiska frågor inom storskalig datahantering, t.ex. när det gäller licenser, tillgänglighet, anonymisering.
Organisation
Föreläsningar, datorlaborationer och övningar.Litteratur
Kurslitteratur kommer att publiceras senast 8 veckor innan kursstart.Examination inklusive obligatoriska moment
Kursen examineras genom en individuell skriftlig salstentamen, samt obligatoriska skriftliga inlämningsuppgifter som redovisas genom rapportinlämning, varav vissa kommer att lösas individuellt och vissa i grupper på upp till 4 studenter. Det kommer att ges frivilliga individuella uppgifter som ger bonuspoäng på tentamen. Dessa bonuspoäng är giltiga under ett helt läsår.Kursplanen innehåller ändringar
- Ändring gjord på tentamen:
- 2019-09-18: Inställd Ändrat till inställd av Rickard Johansson
[2019-10-11 4,0 hp, 0119] Inställt - 2019-09-04: Plats Plats ändrat från Johanneberg till M av grunnet
[2019-10-11 4,0 hp, 0119]
- 2019-09-18: Inställd Ändrat till inställd av Rickard Johansson
- Ändring gjord på kurstillfälle:
- 2019-11-21: Max antal deltagare Max antal deltagare ändrat från 20 till 30 av UBS
[Kurstillfälle 1]
- 2019-11-21: Max antal deltagare Max antal deltagare ändrat från 20 till 30 av UBS