Kursplan för Tekniker för storskalig datahantering

Kursplanen innehåller ändringar
Se ändringar

Kursplan fastställd 2019-02-21 av programansvarig (eller motsvarande).

Kursöversikt

  • Engelskt namnTechniques for large-scale data
  • KurskodDAT346
  • Omfattning7,5 Högskolepoäng
  • ÄgareMPDSC
  • UtbildningsnivåAvancerad nivå
  • HuvudområdeDatateknik, Informationsteknik
  • InstitutionDATA- OCH INFORMATIONSTEKNIK
  • BetygsskalaTH - Fem, Fyra, Tre, Underkänd

Kurstillfälle 1

  • Undervisningsspråk Engelska
  • Anmälningskod 87114
  • Max antal deltagare30
  • Blockschema
  • Sökbar för utbytesstudenterNej
  • Endast studenter med kurstillfället i programplan.

Poängfördelning

0119 Tentamen 4 hp
Betygsskala: TH
0 hp0 hp0 hp4 hp0 hp0 hp
  • 03 Jun 2020 fm J
  • 11 Okt 2019 fm M
  • 21 Aug 2020 em J
0219 Inlämningsuppgift 3,5 hp
Betygsskala: UG
0 hp0 hp0 hp3,5 hp0 hp0 hp

I program

Examinator

Gå till kurshemsidan (Öppnas i ny flik)

Ersätter

  • DAT345 Tekniker för storskalig datahantering

Behörighet

Information saknas

Särskild behörighet

För kurser på avancerad nivå gäller samma grundläggande och särskilda behörighetskrav som till det kursägande programmet. (När kursen är på avancerad nivå men ägs av ett grundnivåprogram gäller dock tillträdeskrav för avancerad nivå.)
Undantag från tillträdeskraven: Sökande med en programregistrering på ett program där kursen ingår i programplanen undantas från ovan krav.

Kursspecifika förkunskaper

Det krävs krävs minst 15 hp i programmering, samt en kurs i databaser om minst 7,5 hp, t. ex. TDA357 Databaser.

Syfte

Kursens mål är att fördjupa studenternas kunskaper och färdigheter inom den tekniska sidan av data science, inklusive de relevanta datamodellerna, samt lämpliga mjukvaru- och hårdvarumiljöer.

Lärandemål (efter fullgjord kurs ska studenten kunna)

Efter godkänd kurs ska studenten kunna:

Kunskap och förståelse
  • diskutera de viktigaste teknologiska aspekterna vid design och implementering avsystem för analys av storskaliga data,
  • diskutera indexstrukturer och nyttan med dem,
  • beskriva datamodeller och mjukvarustandarder för internetdelning av data.
Färdigheter och förmåga
  • implementera tillämpningar för att transformera och analysera storskaliga data med hjälp av tillämpbara mjukvaruramverk,,
  • tillgängliggöra och utnyttja strukturerade data över internet med hjälp av lämpliga datamodeller och mjukvaruverktyg.
Värderingsförmåga och förhållningssätt
  • föreslå lämpliga tekniska infrastrukturer för dataanalytiska uppgifter och argumentera fördelar och nackdelar med dessa,
  • diskutera metoder för parallellism och återställning i databassystem,
  • diskutera effektiviteten för sökfrågeplaner,
  • diskutera storskalig datahantering utifrån ett etiskt perspektiv.

Innehåll

Framför allt kommer kursen att innefatta
  • en överblick av datorarkitekturer,  algoritmiska tillvägagångssätt,  och högpresterande beräkningsinfrastrukturer, med ett fokus på de begränsningar som finns vid behandling av storskaliga data,
  • en inledning till de relevanta ramverken för bearbetning av data med hjälp av datorkluster,
  • implementering av dataanalysverktyg på ett kluster med hjälp av Python och lämpliga mjukvaruramverk,
  • indexstrukturer, hantering och optimering av sökfrågor; parallellism, återställning,
  • en överblick över ickerelationella databasteknologier,
  • Semantic Web och besläktade teknologier,
  • en översikt över etiska frågor inom storskalig datahantering, t.ex. när det gäller licenser, tillgänglighet, anonymisering.

Organisation

Föreläsningar, datorlaborationer och övningar.

Litteratur

Kurslitteratur kommer att publiceras senast 8 veckor innan kursstart.

Examination inklusive obligatoriska moment

Kursen examineras genom en individuell skriftlig salstentamen, samt obligatoriska skriftliga inlämningsuppgifter som redovisas genom rapportinlämning, varav vissa kommer att lösas individuellt och vissa i grupper på upp till 4 studenter. Det kommer att ges frivilliga individuella uppgifter som ger bonuspoäng på tentamen. Dessa bonuspoäng är giltiga under ett helt läsår.

Kursplanen innehåller ändringar

  • Ändring gjord på tentamen:
    • 2019-09-18: Inställd Ändrat till inställd av Rickard Johansson
      [2019-10-11 4,0 hp, 0119] Inställt
    • 2019-09-04: Plats Plats ändrat från Johanneberg till M av grunnet
      [2019-10-11 4,0 hp, 0119]
  • Ändring gjord på kurstillfälle:
    • 2019-11-21: Max antal deltagare Max antal deltagare ändrat från 20 till 30 av UBS
      [Kurstillfälle 1]