Kursplan för Tekniker för storskalig datahantering

Kursplanen innehåller ändringar
Se ändringar

Kursplan fastställd 2020-02-20 av programansvarig (eller motsvarande).

Kursöversikt

  • Engelskt namnTechniques for large-scale data
  • KurskodDAT346
  • Omfattning7,5 Högskolepoäng
  • ÄgareMPDSC
  • UtbildningsnivåAvancerad nivå
  • HuvudområdeDatateknik, Informationsteknik
  • InstitutionDATA- OCH INFORMATIONSTEKNIK
  • BetygsskalaTH - Mycket väl godkänd (5), Väl godkänd (4), Godkänd (3), Underkänd

Kurstillfälle 1

  • Undervisningsspråk Engelska
  • Anmälningskod 87112
  • Max antal deltagare100
  • Blockschema
  • Sökbar för utbytesstudenterNej
  • Endast studenter med kurstillfället i programplan.

Poängfördelning

0119 Tentamen 4 hp
Betygsskala: TH
4 hp
  • 02 Jun 2021 fm J
  • 09 Okt 2020 fm J
  • 20 Aug 2021 em J
0219 Inlämningsuppgift 3,5 hp
Betygsskala: UG
3,5 hp

I program

Examinator

Gå till kurshemsidan (Öppnas i ny flik)

Behörighet

Grundläggande behörighet för avancerad nivå
Sökande med en programregistrering på ett program där kursen ingår i programplanen undantas från ovan krav.

Särskild behörighet

Engelska 6
Sökande med en programregistrering på ett program där kursen ingår i programplanen undantas från ovan krav.

Kursspecifika förkunskaper

Det krävs krävs minst 15 hp i programmering, samt en kurs i databaser om minst 7,5 hp, t. ex. TDA357 Databaser.

Syfte

Kursens mål är att fördjupa studenternas kunskaper och färdigheter inom den tekniska sidan av data science, inklusive de relevanta datamodellerna, samt lämpliga mjukvaru- och hårdvarumiljöer.

Lärandemål (efter fullgjord kurs ska studenten kunna)

Efter godkänd kurs ska studenten kunna:

Kunskap och förståelse
  • diskutera de viktigaste teknologiska aspekterna vid design och implementering avsystem för analys av storskaliga data,
  • diskutera indexstrukturer och nyttan med dem,
  • beskriva datamodeller och mjukvarustandarder för internetdelning av data.
Färdigheter och förmåga
  • implementera tillämpningar för att transformera och analysera storskaliga data med hjälp av tillämpbara mjukvaruramverk,,
  • tillgängliggöra och utnyttja strukturerade data över internet med hjälp av lämpliga datamodeller och mjukvaruverktyg.
Värderingsförmåga och förhållningssätt
  • föreslå lämpliga tekniska infrastrukturer för dataanalytiska uppgifter och argumentera fördelar och nackdelar med dessa,
  • diskutera metoder för parallellism och återställning i databassystem,
  • diskutera effektiviteten för sökfrågeplaner,
  • diskutera storskalig datahantering utifrån ett etiskt perspektiv.

Innehåll

Framför allt kommer kursen att innefatta
  • en överblick av datorarkitekturer,  algoritmiska tillvägagångssätt,  och högpresterande beräkningsinfrastrukturer, med ett fokus på de begränsningar som finns vid behandling av storskaliga data,
  • en inledning till de relevanta ramverken för bearbetning av data med hjälp av datorkluster,
  • implementering av dataanalysverktyg på ett kluster med hjälp av Python och lämpliga mjukvaruramverk,
  • indexstrukturer, hantering och optimering av sökfrågor; parallellism, återställning,
  • en överblick över ickerelationella databasteknologier,
  • Semantic Web och besläktade teknologier,
  • en översikt över etiska frågor inom storskalig datahantering, t.ex. när det gäller licenser, tillgänglighet, anonymisering.

Organisation

Föreläsningar, datorlaborationer och övningar.

Litteratur

Kurslitteratur kommer att publiceras senast 8 veckor innan kursstart.

Examination inklusive obligatoriska moment

Kursen examineras genom en individuell skriftlig salstentamen, samt obligatoriska skriftliga inlämningsuppgifter som redovisas genom rapportinlämning, varav vissa kommer att lösas individuellt och vissa i grupper på upp till 4 studenter. Det kommer att ges frivilliga individuella uppgifter som ger bonuspoäng på tentamen. Dessa bonuspoäng är giltiga under ett helt läsår.

Kursplanen innehåller ändringar

  • Ändring gjord på kurstillfälle:
    • 2020-11-05: Max antal deltagare Max antal deltagare ändrat från 30 till 100 av PA
      [Kurstillfälle 1]
    • 2020-01-13: Examinator Examinator ändrat från Alexander Schliep (schliep) till Graham Kemp (kemp) av Viceprefekt
      [Kurstillfälle 1]