Introduktion till digitala resurser

Denna kurs syftar till att ge doktorander verktygen för att effektivare använda digitala resurser och tekniker för att underlätta forskning och forskningskvalitet. Läroplanen kommer att behandla verktyg, tips och tricks som är industristandard både inom och utanför forskning. Dessa ämnen kommer att undervisas av experter på Chalmers e-Commons, Chalmers digitala forskningsinfrastruktur.

Varje ämne lärs ut som en separat modul och tar en hel dag. Varje modul undervisas på introduktionsnivå, där ämnet introduceras och eleven hjälps över det första hindret att sätta sig in i ämnet.

Det är totalt 12 moduler varav 10 moduler krävs för att bli godkänd på kursen.

Om du formellt vill inkludera kursen i din forskarutbildning måste du diskutera detta med din handledare.   

Planering

Denna kurs kommer att äga rum i veckomoduler under hösten 2024. Varje modul varar en hel dag, och den första kommer att undervisas fredagen den 20 september. Den sista modulen äger rum fredagen den 6 december.

För mer information, och anmälan, kontakta Leon Boschman (leon.boschman@chalmers.se). 

Moduler

Denna kurs består av 12 moduler: 

Unix Shell (Bash) 

Unix-terminalen är ett kraftfullt verktyg som ofta används inom beräkningsvetenskap. De flesta superdatorer tillåter endast en terminalmiljö och inget grafiskt användargränssnitt. Att ha erfarenhet av att använda terminalen är viktigt för att arbeta med HPC-anläggningar. Det är också nödvändigt för att köra lite mer avancerade analysskript.

Efter modulen kommer eleverna att känna till några grundläggande kommandon i Bash och hur man navigerar i en terminal.

Grundläggande python

Python är ett allsidigt programmeringsspråk som används i stor utsträckning inom området dataanalys, vetenskaplig beräkning och maskininlärning.  

Denna modul syftar till att lära eleverna grunderna i Python och hjälpa dem att sätta upp en Python-miljö på sin egen bärbara dator. 

De kommer att göra detta i en nybörjarvänlig Jupyter Notebook-miljö. 

Efter modulen kommer eleverna skriva och köra en liten Jupyter Notebook som använder funktioner, listor, dictionaries etc.

Strukturerad dataanalys   

I denna modul kommer studenterna att lära sig hur man skriver en återanvändbar dataanalys i Python. De kommer att lära sig grunderna i pandor, numpy och scipy för att arbeta med tabell- och numeriska data. Dessutom kommer de att lära sig grunderna för att skapa ett återanvändbart arbetsflöde.

Datavisualisering

Eleverna kommer att få lära sig olika strategier för datavisualisering. De kommer att lära sig om visualiseringsprinciper och viss teori, bästa praxis och hur man gör visualiseringar tillgängliga för personer med till exempel färgblindhet.

De kommer också att lära sig hur man gör visualiseringar i python med branschstandard plotting-bibliotek.

Vi kommer också att presentera InfraVis, den nationella infrastrukturen för datavisualisering, och hur man ansöker om visualiseringsstöd.

Högpresterande datorsystem  

I den här modulen kommer eleverna att lära sig skillnaden mellan datoranvändning på sin bärbara dator och på ett högpresterande datorkluster.

De kommer att lära sig om strategier för att utnyttja HPC-kluster optimalt och hur de kan använda HPC i sitt eget forskningsprojekt.

Forskningsdatahantering 

Studenterna kommer att lära sig om bästa praxis för hantering av forskningsdata. Detta kommer att innefatta ett tillvägagångssätt för att göra forskningsdata FAIR (finnbar, tillgänglig, interoperabel, återanvändbar). De kommer också att lära sig om GDPR-efterlevnad och datalivscykelhantering. 

Versionskontroll och kodsamarbeten

Eleverna kommer att lära sig om git versionskontroll, som är ett decentraliserat versionskontrollsystem som ofta används för källkod och andra vanliga textfiler. Dessutom kommer de att lära sig om versionskontroll i en samarbetsmiljö där flera forskare arbetar med samma filer. 

Skriva läsbar kod 

Här diskuterar vi hur eleverna kan se till att koden de skriver är lättläst, med en tydlig och lätt att följa logik. Detta kommer att hjälpa till att få konsekventa resultat från dataanalyser. 

Använda Python Notebooks för kommunikation

Anteckningsböcker är ett utmärkt verktyg för att kommunicera vetenskapliga och vetenskapliga resultat. I den här modulen kommer vi att lära eleverna hur man använder de interaktiva funktionerna i Jupyter notebook som ett effektivt kommunikationsmedel.  

Digital projektledning

I denna modul kommer studenterna att lära sig hur man effektivt arbetar med digitala projekt, speciellt anpassade för vetenskaplig dataanalys. Vi kommer att diskutera användningen av mjukvaruversionering, effektivt samarbete och att se till att projektet kan tas över av kollegor. 

Introduktion till maskininlärning & AI

Vi diskuterar grunderna i maskininlärning och AI, och vad olika typer av problem kan lösas med dessa tekniker. Vi kommer också att diskutera hur dessa metoder skulle kunna användas inom sina egna områden.

AI:s etik

Användningen av AI, och särskilt generativ AI, kommer med en mängd etiska dilemman. Vi kommer att göra eleverna medvetna om dessa dilemman och diskutera hur de tillämpar sitt eget arbete.