Stockholms universitet
Go to this page on our english site

Statistik och dataanalys för data- och systemvetenskap

Kursen ger kunskaper om klassiska och moderna statistiska metoder för dataanalys samt dess teoretiska grunder. Centralt är förståelse för hela analysprocessen från datakällor och datainsamling, datahantering, estimering, inferens, prediktion och praktiska tillämpningar. Stor vikt läggs vid praktisk datahantering, visualisering och analys genom programmering i R. Genomgående läggs vikt vid ett kritiskt förhållningssätt vid användning av statistiska metoder och tolkning av resultat.

Kursen behandlar;

  • Insamlingsmetoder och datakällor
  • Olika datatyper såsom numeriska och kategoriska men även text, bild och spatiala data
  • Grafiska och numeriska beskrivningar av data
  • Regressionsanalys; modeller med en och flera förklaringsvariabler, antaganden, skattning, inferens, prediktion, modellutvärdering. Tidsserieanalys och prognoser. Kopplingen till moderna dataanalysmetoder såsom maskininlärning tas upp.
  • Sannolikhetsteori; grundläggande begrepp, sannolikhetsmodeller, diskreta och kontinuerliga slumpvariabler, sannolikhetsfördelningar, väntevärde och varians, kovarians och korrelation, några olika standardfördelningar, linjärkombinationer av flera slumpvariabler, samplingfördelningar och centrala gränsvärdessatsen.
  • Statistisk inferens; punkt- och intervallskattning, hypotestest, p-värden och prediktion och introduktion till likelihood.
  • Kursupplägg

    Kursen ingår i Masterprogrammet "data science, statistik och beslutsanalys, 120 hp", som ges av Institutionen för data- och systemvetenskap.

  • Schema

    Schema finns tillgängligt senast en månad före kursstart. Vi rekommenderar inte utskrift av scheman då vissa ändringar kan ske. Vid kursstart meddelar utbildningsansvarig institution var du hittar ditt schema under utbildningen.
  • Kurslitteratur

    Observera att kurslitteraturen kan ändras fram till två månader före kursstart.