Kursplan

Inledning

  • Förstå vikten av dataprep i analys och maskininlärning
  • Datapreppipeline och dess roll i datalivet
  • Utforska vanliga utmaningar med rådata och deras påverkan på analys

Datinsamling och erhörande

  • Datakällor: databaser, API:er, kalkylblad, textfiler och mer
  • Tekniker för datinsamling och säkerställandet av datakvalitet under insamlingen
  • Datinsamling från olika källor

Datarensningstekniker

  • Identifiera och hantera saknade värden, utliggare och inkonsekvenser
  • Hantera dubletter och fel i datasättet
  • Rensa verkliga datasätt

Datatransformation och standardisering

  • Data-normaliserings- och standardiserningstekniker
  • Hantering av kategoriska data: kodning, intervallindelning och funktionsteckning
  • Transformera rådata till användbara format

Datatillgodoseende och sammanfogning

  • Sammanfoga och kombinera datasätt från olika källor
  • Lös datakonflikter och anpassa datatyper
  • Tekniker för datasammanstegning och konsolidering

Datakvalitetsgarantier

  • Metoder för att säkerställa datakvalitet och integritet genom hela processen
  • Implementera kvalitetskontroller och verifieringsrutiner
  • Fallstudier och praktiska tillämpningar av datakvalitetsgarantier

Dimensionstegenhet och funktionsutval

  • Förstå behovet av dimensionstegenhet
  • Tekniker som PCA, funktionsutval och redukeringstrategier
  • Implementera tekniker för dimensionstegenhet

Sammanfattning och nästa steg

Krav

  • Grundläggande förståelse för datakoncept

Målgrupp

  • Dataanalytiker
  • Databasadministratörer
  • IT-professionals
 14 timmar

Antal deltagare


Pris per deltagare

Vittnesmål (2)

Kommande Kurser

Relaterade Kategorier