Kursplan

Införandet

  • Förstå vikten av dataförberedelse i analys och maskininlärning
  • Pipeline för förberedelse av data och dess roll i datalivscykeln
  • Utforska vanliga utmaningar i rådata och inverkan på analys

Insamling och inhämtning av data

  • Datakällor: databaser, API:er, kalkylblad, textfiler med mera
  • Tekniker för att samla in data och säkerställa datakvalitet under insamlingen
  • Samla in data från olika källor

Data Cleaning Tekniker

  • Identifiera och hantera saknade värden, extremvärden och inkonsekvenser
  • Hantera dubbletter och fel i datauppsättningen
  • Rensa verkliga datauppsättningar

Dataomvandling och standardisering

  • Tekniker för datanormalisering och standardisering
  • Kategorisk datahantering: kodning, gruppering och funktionsframställning
  • Omvandla rådata till användbara format

Data Integration och Aggregering

  • Sammanfoga och kombinera datauppsättningar från olika källor
  • Lösa datakonflikter och justera datatyper
  • Tekniker för aggregering och konsolidering av data

Data Quality Försäkran

  • Metoder för att säkerställa datakvalitet och integritet genom hela processen
  • Genomförande av kvalitetskontroller och valideringsförfaranden
  • Fallstudier och praktiska tillämpningar av kvalitetssäkring av data

Minskning av dimensionalitet och funktionsval

  • Förstå behovet av dimensionsreduktion
  • Tekniker som PCA, funktionsval och minskningsstrategier
  • Implementera tekniker för dimensionsreduktion

Sammanfattning och nästa steg

Krav

    Grundläggande förståelse för databegrepp

Publik

    Dataanalytiker Database administratörer IT-proffs
 14 timmar

Antal deltagare



Price per participant

Vittnesmål (4)

Relaterade Kategorier