Tack för att du skickade din fråga! En av våra teammedlemmar kontaktar dig snart.
Tack för att du skickade din bokning! En av våra teammedlemmar kontaktar dig snart.
Kursplan
Inledning
- Förstå vikten av dataprep i analys och maskininlärning
- Datapreppipeline och dess roll i datalivet
- Utforska vanliga utmaningar med rådata och deras påverkan på analys
Datinsamling och erhörande
- Datakällor: databaser, API:er, kalkylblad, textfiler och mer
- Tekniker för datinsamling och säkerställandet av datakvalitet under insamlingen
- Datinsamling från olika källor
Datarensningstekniker
- Identifiera och hantera saknade värden, utliggare och inkonsekvenser
- Hantera dubletter och fel i datasättet
- Rensa verkliga datasätt
Datatransformation och standardisering
- Data-normaliserings- och standardiserningstekniker
- Hantering av kategoriska data: kodning, intervallindelning och funktionsteckning
- Transformera rådata till användbara format
Datatillgodoseende och sammanfogning
- Sammanfoga och kombinera datasätt från olika källor
- Lös datakonflikter och anpassa datatyper
- Tekniker för datasammanstegning och konsolidering
Datakvalitetsgarantier
- Metoder för att säkerställa datakvalitet och integritet genom hela processen
- Implementera kvalitetskontroller och verifieringsrutiner
- Fallstudier och praktiska tillämpningar av datakvalitetsgarantier
Dimensionstegenhet och funktionsutval
- Förstå behovet av dimensionstegenhet
- Tekniker som PCA, funktionsutval och redukeringstrategier
- Implementera tekniker för dimensionstegenhet
Sammanfattning och nästa steg
Krav
- Grundläggande förståelse för datakoncept
Målgrupp
- Dataanalytiker
- Databasadministratörer
- IT-professionals
14 timmar
Vittnesmål (2)
It's a hands-on session.
Vorraluck Sarechuer - Total Access Communication Public Company Limited (dtac)
Kurs - Talend Open Studio for ESB
I generally enjoyed the knowledge of the trainer.