Dataprep Fundamentals Träningskurs
Dataprep är en smart datatjänst som underlättar visuell utforskning, rensning och organisering av både strukturerad och ostrukturerad data, för att göra den redo för analys, rapportering och användning i maskininlärningsapplikationer.
Den här instruktörsledda, liveutbildningen (online eller på plats) riktar sig till IT-proffs på nybörjare till medelnivå som vill få de kunskaper och praktiska färdigheter som krävs för att effektivt förbereda data för analys, vilket säkerställer noggrannhet, konsekvens och tillförlitlighet i olika datauppsättningar.
I slutet av denna utbildning kommer deltagarna att kunna:
- Få en grundlig förståelse för databeredningens betydelse för att säkerställa högkvalitativ, tillförlitlig data för analys och modelleringsändamål. Skaffa praktiska kunskaper i datainsamling, rengöring, transformation och integrationstekniker med hjälp av datauppsättningar från verkliga världen. Utveckla förmågan att identifiera och hantera datarelaterade utmaningar, diskrepanser och inkonsekvenser på ett effektivt sätt.
Kursens format
- Interaktiv föreläsning och diskussion. Mycket övningar och övningar. Praktisk implementering i en live-lab-miljö.
Kursanpassningsalternativ
- För att begära en skräddarsydd utbildning för denna kurs, vänligen kontakta oss för att ordna.
Kursplan
Införandet
- Förstå vikten av dataförberedelse i analys och maskininlärning
- Pipeline för förberedelse av data och dess roll i datalivscykeln
- Utforska vanliga utmaningar i rådata och inverkan på analys
Insamling och inhämtning av data
- Datakällor: databaser, API:er, kalkylblad, textfiler med mera
- Tekniker för att samla in data och säkerställa datakvalitet under insamlingen
- Samla in data från olika källor
Data Cleaning Tekniker
- Identifiera och hantera saknade värden, extremvärden och inkonsekvenser
- Hantera dubbletter och fel i datauppsättningen
- Rensa verkliga datauppsättningar
Dataomvandling och standardisering
- Tekniker för datanormalisering och standardisering
- Kategorisk datahantering: kodning, gruppering och funktionsframställning
- Omvandla rådata till användbara format
Data Integration och Aggregering
- Sammanfoga och kombinera datauppsättningar från olika källor
- Lösa datakonflikter och justera datatyper
- Tekniker för aggregering och konsolidering av data
Data Quality Försäkran
- Metoder för att säkerställa datakvalitet och integritet genom hela processen
- Genomförande av kvalitetskontroller och valideringsförfaranden
- Fallstudier och praktiska tillämpningar av kvalitetssäkring av data
Minskning av dimensionalitet och funktionsval
- Förstå behovet av dimensionsreduktion
- Tekniker som PCA, funktionsval och minskningsstrategier
- Implementera tekniker för dimensionsreduktion
Sammanfattning och nästa steg
Krav
- Grundläggande förståelse för databegrepp
Publik
- Dataanalytiker Database administratörer IT-proffs
Open Training Courses require 5+ participants.
Dataprep Fundamentals Träningskurs - Booking
Dataprep Fundamentals Träningskurs - Enquiry
Dataprep Fundamentals - Consultancy Enquiry
Consultancy Enquiry
Vittnesmål (2)
It's a hands-on session.
Vorraluck Sarechuer - Total Access Communication Public Company Limited (dtac)
Kurs - Talend Open Studio for ESB
I generally enjoyed the knowledge of the trainer.
Eddyfi Technologies
Kurs - GDPR Workshop
Upcoming Courses
Relaterade Kurser
NetApp DATAPROT9 – ONTAP Data Protection Administration
21 timmarDenna instruktörledade, live-träningen i Sverige (online eller på plats) är avsedd för mellanliggande IT-professioneller som vill konfigurera och hantera dataskyddsmekanismer med hjälp av NetApp ONTAP teknologier.
Genom denna träning kommer deltagarna att kunna:
- Förstå ONTAP-dataskyddsarkitektur och koncept.
- Konfigurera och hantera Snapshot-kopior för snabb datåterställning.
- Implementera och övervaka SnapMirror för datareplication.
- Använda SnapVault och andra ONTAP-funktioner för säkerhetskopia och arkiveringsscenarier.
EBX5 for Developers
21 timmarDenna instruktörsledda, liveutbildning i Sverige (online eller på plats) riktar sig till utvecklare som vill använda EBX5 (TIBCO EBX) för att möjliggöra en Master Data Management-lösning inom sin organisation.
I slutet av denna utbildning kommer deltagarna att kunna:
- Tolka krav och utforma en MDM-lösning.
- Möjliggöra hantering och integration av masterdata.
- Integrera och överför data över flera system.
- Importera data till EBX5 med hjälp av matchnings- och sammanfogningslogik.
- Designa, skapa och dokumentera en datamodell som adresserar deras organisations affärskrav.
- Integrera EBX5 med tredjepartstjänster.
GDPR Workshop
7 timmarDenna kurs är för personer som letar efter en kort beskrivning av GDPR - Allmänna dataskyddsbestämmelserna som kommer ut den 25 maj 2018 Det här är perfekt för chefer, avdelningschefer och anställda som behöver förstå grunderna för GDPR .
How to Audit GDPR Compliance
14 timmarDenna kurs utvecklas främst med inriktning på revisorer och andra administrativa roller som ansvariga för att säkerställa att deras kontrollsystem och IT-miljö överensstämmer med dominerande lagar och föreskrifter. Kursen kommer att börja med att ge förståelse för nyckelbegrepp GDPR samt hur det är kommer att påverka det arbete som utförs av revisorer. Deltagarna kommer också att utforska dataämnen rättigheter, datakontroller och processorer obligationer, och verkställighet och överensstämmelse begrepp i sammanhanget i förordningen. Utbildningen kommer också att omfatta revisionsprogrammet som tillhandahålls av ISACA som gör det möjligt för revisorer att granska GDPR styrning och responsmekanismer samt stödja processer som kan hjälpa till att hantera risken förknippad med bristande överensstämmelse.
GDPR Advanced
21 timmarDetta är mer indepth och skulle vara för dem som arbetar mycket med GDPR och som kan utnämnas till GDPR-laget Detta skulle vara idealiskt för IT-, personal- och marknadsföringsansvariga och de kommer att göra en omfattande hantering av GDPR .
NetApp ONTAP9ADM – ONTAP Cluster Administration
21 timmarDenna instruktörledade, live-träningen i Sverige (online eller på plats) är avsedd för mellanliggande IT-professionella som vill konfigurera, hantera och felsöka NetApp ONTAP kluster.
Genom denna träning kommer deltagarna att kunna:
- Installera och konfigurera NetApp ONTAP kluster.
- Hantera lagringsresurser och nätverksinställningar.
- Implementera säkerhets- och åtkomstkontrollpolicyer.
- Övervaka och felsöka ONTAP-klustermiljöer.
Oracle GoldenGate
14 timmarDenna instruktörsledda, liveutbildning i Sverige (online eller på plats) riktar sig till systemadministratörer och utvecklare som vill konfigurera, distribuera och hantera Oracle GoldenGate för datatransformation.
I slutet av denna utbildning kommer deltagarna att kunna:
- Installera och konfigurera Oracle GoldenGate.
- Förstå replikering av Oracle-databaser med verktyget Oracle GoldenGate.
- Förstå Oracle GoldenGate arkitekturen.
- Konfigurera och utför en databasreplikering och migrering.
- Optimera Oracle GoldenGate prestanda och felsök problem.
Personal Data Protection Officer - Basic Level
21 timmarSyftet med utbildningen
- Att bekanta publiken med systematiserade, omfattande frågor om hur personuppgiftsskyddet fungerar på grundval av polsk och europeisk lag
- Ge praktisk kunskap om de nya reglerna för behandling av personuppgifter
- Presentation av områdena med de största juridiska riskerna i samband med ikraftträdandet av GDPR
- Praktisk förberedelse för självständigt utförande av en personlig Data Protection tjänstemans uppgifter
Personal Data Protection Officer - Advanced Level
14 timmarSyftet med utbildningen
- Att få praktisk kunskap om hur man utför inspektörens uppgifter
- Att få praktisk kunskap om hur man granskar och hur man bedömer risker
- Ge praktisk kunskap om de nya reglerna för behandling av personuppgifter
Sensor Fusion Algorithms
14 timmarSensor Fusion är kombinationen och integreringen av data från flera sensorer för att ge en mer exakt, tillförlitlig och kontextuell bild av data.
Sensor Fusion Implementeringar kräver algoritmer för att filtrera och integrera olika datakällor.
Publik
Kursen riktar sig till ingenjörer, programmerare och arkitekter som arbetar med multisensorimplementeringar.
Talend Administration Center (TAC)
14 timmarDenna instruktörsledda, liveutbildning i Sverige (online eller på plats) riktar sig till systemadministratörer, datavetare och affärsanalytiker som vill sätta upp Talend Administration Center för att distribuera och hantera organisationens roller och uppgifter.
I slutet av denna utbildning kommer deltagarna att kunna:
- Installera och konfigurera Talend Administration Center.
- Förstå och implementera Talend ledningsgrunderna.
- Bygg, distribuera och kör affärsprojekt eller uppgifter i Talend.
- Övervaka datauppsättningarnas säkerhet och utveckla affärsrutiner baserade på TAC-ramverket.
- Få en bredare förståelse av big data-applikationer.
Talend Big Data Integration
28 timmarDenna instruktörsledda, liveutbildning i Sverige (online eller på plats) riktar sig till tekniska personer som vill distribuera Talend Open Studio for Big Data för att förenkla processen att läsa och bryta igenom Big Data.
I slutet av denna utbildning kommer deltagarna att kunna:
- Installera och konfigurera Talend Open Studio for Big Data.
- Anslut till Big Data-system som Cloudera, HortonWorks, MapR, Amazon EMR och Apache.
- Förstå och konfigurera Open Studios big data-komponenter och kontakter.
- Konfigurera parametrar för att automatiskt generera MapReduce-kod.
- Använd Open Studios dra-och-släpp-gränssnitt för att köra Hadoop-jobb.
- Prototyp av big data pipelines.
- Automatisera big data integrationsprojekt.
Talend Cloud
7 timmarDenna instruktörsledda, liveutbildning i Sverige (online eller på plats) riktar sig till dataadministratörer och utvecklare som vill hantera, övervaka och driva dataintegreringsprocesser med hjälp av Talend Cloud tjänster.
I slutet av denna utbildning kommer deltagarna att kunna:
- Navigera i Talend Management Console för att hantera användare och roller på plattformen.
- Utvärdera data för att hitta och förstå relevanta datauppsättningar.
- Skapa en pipeline för att bearbeta och övervaka data i vila eller i aktion.
- Förbered data för analys för att generera insikter som är relevanta för verksamheten.
Talend Data Stewardship
14 timmarDenna instruktörsledda, liveutbildning i Sverige (online eller på plats) riktar sig till dataanalytiker från nybörjare till medelnivå som vill fördjupa sin förståelse och färdigheter i att hantera och förbättra datakvaliteten med hjälp av Talend Data Stewardship.
I slutet av denna utbildning kommer deltagarna att kunna:
- Få en övergripande förståelse för rollen som dataförvaltning för att upprätthålla datakvalitet. Använd Talend Data Stewardship för att hantera datakvalitetsuppgifter. Skapa, tilldela och hantera uppgifter inom Talend Data Stewardship, inklusive anpassning av arbetsflöden. Använd verktygets rapporterings- och övervakningsfunktioner för att spåra datakvalitet och förvaltningsinsatser.
Talend Open Studio for ESB
21 timmarI denna instruktörsledda, liveutbildning i Sverige kommer deltagarna att lära sig hur man använder Talend Open Studio for ESB för att skapa, ansluta, förmedla och hantera tjänster och deras interaktioner.
I slutet av denna utbildning kommer deltagarna att kunna
- Integrera, förbättra och leverera ESB-tekniker som enskilda paket i en mängd olika distributionsmiljöer.
- Förstå och använda Talend Open Studios mest använda komponenter.
- Integrera valfri applikation, databas, API eller webbtjänster.
- Integrera heterogena system och applikationer sömlöst.
- Bädda in befintliga Java-kodbibliotek för att utöka projekt.
- Utnyttja gemenskapskomponenter och kod för att utöka projekt.
- Integrera snabbt system, applikationer och datakällor i en dra-och-släpp Eclipse-miljö.
- Minska utvecklingstiden och underhållskostnaderna genom att generera optimerad, återanvändbar kod.