Kursplan
Introduktion
Översikt över "Open Studio for Big Data"-funktioner och arkitektur
Inställning av Open Studio for Big Data
Navigering i gränssnittet
Förståelse för Big Data-komponenter och kopplingar
Anslutning till en Hadoop-kluster
Läsning och skrivning av data
Bearbetning av data med Hive och MapReduce
Analys av resultaten
Förbättring av stora datamängders kvalitet
Bygga en pipeline för stora datamängder
Hantering av användare, grupper, roller och projekt
Distribuera Open Studio till produktion
Övervakning av Open Studio
Felsökning
Sammanfattning och slutsats
Krav
- En förståelse för relationella databaser
- En förståelse för datalager
- En förståelse för ETL (Extract, Transform, Load)-begrepp
Målgrupp
- Business intelligence-professionals
- Databasprofessionals
- SQL-utvecklare
- ETL-utvecklare
- Lösteknikerarkitekter
- Datalagerarkitekter
- Datalagerprofessionals
- Systemadministratörer och integratörer
Vittnesmål (5)
De levande exempelen
Ahmet Bolat - Accenture Industrial SS
Kurs - Python, Spark, and Hadoop for Big Data
Maskintolkat
mycket interaktivt...
Richard Langford
Kurs - SMACK Stack for Data Science
Maskintolkat
Tillräckligt praktiskt, utbildaren är kunskapssam
Chris Tan
Kurs - A Practical Introduction to Stream Processing
Maskintolkat
Få lära dig Spark Streaming, Databricks och AWS Redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Kurs - Apache Spark in the Cloud
Maskintolkat
övningsuppgifter
Pawel Kozikowski - GE Medical Systems Polska Sp. Zoo
Kurs - Python and Spark for Big Data (PySpark)
Maskintolkat