Samza for Stream Processing Träningskurs
Apache Samza är en öppen källkod, nästan realtid, asynkron beräkningsram för strömbehandling. Den använder Apache Kafka för meddelanden och Apache Hadoop YARN för feltolerans, processorisolering, säkerhet och resurshantering.
Den här instruktörsledda, live-utbildningen introducerar principerna bakom meddelandesystem och distribuerad strömbearbetning, samtidigt som deltagarna går genom skapandet av ett exempel på Samza-baserat projekt och jobbutförande.
I slutet av denna träning kommer deltagarna att kunna:
- Använd Samza för att förenkla koden som behövs för att producera och konsumera meddelanden.
- Koppla bort hanteringen av meddelanden från en applikation.
- Använd Samza för att implementera asynkron beräkning nära realtid.
- Använd strömbehandling för att ge en högre abstraktionsnivå över meddelandesystem.
Publik
- utvecklare
Kursformat
- Delföreläsning, delvis diskussion, övningar och tung praktisk övning
Kursplan
För att begära en skräddarsydd kursöversikt för denna utbildning, vänligen kontakta oss.
Krav
- En förståelse för Scala och Java
- En förståelse för Apache Kafka och GARN
Open Training Courses require 5+ participants.
Samza for Stream Processing Träningskurs - Booking
Samza for Stream Processing Träningskurs - Enquiry
Samza for Stream Processing - Consultancy Enquiry
Vittnesmål (5)
Sufficient hands on, trainer is knowledgable
Chris Tan
Kurs - A Practical Introduction to Stream Processing
During the exercises, James explained me every step whereever I was getting stuck in more detail. I was completely new to NIFI. He explained the actual purpose of NIFI, even the basics such as open source. He covered every concept of Nifi starting from Beginner Level to Developer Level.
Firdous Hashim Ali - MOD A BLOCK
Kurs - Apache NiFi for Administrators
Trainer's preparation & organization, and quality of materials provided on github.
Mateusz Rek - MicroStrategy Poland Sp. z o.o.
Kurs - Impala for Business Intelligence
That I had it in the first place.
Peter Scales - CACI Ltd
Kurs - Apache NiFi for Developers
Recalling/reviewing keypoints of the topics discussed.
Paolo Angelo Gaton - SMS Global Technologies Inc.
Kurs - Building Stream Processing Applications with Kafka Streams
Upcoming Courses
Relaterade Kurser
Spark Streaming with Python and Kafka
7 timmarDenna instruktörsledda, liveutbildning i Sverige (online eller på plats) riktar sig till dataingenjörer, datavetare och programmerare som vill använda Spark Streaming funktioner för att bearbeta och analysera realtidsdata.
I slutet av denna utbildning kommer deltagarna att kunna använda Spark Streaming för att bearbeta livedataströmmar för användning i databaser, filsystem och live-instrumentpaneler.
Confluent KSQL
7 timmarDenna instruktörsledda, liveutbildning i Sverige (online eller på plats) riktar sig till utvecklare som vill implementera Apache Kafka strömbehandling utan att skriva kod.
I slutet av denna utbildning kommer deltagarna att kunna:
- Installera och konfigurera Confluent KSQL.
- Konfigurera en pipeline för strömbehandling med endast SQL-kommandon (ingen Java- eller Python-kodning).
- Utför datafiltrering, transformationer, aggregering, sammanfogningar, fönster och sessionsisering helt och hållet i SQL.
- Designa och distribuera interaktiva, kontinuerliga frågor för streaming av ETL och realtidsanalys.
Apache Ignite for Developers
14 timmarDen här instruktörsledda, liveutbildningen i Sverige (online eller på plats) riktar sig till utvecklare som vill lära sig principerna bakom beständig och ren minneslagring när de går igenom skapandet av ett exempel på in-memory computing-projekt.
I slutet av denna utbildning kommer deltagarna att kunna:
- Använd Ignite för in-memory, on-disk persistens samt en rent distribuerad in-memory databas. Uppnå uthållighet utan att synkronisera data tillbaka till en relationsdatabas. Använd Ignite för att utföra SQL och fördelade sammanfogningar. Förbättra prestandan genom att flytta data närmare CPU:n, använda RAM som lagring. Sprid datamängder över ett kluster för att uppnå horisontell skalbarhet. Integrera Ignite med RDBMS, NoSQL, Hadoop och maskininlärningsprocessorer.
Unified Batch and Stream Processing with Apache Beam
14 timmarApache Beam är en enhetlig programmeringsmodell med öppen källkod för att definiera och utföra parallella pipelines för databehandling. Dess kraft ligger i dess förmåga att köra både batch- och streamingpipelines, där exekveringen utförs av en av Beams stödda distribuerade bearbetningsbackends: Apache Apex, Apache Flink, Apache Spark och Google Cloud Dataflow. Apache Beam är användbar för ETL-uppgifter (Extrahera, Transformera och Ladda) som att flytta data mellan olika lagringsmedier och datakällor, omvandla data till ett mer önskvärt format och ladda data till ett nytt system.
I denna instruktörsledda, live-utbildning (på plats eller på distans) kommer deltagarna att lära sig hur man implementerar Apache Beam SDK:er i en Java- eller Python-applikation som definierar en databehandlingspipeline för att bryta ner en stor datamängd i mindre bitar för oberoende, parallell bearbetning.
I slutet av denna utbildning kommer deltagarna att kunna:
- Installera och konfigurera Apache Beam. Använd en enda programmeringsmodell för att utföra både batch- och strömbehandling från deras Java- eller Python-applikation. Utför pipelines över flera miljöer.
Kursens format
- Delföreläsning, deldiskussion, övningar och tung praktisk praktik
Notera
- Den här kursen kommer att finnas tillgänglig Scala i framtiden. Kontakta oss för att ordna.
Apache Apex: Processing Big Data-in-Motion
21 timmarApache Apex är en YARN-inbyggd plattform som förenar ström- och batchbehandling. Den bearbetar stor data-i-rörelse på ett sätt som är skalbar, performant, feltolerant, tillståndsfull, säker, distribuerad och lättanvändbar.
Den här instruktörsledda, liveträningen introducerar Apache Apex enhetliga strömbearbetningsarkitektur och leder deltagarna genom skapandet av en distribuerad applikation med Apex på Hadoop .
I slutet av denna träning kommer deltagarna att kunna:
- Förstå dataledningens rörledningskoncept som anslutningar för källor och sänkor, vanliga datatransformationer, etc.
- Bygg, skala och optimera en Apex-applikation
- Bearbeta dataströmmar i realtid pålitligt och med minimal latens
- Använd Apex Core och Apex Malhar-biblioteket för att möjliggöra snabb applikationsutveckling
- Använd Apex API för att skriva och återanvända befintlig Java kod
- Integrera Apex i andra applikationer som en processmotor
- Ställa in, testa och skala Apex-applikationer
Kursformat
- Interaktiv föreläsning och diskussion.
- Massor av övningar och träning.
- Praktisk implementering i en levande lab-miljö.
Alternativ för kursanpassning
- För att begära en anpassad utbildning för denna kurs, vänligen kontakta oss för att ordna.
Apache Storm
28 timmarApache Storm är en distribuerad, realtid beräkningsmotor som används för att möjliggöra realtid business intelligence. Det gör det genom att tillåta applikationer att på ett tillförlitligt sätt behandla obegränsade dataflöden (t.ex. och strömbearbetning).
"Storm är för realtid bearbetning vad Hadoop är för batch bearbetning!"
I denna instruktörledda live-träning lär deltagarna hur man installerar och konfigurerar Apache Storm, sedan utvecklar och implementerar en Apache Storm applikation för bearbetning av stora data i realtid.
Några av de ämnen som ingår i denna utbildning inkluderar:
- Apache Storm i samband med Hadoop
- Arbeta med obegränsade data
- Kontinuerlig beräkning
- Realtidsanalys
- Distribuerad RPC och ETL-behandling
Be om denna kurs nu!
Publiken
- Programvara och ETL utvecklare
- Mainframe professionella
- Data forskare
- Big data analytiker
- [ 0 ] Professionella
Format av kursen
- Del föreläsning, del diskussion, övningar och tung praxis
Apache NiFi for Administrators
21 timmarI denna instruktörsledda, liveutbildning i Sverige (på plats eller på distans) kommer deltagarna att lära sig hur man distribuerar och hanterar Apache NiFi i en levande labbmiljö.
I slutet av denna utbildning kommer deltagarna att kunna:
- Installera och konfigurera Apachi NiFi.
- Källa, transformera och hantera data från olika, distribuerade datakällor, inklusive databaser och stora datasjöar.
- Automatisera dataflöden.
- Aktivera strömningsanalys.
- Tillämpa olika metoder för dataintag.
- Förvandla Big Data och till affärsinsikter.
Apache NiFi for Developers
7 timmarI denna instruktörsledda, liveutbildning i Sverige kommer deltagarna att lära sig grunderna i flödesbaserad programmering när de utvecklar ett antal demotillägg, komponenter och processorer med Apache NiFi.
I slutet av denna utbildning kommer deltagarna att kunna:
- Förstå NiFis arkitektur och dataflödeskoncept.
- Utveckla tillägg med hjälp av NiFi och tredje parts API:er.
- Skräddarsytt utveckla sin egen Apache Nifi-processor.
- Ta in och bearbeta realtidsdata från olika och ovanliga filformat och datakällor.
Apache Flink Fundamentals
28 timmarDenna instruktörsledda, liveutbildning i Sverige (online eller på plats) introducerar principerna och tillvägagångssätten bakom distribuerad ström- och batchdatabehandling, och leder deltagarna genom skapandet av en dataströmningsapplikation i realtid i Apache Flink.
I slutet av denna utbildning kommer deltagarna att kunna:
- Skapa en miljö för att utveckla dataanalysapplikationer. Förstå hur Apache Flinks grafbehandlingsbibliotek (Gelly) fungerar. Paketera, kör och övervaka Flink-baserade, feltoleranta dataströmningsapplikationer. Hantera olika arbetsbelastningar. Utför avancerad analys. Konfigurera ett Flink-kluster med flera noder. Mät och optimera prestanda. Integrera Flink med olika Big Data system. Jämför Flink-kapaciteten med andra ramverk för big data-bearbetning.
Hortonworks Data Platform (HDP) for Administrators
21 timmarDenna instruktörsledda, liveutbildning i Sverige (online eller på plats) introducerar Hortonworks Data Platform (HDP) och leder deltagarna genom implementeringen av Spark + Hadoop-lösningen.
I slutet av denna utbildning kommer deltagarna att kunna:
- Använd Hortonworks för att tillförlitligt köra Hadoop i stor skala. Förena Hadoops funktioner för säkerhet, styrning och drift med Sparks agila analytiska arbetsflöden. Använd Hortonworks för att undersöka, validera, certifiera och stödja var och en av komponenterna i ett Spark-projekt. Bearbeta olika typer av data, inklusive strukturerad, ostrukturerad, i rörelse och i vila.
Apache Ambari: Efficiently Manage Hadoop Clusters
21 timmarApache Ambari är en open source-managementplattform för att tillhandahålla, hantera, övervaka och säkra Apache Hadoop kluster.
I denna instruktörsledda liveträning kommer deltagarna att lära sig hanteringsverktygen och praxis som Ambari tillhandahåller för att framgångsrikt hantera Hadoop kluster.
I slutet av denna träning kommer deltagarna att kunna:
- Ställ in ett live Big Data kluster med Ambari
- Använd Ambaris avancerade funktioner och funktioner i olika användningsfall
- Lägg till och ta bort noder sömlöst efter behov
- Förbättra ett Hadoop klustrets prestanda genom att ställa in och justera
Publik
- DevOps
- Systemadministratörer
- databasadministratörer
- Hadoop testare
Kursformat
- Delföreläsning, delvis diskussion, övningar och tung praktisk övning
Impala for Business Intelligence
21 timmarCloudera Impala är en frågemotor för massiv parallell bearbetning (MPP) SQL med öppen källkod för Apache Hadoop-kluster.
Impala gör det möjligt för användare att skicka frågor med låg latens SQL till data lagrade i Hadoop Distributed File System och Apache Hbase utan att kräva dataförflyttning eller transformation.
Publik
Den här kursen vänder sig till analytiker och datavetare som utför analys av data lagrad i Hadoop via Business Intelligence eller SQL verktyg.
Efter denna kurs kommer delegater att kunna
- Extrahera meningsfull information från Hadoop-kluster med Impala. Skriv specifika program för att underlätta Business Intelligence i Impala SQL Dialect. Felsöka Impala.
Data Analysis with Hive/HiveQL
7 timmarDenna kurs behandlar hur man använder Hive SQL språk (AKA: Hive HQL, SQL på Hive , Hive QL) för personer som extraherar data från Hive
Stream Processing with Kafka Streams
7 timmarKafka Streams är ett bibliotek på klientsidan för att bygga applikationer och mikroservices vars data skickas till och från ett Kafka-meddelandesystem. Traditionellt har Apache Kafka förlitat sig på Apache Spark eller Apache Storm att bearbeta data mellan meddelandeproducenter och konsumenter. Genom att ringa Kafka Streams API från en applikation kan data behandlas direkt inom Kafka, vilket förbigår behovet av att skicka data till ett separat kluster för bearbetning.
I denna instruktörsledda, liveträning, kommer deltagarna att lära sig att integrera Kafka Streams i en uppsättning prov Java applikationer som skickar data till och från Apache Kafka för strömbehandling.
I slutet av denna träning kommer deltagarna att kunna:
- Förstå Kafka Streams funktioner och fördelar jämfört med andra strömbearbetningsramar
- Behandla strömdata direkt i ett Kafka-kluster
- Skriv en Java eller Scala applikation eller mikroservice som integreras med Kafka- och Kafka-strömmar
- Skriv kortfattad kod som omvandlar inmatade Kafka-ämnen till utgångs-Kafka-ämnen
- Bygg, paketera och distribuera applikationen
Publik
- utvecklare
Format av kursen
- Delföreläsning, delvis diskussion, övningar och tung praktisk övning
anteckningar
- För att begära en anpassad utbildning för denna kurs, vänligen kontakta oss för att ordna
A Practical Introduction to Stream Processing
21 timmarI denna instruktörsledda, liveutbildning i Sverige (på plats eller på distans) kommer deltagarna att lära sig hur man ställer in och integrerar olika Stream Processing ramverk med befintliga big data-lagringssystem och relaterade mjukvaruapplikationer och mikrotjänster.
I slutet av denna utbildning kommer deltagarna att kunna:
- Installera och konfigurera olika Stream Processing ramverk, som Spark Streaming och Kafka Streaming.
- Förstå och välj det mest lämpliga ramverket för jobbet.
- Bearbeta data kontinuerligt, samtidigt och på ett rekord-för-post-sätt.
- Integrera Stream Processing lösningar med befintliga databaser, datalager, datasjöar etc.
- Integrera det mest lämpliga strömbehandlingsbiblioteket med företagsapplikationer och mikrotjänster.