Big Data kurser och utbildning

Big Data kurser och utbildning

Lokala instruktörer ledda Big Data-kurser börjar med en introduktion till elementära begrepp i Big Data, sedan framsteg i programmeringsspråk och metoder som används för att utföra Data Analysis. Verktyg och infrastruktur för att möjliggöra stor datalagring, distribuerad bearbetning och skalbarhet diskuteras, jämförs och implementeras i demo övningar. Stor dataträning är tillgänglig som "live-träning" eller "fjärr-live-träning". Utbildning på plats kan genomföras lokalt på kundlokaler i Sverige eller i NobleProgs företagsutbildningscenter i Sverige . Fjärrutbildning sker genom en interaktiv fjärrskrivbord. NobleProg - Din lokala utbildningsleverantör

Testimonials

★★★★★
★★★★★

Kursplaner från Big Data

KodNamnVaraktighetÖversikt
smtwebintSemantic Web Overview7 timmarDen semantiska webben är en samarbetsrörelse ledd av World Wide Web Consortium (W3C) som främjar gemensamma format för data på World Wide Web. Den semantiska webben ger en gemensam ram som tillåter data att delas och återanvändas över applikations-, företags- och samhällsgränser.
tigonTigon: Real-time Streaming for the Real World14 timmarTigon är en open source, realtime, lowlatency, highthroughput, native YARN, strömbehandlingsramverk som sitter ovanpå HDFS och HBase för uthållighet Tigon-applikationer adresserar användarfall som nätverksintrångsdetektering och -analys, marknadsanalys av sociala medier, platsanalyser och realtidsrekommendationer till användare Denna instruktörsledda, levande träning introducerar Tigons strategi för att blanda realtid och satsvis bearbetning eftersom det går deltagare genom att skapa en provapplikation Vid slutet av denna utbildning kommer deltagarna att kunna: Skapa kraftfulla, strömbehandlingsprogram för hantering av stora datamängder Process strömkällor som Twitter och Webserver Logs Använd Tigon för snabb anslutning, filtrering och aggregering av strömmar Publik utvecklare Kursens format Delföreläsning, diskussion, övningar och tung handson-övning .
BDATRBig Data Analytics for Telecom Regulators16 timmarFör att uppfylla tillsynsmyndigheternas överensstämmelse kan CSP: er (Kommunikationsleverantörer) dra in i Big Data Analytics som inte bara hjälper dem att uppfylla överensstämmelse men inom ramen för samma projekt de kan öka kundtillfredsställelsen och därigenom minska klyftan Faktum är sedan Överensstämmelse är relaterad till servicekvalitet som är knuten till ett kontrakt, vilket initiativ som helst för att möta överensstämmelse, kommer att förbättra "konkurrensfördelarna" för CSP: erna Därför är det viktigt att Regulatorer bör kunna ge råd / vägleda en uppsättning analytiska analyser för stora data för CSP: er som ska vara av ömsesidig nytta mellan tillsynsmyndigheterna och CSP 2 dagar naturligtvis: 8 moduler, 2 timmar vardera = 16 timmar .
graphcomputingIntroduction to Graph Computing28 timmarEtt stort antal verkliga problem kan beskrivas när det gäller grafer Till exempel webbgrafen, det sociala nätverksdiagrammet, tågnätgrafen och språngrafiken Dessa grafer tenderar att vara extremt stora; bearbetar dem kräver en specialiserad uppsättning verktyg och processer dessa verktyg och processer kan kallas Graph Computing (även kallad Graph Analytics) I den här instruktörsledningen, direktutbildning, kommer deltagarna att lära sig om tekniska erbjudanden och implementeringsmetoder för behandling av grafdata Syftet är att identifiera realworld-objekt, deras egenskaper och relationer, sedan modellera dessa relationer och bearbeta dem som data med hjälp av en grafisk metod Vi börjar med en bred översikt och smala in på specifika verktyg när vi går igenom en serie fallstudier, handsonövningar och live-implementeringar Vid slutet av denna utbildning kommer deltagarna att kunna: Förstå hur grafdata är kvar och traverseras Välj den bästa ramen för en given uppgift (från grafdatabaser till batchbehandlingsramar) Implementera Hadoop, Spark, GraphX ​​och Pregel för att utföra grafkalkylering på flera maskiner parallellt Visa realworld stora dataproblem när det gäller grafer, processer och traverser Publik utvecklare Kursens format Delföreläsning, diskussion, övningar och tung handson-övning .
matlabpredanalyticsMatlab for Predictive Analytics21 timmarPrediktiv analys är processen med att använda dataanalys för att göra förutsägelser om framtiden Denna process använder data tillsammans med data mining, statistik och maskininlärningsteknik för att skapa en förutsägbar modell för prognoser för framtida händelser I den här instruktionsledda träningen lär deltagarna att använda Matlab för att bygga prediktiva modeller och tillämpa dem på stora provdatasatser för att förutsäga framtida händelser baserat på data Vid slutet av denna utbildning kommer deltagarna att kunna: Skapa prediktiva modeller för att analysera mönster i historiska och transaktionsdata Använd prediktiv modellering för att identifiera risker och möjligheter Bygg matematiska modeller som tar viktiga trender Använd data från enheter och affärssystem för att minska avfall, spara tid eller minska kostnader Publik utvecklare ingenjörer Domänexperter Kursens format Delföreläsning, diskussion, övningar och tung handson-övning .
nifidevApache NiFi for Developers7 timmarApache NiFi (Hortonworks DataFlow) är en realtidsintegrerad datalogistik och enkel händelsesbehandlingsplattform som gör det möjligt att flytta, spåra och automatisera data mellan system Den skrivs med flödesbaserad programmering och ger ett webbaserat användargränssnitt för att hantera dataflöden i realtid I den här instruktörsledda träningstrenderna kommer deltagarna att lära sig grunden för flödesbaserad programmering då de utvecklar ett antal demoförlängningar, komponenter och processorer som använder Apache NiFi Vid slutet av denna utbildning kommer deltagarna att kunna: Förstå NiFis arkitektur och dataflowkoncept Utveckla tillägg med hjälp av NiFi och tredjeparts API Custom utveckla sin egen Apache Nifi-processor Ingestas och behandlar realtidsdata från olika och ovanliga filformat och datakällor Publik utvecklare Datatekniker Kursens format Delföreläsning, diskussion, övningar och tung handson-övning .
nifiApache NiFi for Administrators21 timmarApache NiFi (Hortonworks DataFlow) är en realtidsintegrerad datalogistik och enkel händelsesbehandlingsplattform som gör det möjligt att flytta, spåra och automatisera data mellan system Den skrivs med flödesbaserad programmering och ger ett webbaserat användargränssnitt för att hantera dataflöden i realtid I den här instruktörsledningen, levande träning, kommer deltagarna att lära sig att distribuera och hantera Apache NiFi i en levande labmiljö Vid slutet av denna utbildning kommer deltagarna att kunna: Installera och konfigurera Apachi NiFi Källa, omvandla och hantera data från olika, distribuerade datakällor, inklusive databaser och stora datasjöar Automatisera dataflöden Aktivera streaminganalys Applicera olika metoder för datainsamling Transformera stora data och in i affärsinsikt Publik Systemadministratörer Datatekniker utvecklare DevOps Kursens format Delföreläsning, diskussion, övningar och tung handson-övning .
solrcloudSolrCloud14 timmarApache SolrCloud är en distribuerad databehandlingsmotor som underlättar sökning och indexering av filer på ett distribuerat nätverk I denna instruktörsledda, levande träning kommer deltagarna att lära sig hur man skapar en SolrCloud-instans på Amazon AWS Vid slutet av denna utbildning kommer deltagarna att kunna: Förstå SolClouds funktioner och hur de jämförs med de konventionella masterslave-kluster Konfigurera ett SolCloud centraliserat kluster Automatisera processer som att kommunicera med shards, lägga till dokument till shards etc Använd Zookeeper tillsammans med SolrCloud för att ytterligare automatisera processer Använd gränssnittet för att hantera felrapportering Ladda upp en SolrCloud-installation Konfigurera SolrCloud för kontinuerlig bearbetning och failover Publik Solr Developers Projektledare Systemadministratörer Sök analytiker Kursens format Delföreläsning, diskussion, övningar och tung handson-övning .
datavaultData Vault: Building a Scalable Data Warehouse28 timmarDatavalvmodellering är en databasmodellteknik som ger långvarig historisk lagring av data som kommer från flera källor En datavalv lagrar en enda version av fakta, eller "alla data, hela tiden" Den flexibla, skalbara, konsekventa och anpassningsbara konstruktionen omfattar de bästa aspekterna av 3: e normalform (3NF) och stjärnschema I denna instruktörledda, levande träning kommer deltagarna att lära sig att bygga en Data Vault Vid slutet av denna utbildning kommer deltagarna att kunna: Förstå arkitekturen och designkoncepten bakom Data Vault 20 och dess interaktion med Big Data, NoSQL och AI Använd datavalvtekniker för att möjliggöra revision, spårning och inspektion av historiska data i ett datalager Utveckla en konsekvent och repeterbar ETL (Extract, Transform, Load) -process Bygg och distribuera hög skalbara och repeterbara lager Publik Datamodellerare Data warehousing specialist Business Intelligence-specialister Datatekniker Databasadministratörer Kursens format Delföreläsning, diskussion, övningar och tung handson-övning .
datameerDatameer for Data Analysts14 timmarDatameer är en affärsinformations- och analysplattform byggd på Hadoop Det gör det möjligt för endusers att få tillgång till, utforska och korrelera storskala, strukturerad, semistrukturerad och ostrukturerad data på ett easytouse-sätt I den här instruktionsledda träningspasset lär deltagarna att använda Datameer för att övervinna Hadops branta inlärningskurva, eftersom de går igenom installationen och analysen av en serie stora datakällor Vid slutet av denna utbildning kommer deltagarna att kunna: Skapa, curate och interaktivt utforska en företagsdatasjö Få tillgång till affärsinformationslager, transaktionsdatabaser och andra analytiska butiker Använd en kalkylarks användargränssnitt för att designa ändringsrutiner för databehandling Få tillgång till förbyggda funktioner för att utforska komplexa datarelationer Använd draganddrop-guider för att visualisera data och skapa instrumentpaneler Använd tabeller, diagram, grafer och kartor för att analysera sökresultat Publik Dataanalyser Kursens format Delföreläsning, diskussion, övningar och tung handson-övning .
ApacheIgniteApache Ignite: Improve Speed, Scale and Availability with In-Memory Computing14 timmarApache Ignite is an in-memory computing platform that sits between the application and data layer to improve speed, scale, and availability.

In this instructor-led, live training, participants will learn the principles behind persistent and pure in-memory storage as they step through the creation of a sample in-memory computing project.

By the end of this training, participants will be able to:

- Use Ignite for in-memory, on-disk persistence as well as a purely distributed in-memory database.
- Achieve persistence without syncing data back to a relational database.
- Use Ignite to carry out SQL and distributed joins.
- Improve performance by moving data closer to the CPU, using RAM as a storage.
- Spread data sets across a cluster to achieve horizontal scalability.
- Integrate Ignite with RDBMS, NoSQL, Hadoop and machine learning processors.

Audience

- Developers

Format of the course

- Part lecture, part discussion, exercises and heavy hands-on practice
sparkpythonPython and Spark for Big Data (PySpark)21 timmarPython är ett högkvalitets programmeringsspråk känt för sin tydliga syntax och kodläsbarhet Spark är en databehandlingsmotor som används för att fråga, analysera och omvandla stora data PySpark tillåter användare att gränssnitta Spark with Python I den här instruktionsledda träningen lär deltagarna hur man använder Python och Spark tillsammans för att analysera stora data när de arbetar med handsonövningar Vid slutet av denna utbildning kommer deltagarna att kunna: Lär dig hur du använder Spark with Python för att analysera stora data Arbeta med övningar som efterliknar verkliga världsförhållanden Använd olika verktyg och tekniker för stor dataanalys med PySpark Publik utvecklare IT-proffs Datavetenskapare Kursens format Delföreläsning, diskussion, övningar och tung handson-övning .
vespaVespa: Serving Large-Scale Data in Real-Time14 timmarVespa en opensource stor databehandling och servering motor skapad av Yahoo Det används för att svara på användarfrågor, göra rekommendationer och tillhandahålla personligt innehåll och annonser i realtid Denna instruktionsledda, levande utbildning introducerar utmaningarna med att betjäna storskaliga data och går deltagare genom att skapa en applikation som kan beräkna svar på användarförfrågningar, över stora dataset i realtid Vid slutet av denna utbildning kommer deltagarna att kunna: Använd Vespa för att snabbt beräkna data (lagra, söka, rangordna, organisera) vid visningstid medan en användare väntar Implementera Vespa i befintliga applikationer med funktionssökning, rekommendationer och anpassning Integrera och distribuera Vespa med befintliga stora datasystem som Hadoop och Storm Publik utvecklare Kursens format Delföreläsning, diskussion, övningar och tung handson-övning .
apexApache Apex: Processing Big Data-in-Motion21 timmarApache Apex är en YARNnativ plattform som förenar ström- och batchbehandling Den hanterar stor datainmotion på ett sätt som är skalbar, prestanda, felfttolerant, stateful, säker, distribuerad och lätt att använda Denna instruktörsledda träning introducerar Apache Apex enhetliga strömbehandlingsarkitektur och går deltagare genom skapandet av en distribuerad applikation med hjälp av Apex på Hadoop Vid slutet av denna utbildning kommer deltagarna att kunna: Förstå dataprocessledningens koncept, såsom kontakter för källor och sänkor, vanliga datatransformationer etc Bygg, skala och optimera en Apex-applikation Behandla realtids dataströmmar på ett tillförlitligt sätt och med minimal latens Använd Apex Core och Apex Malhar-biblioteket för att möjliggöra snabb applikationsutveckling Använd Apex API för att skriva och återanvända befintlig Java-kod Integrera Apex i andra applikationer som en bearbetningsmotor Tune, test och skala Apex-applikationer Publik utvecklare Företagsarkitekter Kursens format Delföreläsning, diskussion, övningar och tung handson-övning .
alluxioAlluxio: Unifying Disparate Storage Systems7 timmarAlexio är ett open source virtuellt distribuerat lagringssystem som förenar olika lagringssystem och möjliggör att applikationer kan interagera med data vid minneshastighet Det används av företag som Intel, Baidu och Alibaba I den här instruktionsledda träningen lär deltagarna att lära sig hur man använder Alexio för att överbrygga olika beräkningsramar med lagringssystem och effektivt hantera data för multipetabyteskalan, eftersom de går igenom skapandet av en applikation med Alluxio Vid slutet av denna utbildning kommer deltagarna att kunna: Utveckla en ansökan med Alluxio Anslut stora datasystem och applikationer samtidigt som du behåller en namnrymd Effektivt extrahera värdet från stora data i vilket lagringsformat som helst Förbättra arbetsbelastningen Implementera och hantera Alluxio fristående eller grupperade Publik Datavetenskapare Utvecklare Systemadministratör Kursens format Delföreläsning, diskussion, övningar och tung handson-övning .
flinkFlink for Scalable Stream and Batch Data Processing28 timmarApache Flink är ett open source-ramverk för skalbar ström och batchdatabehandling Denna instruktörsledda, levande utbildning introducerar principerna och metoderna bakom distribuerad ström och batchdatabehandling och går deltagare genom att skapa en realtid, dataströmningsapplikation Vid slutet av denna utbildning kommer deltagarna att kunna: Skapa en miljö för att utveckla dataanalysapplikationer Paket, kör och övervaka Flinkbaserade, feluttoleranta, dataströmningsapplikationer Hantera olika arbetsbelastningar Utför avancerad analys med Flink ML Ställ in ett multinode Flink-kluster Mäta och optimera prestanda Integrera Flink med olika Big Data-system Jämför Flink-funktioner med de andra stora databehandlingsramarna Publik utvecklare arkitekter Datatekniker Analytics-proffs Tekniska chefer Kursens format Delföreläsning, diskussion, övningar och tung handson-övning .
samzaSamza for Stream Processing14 timmarApache Samza är en open source nearrealtime, asynkron beräkningsram för strömbehandling Den använder Apache Kafka för meddelanden och Apache Hadoop YARN för feltolerans, processorisolering, säkerhet och resurshantering Denna instruktörsledda, levande utbildning introducerar principerna bakom meddelandesystem och distribuerad strömbehandling, samtidigt som deltagarna går genom att skapa ett samplingsprojekt och jobbet Vid slutet av denna utbildning kommer deltagarna att kunna: Använd Samza för att förenkla koden som behövs för att producera och konsumera meddelanden Avkall hanteringen av meddelanden från en applikation Använd Samza för att implementera närmast asynkron beräkning Använd strömbehandling för att ge en högre grad av abstraktion över meddelandesystem Publik utvecklare Kursens format Delföreläsning, diskussion, övningar och tung handson-övning .
zeppelinZeppelin for Interactive Data Analytics14 timmarApache Zeppelin är en webbaserad anteckningsbok för att fånga, utforska, visualisera och dela Hadoop och Spark-baserade data Denna instruktörsledda, levande träning introducerar begreppen bakom interaktiv dataanalys och går deltagare genom utplacering och användning av Zeppelin i en enkelanvändare eller multiuser miljö Vid slutet av denna utbildning kommer deltagarna att kunna: Installera och konfigurera Zeppelin Utveckla, organisera, exekvera och dela data i ett webbaserat gränssnitt Visualisera resultat utan att hänvisa till kommandoraden eller klusterinformationen Utför och samarbeta på långa arbetsflöden Arbeta med några av ett antal plugin-språk / dataprocessingbackends, såsom Scala (med Apache Spark), Python (med Apache Spark), Spark SQL, JDBC, Markdown och Shell Integrera Zeppelin med Spark, Flink och Map Reduce Säkra flera användare av Zeppelin med Apache Shiro Publik Datatekniker Dataanalyser Datavetenskapare Programutvecklare Kursens format Delföreläsning, diskussion, övningar och tung handson-övning .
magellanMagellan: Geospatial Analytics on Spark14 timmarMagellan är en open source distribuerad exekveringsmotor för geospatial analytics på stora data Implementeras ovanpå Apache Spark, sträcker den Spark SQL och ger en relationell abstraktion för geospatial analytics Denna instruktörsledda, levande träning introducerar begrepp och metoder för att implementera geospacialanalys och går deltagare genom att skapa en prognosanalys med Magellan on Spark Vid slutet av denna utbildning kommer deltagarna att kunna: Effektivt fråga, analysera och ansluta geospatial dataset i skalan Implementera geospatial data i business intelligence och predictive analytics applikationer Använd rumslig kontext för att utöka kapaciteten hos mobila enheter, sensorer, loggar och bärbara datorer Publik Applikationsutvecklare Kursens format Delföreläsning, diskussion, övningar och tung handson-övning .
hdpHortonworks Data Platform (HDP) for Administrators21 timmarHortonworks Data Platform är en open source Apache Hadoop supportplattform som ger en stabil grund för att utveckla stora datalösningar på Apache Hadoop ekosystem Den här instruktörsledda träningen introducerar Hortonworks och går deltagare genom utbyggnaden av Spark + Hadoop-lösningen Vid slutet av denna utbildning kommer deltagarna att kunna: Använd Hortonworks för att tillförlitligt driva Hadoop i stor skala Förena Hadops säkerhets-, styrnings- och operationsmöjligheter med Sparks smidiga analytiska arbetsflöden Använd Hortonworks för att undersöka, validera, certifiera och stödja var och en av komponenterna i ett Spark-projekt Bearbeta olika typer av data, inklusive strukturerad, ostrukturerad, inmotion och atrest Publik Hadoop administratörer Kursens format Delföreläsning, diskussion, övningar och tung handson-övning .
PentahoDIPentaho Data Integration Fundamentals21 timmarPentaho Data Integration är ett verktyg för integration av open source-data för att definiera jobb och datatransformationer I den här instruktionsledda träningen lär deltagarna lära sig hur man använder Pentaho Data Integrations kraftfulla ETL-funktioner och rich GUI för att hantera en hel stor data livscykel, vilket maximerar värdet av data till organisationen Vid slutet av denna utbildning kommer deltagarna att kunna: Skapa, förhandsgranska och köra grundläggande datatransformationer som innehåller steg och humle Konfigurera och säkra Pentaho Enterprise Repository Använda olika datakällor och skapa en enda, enhetlig version av sanningen i ett format som är analyserat Ge resultat till tredje part för vidare bearbetning Publik Dataanalytiker ETL-utvecklare Kursens format Delföreläsning, diskussion, övningar och tung handson-övning .
bigdatabicriminalBig Data Business Intelligence for Criminal Intelligence Analysis35 timmarFramsteg i teknik och den ökande mängd information förvandlar hur brottsbekämpning genomförs De utmaningar som Big Data utgör är nästan lika skrämmande som Big Datas löfte Att lagra data effektivt är en av dessa utmaningar; effektivt analysera det är en annan I denna instruktionsledda träningspraxis kommer deltagarna att lära sig tankesättet för att närma sig Big Data-teknik, bedöma deras inverkan på befintliga processer och policyer och genomföra dessa tekniker för att identifiera brottslig verksamhet och förebygga brott Fallstudier från brottsbekämpande organisationer runt om i världen kommer att undersökas för att få insikter om deras antagande, utmaningar och resultat Vid slutet av denna utbildning kommer deltagarna att kunna: Kombinera Big Data-teknik med traditionella datainsamlingsprocesser för att sammanfatta en historia under en undersökning Genomföra industriella stora datalagrings- och bearbetningslösningar för dataanalys Förbereda ett förslag till antagande av de mest adekvata verktyg och processer för att möjliggöra en datadriven strategi för brottsutredning Publik Advokatbyråer med teknisk bakgrund Kursens format Delföreläsning, diskussion, övningar och tung handson-övning .
hadooppythonHadoop with Python28 timmarHadoop är ett populärt ramverk för stor databehandling Python är ett högkvalitets programmeringsspråk känt för sin tydliga syntax och kodläsbarhet I den här instruktörsledda träningen kommer deltagarna att lära sig hur man arbetar med Hadoop, MapReduce, Pig och Spark med Python, eftersom de går igenom flera exempel och använder fall Vid slutet av denna utbildning kommer deltagarna att kunna: Förstå de grundläggande begreppen bakom Hadoop, MapReduce, Pig och Spark Använd Python med Hadoop Distributed File System (HDFS), MapReduce, Pig och Spark Använd Snakebite för att programmera åt HDFS inom Python Använd mrjob för att skriva MapReduce jobb i Python Skriv Spark-program med Python Utvid funktionaliteten hos gris med Python UDF Hantera MapReduce-jobb och grisskript med Luigi Publik utvecklare IT-proffs Kursens format Delföreläsning, diskussion, övningar och tung handson-övning .
kylinApache Kylin: From Classic OLAP to Real-Time Data Warehouse14 timmarApache Kylin är en extrem, distribuerad analysmotor för stora data I den här instruktörsledda levande träningen lär deltagarna att använda Apache Kylin för att skapa ett realtiddatagalleri Vid slutet av denna utbildning kommer deltagarna att kunna: Konsumera realtidsströmmande data med Kylin Använd Apache Kylins kraftfulla funktioner, inklusive snowflake schema support, ett rikt SQL-gränssnitt, gnista-kuber och undersökningsfördröjning Notera Vi använder den senaste versionen av Kylin (som det här skrivet, Apache Kylin v20) Publik Stora datainstruktörer Stora dataanalytiker Kursens format Delföreläsning, diskussion, övningar och tung handson-övning .
sparksqlApache Spark SQL7 timmarSpark SQL är Apache Sparks modul för att arbeta med strukturerad och ostrukturerad data Spark SQL ger information om strukturen i data såväl som beräkningen som utförs Denna information kan användas för att utföra optimeringar Två vanliga användningsområden för Spark SQL är: att utföra SQL-frågor att läsa data från en befintlig Hive-installation I den här instruktionsledningen, direktutbildning (på plats eller fjärrkontroll) kommer deltagarna att lära sig att analysera olika typer av datasatser med hjälp av Spark SQL Vid slutet av denna utbildning kommer deltagarna att kunna: Installera och konfigurera Spark SQL Utför dataanalys med hjälp av Spark SQL Fråga dataset i olika format Visualisera data och sökresultat Publik Dataanalyser Datavetenskapare Datatekniker Kursens format Delföreläsning, diskussion, övningar och tung handson-övning anteckningar För att begära en anpassad utbildning för denna kurs, vänligen kontakta oss för att ordna .
sparkcloudApache Spark in the Cloud21 timmarApache Spark's learning curve is slowly increasing at the begining, it needs a lot of effort to get the first return. This course aims to jump through the first tough part. After taking this course the participants will understand the basics of Apache Spark , they will clearly differentiate RDD from DataFrame, they will learn Python and Scala API, they will understand executors and tasks, etc. Also following the best practices, this course strongly focuses on cloud deployment, Databricks and AWS. The students will also understand the differences between AWS EMR and AWS Glue, one of the lastest Spark service of AWS.

AUDIENCE:

Data Engineer, DevOps, Data Scientist
bigdataanahealthBig Data Analytics in Health21 timmarStor dataanalys innefattar processen att undersöka stora mängder olika dataset för att upptäcka korrelationer, dolda mönster och andra användbara insikter Hälsindustrin har massiva mängder komplexa heterogena medicinska och kliniska data Att tillämpa stor dataanalys på hälsodata ger stor potential för att få insikter för att förbättra vården av hälsovård Dessa datamängder utgör dock stora utmaningar i analyser och praktiska tillämpningar i en klinisk miljö I den här instruktörsledningen, live training (remote), kommer deltagarna att lära sig att utföra stor dataanalys i hälsa, eftersom de går igenom en serie handson livelab övningar Vid slutet av denna utbildning kommer deltagarna att kunna: Installera och konfigurera stora dataanalysverktyg som Hadoop MapReduce och Spark Förstå egenskaper hos medicinska data Applicera stora datatekniker för att hantera medicinska data Studera stora datasystem och algoritmer i samband med hälsoprogram Publik utvecklare Datavetenskapare Kursens format Delföreläsning, diskussion, övningar och tung handson-övning Notera För att begära en anpassad utbildning för denna kurs, vänligen kontakta oss för att ordna .
arrowApache Arrow for Data Analysis across Disparate Data Sources14 timmarApache Arrow är en öppen källkod för databehandling Den används ofta tillsammans med andra datavetenskapliga verktyg för att få tillgång till olika datalager för analys Den integrerar bra med andra tekniker som GPU-databaser, bibliotek för maskininlärning och verktyg, exekveringsmotorer och datavisualiseringsramar I den här instruktionsledda träningsutbildningen lär deltagarna att integrera Apache Arrow med olika dataskyddsramar för att få tillgång till data från olika datakällor Vid slutet av denna utbildning kommer deltagarna att kunna: Installera och konfigurera Apache Arrow i en distribuerad grupperad miljö Använd Apache Arrow för att komma åt data från olika datakällor Använd Apache Arrow för att kringgå behovet av att bygga och bibehålla komplexa ETL-rörledningar Analysera data över olika datakällor utan att behöva konsolidera det i ett centraliserat förråd Publik Datavetenskapare Datatekniker Kursens format Delföreläsning, diskussion, övningar och tung handson-övning Notera För att begära en anpassad utbildning för denna kurs, vänligen kontakta oss för att ordna .
sqoopMoving Data from MySQL to Hadoop with Sqoop14 timmarSqoop är ett program med öppen källkod för överföring av data mellan Hadoop och relationsdatabaser eller mainframes Det kan användas för att importera data från ett relationsdatabashanteringssystem (RDBMS) som MySQL eller Oracle eller en mainframe i Hadoop Distributed File System (HDFS) Därefter kan data transformeras i Hadoop MapReduce och sedan exporteras tillbaka till en RDBMS I den här instruktörsledda träningen lär deltagarna att lära sig hur man använder Sqoop för att importera data från en traditionell relationsdatabas till Hadoop-lagring, tex HDFS eller Hive och vice versa Vid slutet av denna utbildning kommer deltagarna att kunna: Installera och konfigurera Sqoop Importera data från MySQL till HDFS och Hive Importera data från HDFS och Hive till MySQL Publik Systemadministratörer Datatekniker Kursens format Delföreläsning, diskussion, övningar och tung handson-övning Notera För att begära en anpassad utbildning för denna kurs, vänligen kontakta oss för att ordna .
beamUnified Batch and Stream Processing with Apache Beam14 timmarApache Beam är en öppen källkod, enhetlig programmeringsmodell för att definiera och exekvera parallella databehandlingsledningar Det är kraften i förmågan att köra både batch- och strömmande pipelines Genomförandet utförs av en av Beams stödjande distribuerade bearbetningsbaggar: Apache Apex, Apache Flink, Apache Spark och Google Cloud Dataflow Apache Beam är användbar för ETL (Extract, Transform and Load) -uppgifter som att flytta data mellan olika lagringsmedier och datakällor, omvandla data till ett mer önskvärt format och ladda data till ett nytt system I den här instruktörsledningen, direktutbildning (på plats eller fjärrkontroll) kommer deltagarna att lära sig hur man implementerar Apache Beam SDK i en Java eller Python applikation som definierar en databehandling rörledning för att sönderdela en stor dataset i mindre bitar för oberoende, parallell bearbetning Vid slutet av denna utbildning kommer deltagarna att kunna: Installera och konfigurera Apache Beam Använd en enda programmeringsmodell för att utföra både sats och strömbehandling från att hämta sina Java- eller Python-applikationer Utför pipeliner över flera miljöer Publik utvecklare Kursens format Delföreläsning, diskussion, övningar och tung handson-övning Notera Kursen kommer att finnas tillgänglig Scala i framtiden Vänligen kontakta oss för att ordna .

Kommande utbildning från Big Data

KursCourse DateCourse Price [Remote / Classroom]
Apache Hama - Uppsalamån, 2019-01-21 09:302470EUR / 3270EUR
Apache Hama - Örebro, City Centertis, 2019-01-22 09:302470EUR / 3070EUR
Apache Hama - Örebro, City Centermån, 2019-03-18 09:302470EUR / 3070EUR
Apache Hama - Örebro, City Centertis, 2019-06-11 09:302470EUR / 3070EUR
Apache Hama - Uppsalatis, 2019-06-25 09:302470EUR / 3270EUR
Helg Big Data kurser, Evening Big Data utbildning, Big Data boot camp, Big Data instructor-led, Helg Big Data kurs, KvällBig Data kurser, Big Data coaching, Big Data instruktör, Big Data tränare , Big Data träningskurser, Big Data klasser, Big Data on-site, Big Data privata kurser, Big Data one on one training

Rabatterade kurser

KursVenueCourse DateCourse Price [Remote / Classroom]
Docker for Developers and System AdministratorsGöteborgons, 2019-03-20 09:302430EUR / 3030EUR

Nyhetsbrev & Erbjudanden

Anmäl dig till vårt nyhetsbrev så får du information om aktuella rabatter på öppna kurser. Vi respekterar ditt privatliv, så att din e-postadress kommer endast att användas för sändning vårt nyhetsbrev. När som helst kan du ändra inställningarna eller helt avbeställa den.

Våra kunder

is growing fast!

We are looking to expand our presence in Sweden!

As a Business Development Manager you will:

  • expand business in Sweden
  • recruit local talent (sales, agents, trainers, consultants)
  • recruit local trainers and consultants

We offer:

  • Artificial Intelligence and Big Data systems to support your local operation
  • high-tech automation
  • continuously upgraded course catalogue and content
  • good fun in international team

If you are interested in running a high-tech, high-quality training and consulting business.

Apply now!