Big Data kurser och utbildning

Big Data kurser och utbildning

Lokala instruktörer ledda Big Data-kurser börjar med en introduktion till elementära begrepp i Big Data, sedan framsteg i programmeringsspråk och metoder som används för att utföra Data Analysis. Verktyg och infrastruktur för att möjliggöra stor datalagring, distribuerad bearbetning och skalbarhet diskuteras, jämförs och implementeras i demo övningar. Stor dataträning är tillgänglig som "live-träning" eller "fjärr-live-träning". Utbildning på plats kan genomföras lokalt på kundlokaler i Sverige eller i NobleProgs företagsutbildningscenter i Sverige . Fjärrutbildning sker genom en interaktiv fjärrskrivbord. NobleProg - Din lokala utbildningsleverantör

Testimonials

★★★★★
★★★★★

Kursplaner från Big Data

KodNamnVaraktighetÖversikt
smtwebintSemantic Web Overview7 timmarDen semantiska webben är en samarbetsrörelse ledd av World Wide Web Consortium (W3C) som främjar gemensamma format för data på World Wide Web. Den semantiska webben ger en gemensam ram som tillåter data att delas och återanvändas över applikations-, företags- och samhällsgränser.
datavaultData Vault: Building a Scalable Data Warehouse28 timmarDatavalvmodellering är en databasmodellteknik som ger långvarig historisk lagring av data som kommer från flera källor En datavalv lagrar en enda version av fakta, eller "alla data, hela tiden" Den flexibla, skalbara, konsekventa och anpassningsbara konstruktionen omfattar de bästa aspekterna av 3: e normalform (3NF) och stjärnschema I denna instruktörledda, levande träning kommer deltagarna att lära sig att bygga en Data Vault Vid slutet av denna utbildning kommer deltagarna att kunna: Förstå arkitekturen och designkoncepten bakom Data Vault 20 och dess interaktion med Big Data, NoSQL och AI Använd datavalvtekniker för att möjliggöra revision, spårning och inspektion av historiska data i ett datalager Utveckla en konsekvent och repeterbar ETL (Extract, Transform, Load) -process Bygg och distribuera hög skalbara och repeterbara lager Publik Datamodellerare Data warehousing specialist Business Intelligence-specialister Datatekniker Databasadministratörer Kursens format Delföreläsning, diskussion, övningar och tung handson-övning .
sparkpythonPython and Spark for Big Data (PySpark)21 timmarPython är ett högkvalitets programmeringsspråk känt för sin tydliga syntax och kodläsbarhet Spark är en databehandlingsmotor som används för att fråga, analysera och omvandla stora data PySpark tillåter användare att gränssnitta Spark with Python I den här instruktionsledda träningen lär deltagarna hur man använder Python och Spark tillsammans för att analysera stora data när de arbetar med handsonövningar Vid slutet av denna utbildning kommer deltagarna att kunna: Lär dig hur du använder Spark with Python för att analysera stora data Arbeta med övningar som efterliknar verkliga världsförhållanden Använd olika verktyg och tekniker för stor dataanalys med PySpark Publik utvecklare IT-proffs Datavetenskapare Kursens format Delföreläsning, diskussion, övningar och tung handson-övning .
bigdatabicriminalBig Data Business Intelligence for Criminal Intelligence Analysis35 timmarFramsteg i teknik och den ökande mängd information förvandlar hur brottsbekämpning genomförs De utmaningar som Big Data utgör är nästan lika skrämmande som Big Datas löfte Att lagra data effektivt är en av dessa utmaningar; effektivt analysera det är en annan I denna instruktionsledda träningspraxis kommer deltagarna att lära sig tankesättet för att närma sig Big Data-teknik, bedöma deras inverkan på befintliga processer och policyer och genomföra dessa tekniker för att identifiera brottslig verksamhet och förebygga brott Fallstudier från brottsbekämpande organisationer runt om i världen kommer att undersökas för att få insikter om deras antagande, utmaningar och resultat Vid slutet av denna utbildning kommer deltagarna att kunna: Kombinera Big Data-teknik med traditionella datainsamlingsprocesser för att sammanfatta en historia under en undersökning Genomföra industriella stora datalagrings- och bearbetningslösningar för dataanalys Förbereda ett förslag till antagande av de mest adekvata verktyg och processer för att möjliggöra en datadriven strategi för brottsutredning Publik Advokatbyråer med teknisk bakgrund Kursens format Delföreläsning, diskussion, övningar och tung handson-övning .
BDATRBig Data Analytics for Telecom Regulators16 timmarFör att uppfylla tillsynsmyndigheternas överensstämmelse kan CSP: er (Kommunikationsleverantörer) dra in i Big Data Analytics som inte bara hjälper dem att uppfylla överensstämmelse men inom ramen för samma projekt de kan öka kundtillfredsställelsen och därigenom minska klyftan Faktum är sedan Överensstämmelse är relaterad till servicekvalitet som är knuten till ett kontrakt, vilket initiativ som helst för att möta överensstämmelse, kommer att förbättra "konkurrensfördelarna" för CSP: erna Därför är det viktigt att Regulatorer bör kunna ge råd / vägleda en uppsättning analytiska analyser för stora data för CSP: er som ska vara av ömsesidig nytta mellan tillsynsmyndigheterna och CSP 2 dagar naturligtvis: 8 moduler, 2 timmar vardera = 16 timmar .
graphcomputingIntroduction to Graph Computing28 timmarEtt stort antal verkliga problem kan beskrivas när det gäller grafer Till exempel webbgrafen, det sociala nätverksdiagrammet, tågnätgrafen och språngrafiken Dessa grafer tenderar att vara extremt stora; bearbetar dem kräver en specialiserad uppsättning verktyg och processer dessa verktyg och processer kan kallas Graph Computing (även kallad Graph Analytics) I den här instruktörsledningen, direktutbildning, kommer deltagarna att lära sig om tekniska erbjudanden och implementeringsmetoder för behandling av grafdata Syftet är att identifiera realworld-objekt, deras egenskaper och relationer, sedan modellera dessa relationer och bearbeta dem som data med hjälp av en grafisk metod Vi börjar med en bred översikt och smala in på specifika verktyg när vi går igenom en serie fallstudier, handsonövningar och live-implementeringar Vid slutet av denna utbildning kommer deltagarna att kunna: Förstå hur grafdata är kvar och traverseras Välj den bästa ramen för en given uppgift (från grafdatabaser till batchbehandlingsramar) Implementera Hadoop, Spark, GraphX ​​och Pregel för att utföra grafkalkylering på flera maskiner parallellt Visa realworld stora dataproblem när det gäller grafer, processer och traverser Publik utvecklare Kursens format Delföreläsning, diskussion, övningar och tung handson-övning .
matlabpredanalyticsMatlab for Predictive Analytics21 timmarPrediktiv analys är processen med att använda dataanalys för att göra förutsägelser om framtiden Denna process använder data tillsammans med data mining, statistik och maskininlärningsteknik för att skapa en förutsägbar modell för prognoser för framtida händelser I den här instruktionsledda träningen lär deltagarna att använda Matlab för att bygga prediktiva modeller och tillämpa dem på stora provdatasatser för att förutsäga framtida händelser baserat på data Vid slutet av denna utbildning kommer deltagarna att kunna: Skapa prediktiva modeller för att analysera mönster i historiska och transaktionsdata Använd prediktiv modellering för att identifiera risker och möjligheter Bygg matematiska modeller som tar viktiga trender Använd data från enheter och affärssystem för att minska avfall, spara tid eller minska kostnader Publik utvecklare ingenjörer Domänexperter Kursens format Delföreläsning, diskussion, övningar och tung handson-övning .
nifidevApache NiFi for Developers7 timmarApache NiFi (Hortonworks DataFlow) är en realtidsintegrerad datalogistik och enkel händelsesbehandlingsplattform som gör det möjligt att flytta, spåra och automatisera data mellan system Den skrivs med flödesbaserad programmering och ger ett webbaserat användargränssnitt för att hantera dataflöden i realtid I den här instruktörsledda träningstrenderna kommer deltagarna att lära sig grunden för flödesbaserad programmering då de utvecklar ett antal demoförlängningar, komponenter och processorer som använder Apache NiFi Vid slutet av denna utbildning kommer deltagarna att kunna: Förstå NiFis arkitektur och dataflowkoncept Utveckla tillägg med hjälp av NiFi och tredjeparts API Custom utveckla sin egen Apache Nifi-processor Ingestas och behandlar realtidsdata från olika och ovanliga filformat och datakällor Publik utvecklare Datatekniker Kursens format Delföreläsning, diskussion, övningar och tung handson-övning .
nifiApache NiFi for Administrators21 timmarApache NiFi (Hortonworks DataFlow) är en realtidsintegrerad datalogistik och enkel händelsesbehandlingsplattform som gör det möjligt att flytta, spåra och automatisera data mellan system Den skrivs med flödesbaserad programmering och ger ett webbaserat användargränssnitt för att hantera dataflöden i realtid I den här instruktörsledningen, levande träning, kommer deltagarna att lära sig att distribuera och hantera Apache NiFi i en levande labmiljö Vid slutet av denna utbildning kommer deltagarna att kunna: Installera och konfigurera Apachi NiFi Källa, omvandla och hantera data från olika, distribuerade datakällor, inklusive databaser och stora datasjöar Automatisera dataflöden Aktivera streaminganalys Applicera olika metoder för datainsamling Transformera stora data och in i affärsinsikt Publik Systemadministratörer Datatekniker utvecklare DevOps Kursens format Delföreläsning, diskussion, övningar och tung handson-övning .
solrcloudSolrCloud14 timmarApache SolrCloud är en distribuerad databehandlingsmotor som underlättar sökning och indexering av filer på ett distribuerat nätverk I denna instruktörsledda, levande träning kommer deltagarna att lära sig hur man skapar en SolrCloud-instans på Amazon AWS Vid slutet av denna utbildning kommer deltagarna att kunna: Förstå SolClouds funktioner och hur de jämförs med de konventionella masterslave-kluster Konfigurera ett SolCloud centraliserat kluster Automatisera processer som att kommunicera med shards, lägga till dokument till shards etc Använd Zookeeper tillsammans med SolrCloud för att ytterligare automatisera processer Använd gränssnittet för att hantera felrapportering Ladda upp en SolrCloud-installation Konfigurera SolrCloud för kontinuerlig bearbetning och failover Publik Solr Developers Projektledare Systemadministratörer Sök analytiker Kursens format Delföreläsning, diskussion, övningar och tung handson-övning .
datameerDatameer for Data Analysts14 timmarDatameer är en affärsinformations- och analysplattform byggd på Hadoop Det gör det möjligt för endusers att få tillgång till, utforska och korrelera storskala, strukturerad, semistrukturerad och ostrukturerad data på ett easytouse-sätt I den här instruktionsledda träningspasset lär deltagarna att använda Datameer för att övervinna Hadops branta inlärningskurva, eftersom de går igenom installationen och analysen av en serie stora datakällor Vid slutet av denna utbildning kommer deltagarna att kunna: Skapa, curate och interaktivt utforska en företagsdatasjö Få tillgång till affärsinformationslager, transaktionsdatabaser och andra analytiska butiker Använd en kalkylarks användargränssnitt för att designa ändringsrutiner för databehandling Få tillgång till förbyggda funktioner för att utforska komplexa datarelationer Använd draganddrop-guider för att visualisera data och skapa instrumentpaneler Använd tabeller, diagram, grafer och kartor för att analysera sökresultat Publik Dataanalyser Kursens format Delföreläsning, diskussion, övningar och tung handson-övning .
memsqlMemSQL28 timmarMemSQL är ett inmemory, distribuerat, SQL databas management system för moln och onpremises Det är ett realtidsdatabutik som omedelbart levererar insikter från levande och historiska data I denna instruktionsledda, levande träning kommer deltagarna att lära sig de viktigaste delarna av MemSQL för utveckling och administration Vid slutet av denna utbildning kommer deltagarna att kunna: Förstå de viktigaste koncepten och egenskaperna hos MemSQL Installera, designa, underhålla och driva MemSQL Optimera scheman i MemSQL Förbättra sökfrågor i MemSQL Benchmark prestanda i MemSQL Bygg data i realtid med MemSQL Publik utvecklare Administratörer Driftingenjörer Kursens format Delföreläsning, diskussion, övningar och tung handson-övning .
tigonTigon: Real-time Streaming for the Real World14 timmarTigon är en open source, realtime, lowlatency, highthroughput, native YARN, strömbehandlingsramverk som sitter ovanpå HDFS och HBase för uthållighet Tigon-applikationer adresserar användarfall som nätverksintrångsdetektering och -analys, marknadsanalys av sociala medier, platsanalyser och realtidsrekommendationer till användare Denna instruktörsledda, levande träning introducerar Tigons strategi för att blanda realtid och satsvis bearbetning eftersom det går deltagare genom att skapa en provapplikation Vid slutet av denna utbildning kommer deltagarna att kunna: Skapa kraftfulla, strömbehandlingsprogram för hantering av stora datamängder Process strömkällor som Twitter och Webserver Logs Använd Tigon för snabb anslutning, filtrering och aggregering av strömmar Publik utvecklare Kursens format Delföreläsning, diskussion, övningar och tung handson-övning .
ApacheIgniteApache Ignite: Improve Speed, Scale and Availability with In-Memory Computing14 timmarApache Ignite is an in-memory computing platform that sits between the application and data layer to improve speed, scale, and availability。

In this instructor-led, live training, participants will learn the principles behind persistent and pure in-memory storage as they step through the creation of a sample in-memory computing project.

By the end of this training, participants will be able to:

- Use Ignite for in-memory, on-disk persistence as well as a purely distributed in-memory database.
- Achieve persistence without syncing data back to a relational database.
- Use Ignite to carry out SQL and distributed joins.
- Improve performance by moving data closer to the CPU, using RAM as a storage.
- Spread data sets across a cluster to achieve horizontal scalability.
- Integrate Ignite with RDBMS, NoSQL, Hadoop and machine learning processors.

Format of the course

- Part lecture, part discussion, exercises and heavy hands-on practice
vespaVespa: Serving Large-Scale Data in Real-Time14 timmarVespa en opensource stor databehandling och servering motor skapad av Yahoo Det används för att svara på användarfrågor, göra rekommendationer och tillhandahålla personligt innehåll och annonser i realtid Denna instruktionsledda, levande utbildning introducerar utmaningarna med att betjäna storskaliga data och går deltagare genom att skapa en applikation som kan beräkna svar på användarförfrågningar, över stora dataset i realtid Vid slutet av denna utbildning kommer deltagarna att kunna: Använd Vespa för att snabbt beräkna data (lagra, söka, rangordna, organisera) vid visningstid medan en användare väntar Implementera Vespa i befintliga applikationer med funktionssökning, rekommendationer och anpassning Integrera och distribuera Vespa med befintliga stora datasystem som Hadoop och Storm Publik utvecklare Kursens format Delföreläsning, diskussion, övningar och tung handson-övning .
apexApache Apex: Processing Big Data-in-Motion21 timmarApache Apex är en YARNnativ plattform som förenar ström- och batchbehandling Den hanterar stor datainmotion på ett sätt som är skalbar, prestanda, felfttolerant, stateful, säker, distribuerad och lätt att använda Denna instruktörsledda träning introducerar Apache Apex enhetliga strömbehandlingsarkitektur och går deltagare genom skapandet av en distribuerad applikation med hjälp av Apex på Hadoop Vid slutet av denna utbildning kommer deltagarna att kunna: Förstå dataprocessledningens koncept, såsom kontakter för källor och sänkor, vanliga datatransformationer etc Bygg, skala och optimera en Apex-applikation Behandla realtids dataströmmar på ett tillförlitligt sätt och med minimal latens Använd Apex Core och Apex Malhar-biblioteket för att möjliggöra snabb applikationsutveckling Använd Apex API för att skriva och återanvända befintlig Java-kod Integrera Apex i andra applikationer som en bearbetningsmotor Tune, test och skala Apex-applikationer Publik utvecklare Företagsarkitekter Kursens format Delföreläsning, diskussion, övningar och tung handson-övning .
alluxioAlluxio: Unifying Disparate Storage Systems7 timmarAlexio är ett open source virtuellt distribuerat lagringssystem som förenar olika lagringssystem och möjliggör att applikationer kan interagera med data vid minneshastighet Det används av företag som Intel, Baidu och Alibaba I den här instruktionsledda träningen lär deltagarna att lära sig hur man använder Alexio för att överbrygga olika beräkningsramar med lagringssystem och effektivt hantera data för multipetabyteskalan, eftersom de går igenom skapandet av en applikation med Alluxio Vid slutet av denna utbildning kommer deltagarna att kunna: Utveckla en ansökan med Alluxio Anslut stora datasystem och applikationer samtidigt som du behåller en namnrymd Effektivt extrahera värdet från stora data i vilket lagringsformat som helst Förbättra arbetsbelastningen Implementera och hantera Alluxio fristående eller grupperade Publik Datavetenskapare Utvecklare Systemadministratör Kursens format Delföreläsning, diskussion, övningar och tung handson-övning .
flinkFlink for Scalable Stream and Batch Data Processing28 timmarApache Flink är ett open source-ramverk för skalbar ström och batchdatabehandling Denna instruktörsledda, levande utbildning introducerar principerna och metoderna bakom distribuerad ström och batchdatabehandling och går deltagare genom att skapa en realtid, dataströmningsapplikation Vid slutet av denna utbildning kommer deltagarna att kunna: Skapa en miljö för att utveckla dataanalysapplikationer Paket, kör och övervaka Flinkbaserade, feluttoleranta, dataströmningsapplikationer Hantera olika arbetsbelastningar Utför avancerad analys med Flink ML Ställ in ett multinode Flink-kluster Mäta och optimera prestanda Integrera Flink med olika Big Data-system Jämför Flink-funktioner med de andra stora databehandlingsramarna Publik utvecklare arkitekter Datatekniker Analytics-proffs Tekniska chefer Kursens format Delföreläsning, diskussion, övningar och tung handson-övning .
samzaSamza for Stream Processing14 timmarApache Samza är en open source nearrealtime, asynkron beräkningsram för strömbehandling Den använder Apache Kafka för meddelanden och Apache Hadoop YARN för feltolerans, processorisolering, säkerhet och resurshantering Denna instruktörsledda, levande utbildning introducerar principerna bakom meddelandesystem och distribuerad strömbehandling, samtidigt som deltagarna går genom att skapa ett samplingsprojekt och jobbet Vid slutet av denna utbildning kommer deltagarna att kunna: Använd Samza för att förenkla koden som behövs för att producera och konsumera meddelanden Avkall hanteringen av meddelanden från en applikation Använd Samza för att implementera närmast asynkron beräkning Använd strömbehandling för att ge en högre grad av abstraktion över meddelandesystem Publik utvecklare Kursens format Delföreläsning, diskussion, övningar och tung handson-övning .
zeppelinZeppelin for Interactive Data Analytics14 timmarApache Zeppelin är en webbaserad anteckningsbok för att fånga, utforska, visualisera och dela Hadoop och Spark-baserade data Denna instruktörsledda, levande träning introducerar begreppen bakom interaktiv dataanalys och går deltagare genom utplacering och användning av Zeppelin i en enkelanvändare eller multiuser miljö Vid slutet av denna utbildning kommer deltagarna att kunna: Installera och konfigurera Zeppelin Utveckla, organisera, exekvera och dela data i ett webbaserat gränssnitt Visualisera resultat utan att hänvisa till kommandoraden eller klusterinformationen Utför och samarbeta på långa arbetsflöden Arbeta med några av ett antal plugin-språk / dataprocessingbackends, såsom Scala (med Apache Spark), Python (med Apache Spark), Spark SQL, JDBC, Markdown och Shell Integrera Zeppelin med Spark, Flink och Map Reduce Säkra flera användare av Zeppelin med Apache Shiro Publik Datatekniker Dataanalyser Datavetenskapare Programutvecklare Kursens format Delföreläsning, diskussion, övningar och tung handson-övning .
magellanMagellan: Geospatial Analytics on Spark14 timmarMagellan är en open source distribuerad exekveringsmotor för geospatial analytics på stora data Implementeras ovanpå Apache Spark, sträcker den Spark SQL och ger en relationell abstraktion för geospatial analytics Denna instruktörsledda, levande träning introducerar begrepp och metoder för att implementera geospacialanalys och går deltagare genom att skapa en prognosanalys med Magellan on Spark Vid slutet av denna utbildning kommer deltagarna att kunna: Effektivt fråga, analysera och ansluta geospatial dataset i skalan Implementera geospatial data i business intelligence och predictive analytics applikationer Använd rumslig kontext för att utöka kapaciteten hos mobila enheter, sensorer, loggar och bärbara datorer Publik Applikationsutvecklare Kursens format Delföreläsning, diskussion, övningar och tung handson-övning .
hadooppythonHadoop with Python28 timmarHadoop är ett populärt ramverk för stor databehandling Python är ett högkvalitets programmeringsspråk känt för sin tydliga syntax och kodläsbarhet I den här instruktörsledda träningen kommer deltagarna att lära sig hur man arbetar med Hadoop, MapReduce, Pig och Spark med Python, eftersom de går igenom flera exempel och använder fall Vid slutet av denna utbildning kommer deltagarna att kunna: Förstå de grundläggande begreppen bakom Hadoop, MapReduce, Pig och Spark Använd Python med Hadoop Distributed File System (HDFS), MapReduce, Pig och Spark Använd Snakebite för att programmera åt HDFS inom Python Använd mrjob för att skriva MapReduce jobb i Python Skriv Spark-program med Python Utvid funktionaliteten hos gris med Python UDF Hantera MapReduce-jobb och grisskript med Luigi Publik utvecklare IT-proffs Kursens format Delföreläsning, diskussion, övningar och tung handson-övning .
monetdbMonetDB28 timmarMonetDB är en opensource-databas som pionjerar kolumnteknologin I denna instruktionsledda, levande träning kommer deltagarna att lära sig hur man använder MonetDB och hur man får mest ut av det Vid slutet av denna utbildning kommer deltagarna att kunna: Förstå MonetDB och dess funktioner Installera och börja med MonetDB Utforska och utför olika funktioner och uppgifter i MonetDB Accelerera leveransen av sitt projekt genom att maximera MonetDB-kapacitet Publik utvecklare Tekniska experter Kursens format Delföreläsning, diskussion, övningar och tung handson-övning .
PentahoDIPentaho Data Integration Fundamentals21 timmarPentaho Data Integration är ett verktyg för integration av open source-data för att definiera jobb och datatransformationer I den här instruktionsledda träningen lär deltagarna lära sig hur man använder Pentaho Data Integrations kraftfulla ETL-funktioner och rich GUI för att hantera en hel stor data livscykel, vilket maximerar värdet av data till organisationen Vid slutet av denna utbildning kommer deltagarna att kunna: Skapa, förhandsgranska och köra grundläggande datatransformationer som innehåller steg och humle Konfigurera och säkra Pentaho Enterprise Repository Använda olika datakällor och skapa en enda, enhetlig version av sanningen i ett format som är analyserat Ge resultat till tredje part för vidare bearbetning Publik Dataanalytiker ETL-utvecklare Kursens format Delföreläsning, diskussion, övningar och tung handson-övning .
introtostreamprocessingA Practical Introduction to Stream Processing21 timmarStream Processing avser realtidsbehandling av "data i rörelse", det vill säga att utföra beräkningar på data som den mottas Sådan data läses som kontinuerliga strömmar från datakällor, såsom sensorhändelser, användaraktivitet på webbplatsen, finansiella affärer, kreditkort swipes, klicka strömmar, etc Stream Processing ramverk kan läsa stora volymer av inkommande data och ge värdefulla insikter nästan omedelbart I den här instruktörsledningen, direktutbildning (på plats eller fjärrkontroll) lär deltagarna hur man installerar och integrerar olika Stream Processing-ramar med befintliga stora datalagringssystem och relaterade program och microservices Vid slutet av denna utbildning kommer deltagarna att kunna: Installera och konfigurera olika Stream Processing-ramar, som Spark Streaming och Kafka Streaming Förstå och välj den lämpligaste ramen för jobbet Processen av data kontinuerligt, samtidigt och på ett recordbyrecord sätt Integrera Stream Processing lösningar med befintliga databaser, datalager, data sjöar, etc Integrering av det mest lämpliga databehandlingsbiblioteket med företagsapplikationer och microservices Publik utvecklare Software arkitekter Kursens format Delföreläsning, diskussion, övningar och tung handson-övning anteckningar För att begära en anpassad utbildning för denna kurs, vänligen kontakta oss för att ordna .
confluentBuilding Kafka Solutions with Confluent14 timmardetta instruktör-ledda, Live Training (på plats eller fjärrkontroll) riktar sig till ingenjörer som vill använda flytande (en distribution av Kafka) för att bygga och hantera en realtid databehandling plattform för sina ansökningar.

i slutet av denna utbildning kommer deltagarna att kunna:

- Installera och konfigurera interfluent Platform.
- använda Sam& #39; s ledning redskapen och tjänsten till springa Kafka mer lätt.
- lagra och bearbeta inkommande data.
- optimera och hantera Kafka kluster.
- säkra dataströmmar.

format för kursen

- interaktiv föreläsning och diskussion.
- massor av övningar och praktik.
- praktisk implementering i en Live-lab miljö.

kurs AnpassningsAlternativ

- den här kursen är baserad på öppen källkods-version av interfluent: flytande öppen källkod.
- att begära en skräddarsydd utbildning för denna kurs, vänligen kontakta oss för att ordna.
dataminpythonData Mining with Python14 timmardetta instruktör-ledda, Live Training (på plats eller fjärrkontroll) riktar sig till data analytiker och dataforskare som vill genomföra mer avancerade dataanalys tekniker för datautvinning med python.

i slutet av denna utbildning kommer deltagarna att kunna:

- förstå viktiga områden av data mining, inklusive Associations regel Mining, text sentiment analys, automatisk text sammanfattning, och data anomali upptäckt.
- jämföra och genomföra olika strategier för att lösa verkliga data mining problem.
- förstå och tolka resultaten.

format för kursen

- interaktiv föreläsning och diskussion.
- massor av övningar och praktik.
- praktisk implementering i en Live-lab miljö.

kurs AnpassningsAlternativ

- att begära en skräddarsydd utbildning för denna kurs, vänligen kontakta oss för att ordna.
sparkcloudApache Spark in the Cloud21 timmarApache Spark's learning curve is slowly increasing at the begining, it needs a lot of effort to get the first return. This course aims to jump through the first tough part. After taking this course the participants will understand the basics of Apache Spark , they will clearly differentiate RDD from DataFrame, they will learn Python and Scala API, they will understand executors and tasks, etc. Also following the best practices, this course strongly focuses on cloud deployment, Databricks and AWS. The students will also understand the differences between AWS EMR and AWS Glue, one of the lastest Spark service of AWS.

AUDIENCE:

Data Engineer, DevOps, Data Scientist
bigdataanahealthBig Data Analytics in Health21 timmarStor dataanalys innefattar processen att undersöka stora mängder olika dataset för att upptäcka korrelationer, dolda mönster och andra användbara insikter Hälsindustrin har massiva mängder komplexa heterogena medicinska och kliniska data Att tillämpa stor dataanalys på hälsodata ger stor potential för att få insikter för att förbättra vården av hälsovård Dessa datamängder utgör dock stora utmaningar i analyser och praktiska tillämpningar i en klinisk miljö I den här instruktörsledningen, live training (remote), kommer deltagarna att lära sig att utföra stor dataanalys i hälsa, eftersom de går igenom en serie handson livelab övningar Vid slutet av denna utbildning kommer deltagarna att kunna: Installera och konfigurera stora dataanalysverktyg som Hadoop MapReduce och Spark Förstå egenskaper hos medicinska data Applicera stora datatekniker för att hantera medicinska data Studera stora datasystem och algoritmer i samband med hälsoprogram Publik utvecklare Datavetenskapare Kursens format Delföreläsning, diskussion, övningar och tung handson-övning Notera För att begära en anpassad utbildning för denna kurs, vänligen kontakta oss för att ordna .
arrowApache Arrow for Data Analysis across Disparate Data Sources14 timmarApache Arrow är en öppen källkod för databehandling Den används ofta tillsammans med andra datavetenskapliga verktyg för att få tillgång till olika datalager för analys Den integrerar bra med andra tekniker som GPU-databaser, bibliotek för maskininlärning och verktyg, exekveringsmotorer och datavisualiseringsramar I den här instruktionsledda träningsutbildningen lär deltagarna att integrera Apache Arrow med olika dataskyddsramar för att få tillgång till data från olika datakällor Vid slutet av denna utbildning kommer deltagarna att kunna: Installera och konfigurera Apache Arrow i en distribuerad grupperad miljö Använd Apache Arrow för att komma åt data från olika datakällor Använd Apache Arrow för att kringgå behovet av att bygga och bibehålla komplexa ETL-rörledningar Analysera data över olika datakällor utan att behöva konsolidera det i ett centraliserat förråd Publik Datavetenskapare Datatekniker Kursens format Delföreläsning, diskussion, övningar och tung handson-övning Notera För att begära en anpassad utbildning för denna kurs, vänligen kontakta oss för att ordna .

Kommande utbildning från Big Data

KursCourse DateCourse Price [Remote / Classroom]
Big Data Analytics in Health - Örebro, City Centermån, 2019-04-01 09:303790EUR / 4590EUR
Big Data Analytics in Health - Uppsalaons, 2019-04-03 09:303790EUR / 4890EUR
Big Data Analytics in Health - Stockholm, Hötorgetons, 2019-04-03 09:303790EUR / 4590EUR
Big Data Analytics in Health - Örebro, City Centertis, 2019-05-28 09:303790EUR / 4590EUR
Big Data Analytics in Health - Uppsalaons, 2019-07-03 09:303790EUR / 4890EUR
Helg Big Data kurser, Evening Big Data utbildning, Big Data boot camp, Big Data instructor-led, Helg Big Data kurs, KvällBig Data kurser, Big Data coaching, Big Data instruktör, Big Data tränare , Big Data träningskurser, Big Data klasser, Big Data on-site, Big Data privata kurser, Big Data one on one training

Rabatterade kurser

KursVenueCourse DateCourse Price [Remote / Classroom]
OCEB2 OMG Certified Expert in BPM - Business Intermediate Exam PreparationGöteborgtis, 2019-02-26 09:303510EUR / 4310EUR
Apache Spark MLlibGöteborgmån, 2019-03-18 09:305679EUR / 6879EUR
Docker for Developers and System AdministratorsGöteborgons, 2019-03-20 09:302430EUR / 3030EUR
Hyperledger Fabric for BeginnersGöteborgfre, 2019-03-29 09:302124EUR / 2524EUR
IoT security Linköpingtis, 2019-07-02 09:304455EUR / 5255EUR

Nyhetsbrev & Erbjudanden

Anmäl dig till vårt nyhetsbrev så får du information om aktuella rabatter på öppna kurser. Vi respekterar ditt privatliv, så att din e-postadress kommer endast att användas för sändning vårt nyhetsbrev. När som helst kan du ändra inställningarna eller helt avbeställa den.

Våra kunder

is growing fast!

We are looking to expand our presence in Sweden!

As a Business Development Manager you will:

  • expand business in Sweden
  • recruit local talent (sales, agents, trainers, consultants)
  • recruit local trainers and consultants

We offer:

  • Artificial Intelligence and Big Data systems to support your local operation
  • high-tech automation
  • continuously upgraded course catalogue and content
  • good fun in international team

If you are interested in running a high-tech, high-quality training and consulting business.

Apply now!