Big Data kurser och utbildning

Big Data kurser och utbildning

Lokala instruktörer ledda Big Data-kurser börjar med en introduktion till elementära begrepp i Big Data, sedan framsteg i programmeringsspråk och metoder som används för att utföra Data Analysis. Verktyg och infrastruktur för att möjliggöra stor datalagring, distribuerad bearbetning och skalbarhet diskuteras, jämförs och implementeras i demo övningar. Stor dataträning är tillgänglig som "live-träning" eller "fjärr-live-träning". Utbildning på plats kan genomföras lokalt på kundlokaler i Sverige eller i NobleProgs företagsutbildningscenter i Sverige . Fjärrutbildning sker genom en interaktiv fjärrskrivbord. NobleProg - Din lokala utbildningsleverantör

Machine Translated

Vittnesmål

★★★★★
★★★★★

Big Data läroplaner

Kurs Namn
Varaktighet
Översikt
Kurs Namn
Varaktighet
Översikt
35 timmar
Översikt
Den här instruktörsledda, liveutbildningen (på plats eller fjärrkontroll) riktar sig till proffs som vill starta en karriär inom Data Science .

I slutet av denna träning kommer deltagarna att kunna:

- Installera och konfigurera Python och MySql.
- Förstå vad Data Science är och hur det kan ge mervärde till praktiskt taget alla företag.
- Lär dig grunderna i kodning i Python
- Lär dig övervakade och övervakade Machine Learning och hur du implementerar dem och tolkar resultaten.

Kursformat

- Interaktiv föreläsning och diskussion.
- Massor av övningar och träning.
- Praktisk implementering i en levande lab-miljö.

Alternativ för kursanpassning

- För att begära en anpassad utbildning för denna kurs, vänligen kontakta oss för att ordna.
21 timmar
Översikt
Apache Accumulo är en sorterad, distribuerad nyckel- / värdelagring som ger robust, skalbar datalagring och hämtning. Det är baserat på designen av Go ogles BigTable och drivs av Apache Hadoop , Apache Zookeeper och Apache Thrift .

Den här instruktörsledda, livekursen täcker arbetsprinciperna bakom Accumulo och leder deltagarna genom utvecklingen av en Apache Accumulo på Apache Accumulo .

Kursformat

- Delföreläsning, delvis diskussion, praktisk utveckling och implementering, tillfälliga tester för att mäta förståelse
7 timmar
Översikt
Kafka Streams är ett bibliotek på klientsidan för att bygga applikationer och mikroservices vars data skickas till och från ett Kafka-meddelandesystem. Traditionellt har Apache Kafka förlitat sig på Apache Spark eller Apache Storm att bearbeta data mellan meddelandeproducenter och konsumenter. Genom att ringa Kafka Streams API från en applikation kan data behandlas direkt inom Kafka, vilket förbigår behovet av att skicka data till ett separat kluster för bearbetning.

I denna instruktörsledda, liveträning, kommer deltagarna att lära sig att integrera Kafka Streams i en uppsättning prov Java applikationer som skickar data till och från Apache Kafka för strömbehandling.

I slutet av denna träning kommer deltagarna att kunna:

- Förstå Kafka Streams funktioner och fördelar jämfört med andra strömbearbetningsramar
- Behandla strömdata direkt i ett Kafka-kluster
- Skriv en Java eller Scala applikation eller mikroservice som integreras med Kafka- och Kafka-strömmar
- Skriv kortfattad kod som omvandlar inmatade Kafka-ämnen till utgångs-Kafka-ämnen
- Bygg, paketera och distribuera applikationen

Publik

- utvecklare

Format av kursen

- Delföreläsning, delvis diskussion, övningar och tung praktisk övning

anteckningar

- För att begära en anpassad utbildning för denna kurs, vänligen kontakta oss för att ordna
28 timmar
Översikt
Mem SQL är ett i minne, distribuerat, SQL databashanteringssystem för moln och lokalt. Det är ett datalager i realtid som omedelbart ger insikter från levande och historiska data.

I denna instruktörsledda, live-träning kommer deltagarna att lära sig det väsentliga i Mem SQL för utveckling och administration.

I slutet av denna träning kommer deltagarna att kunna:

- Förstå de viktigaste begreppen och egenskaperna hos Mem SQL
- Installera, designa, underhålla och använda Mem SQL
- Optimera scheman i Mem SQL
- Förbättra frågor i Mem SQL
- Benchmark-prestanda i Mem SQL
- Bygg datatillämpningar i realtid med Mem SQL

Publik

- utvecklare
- Administratörer
- Driftingenjörer

Kursformat

- Delföreläsning, delvis diskussion, övningar och tung praktisk övning
21 timmar
Översikt
Prediktiv analys är processen med att använda dataanalys för att göra förutsägelser om framtiden Denna process använder data tillsammans med data mining, statistik och maskininlärningsteknik för att skapa en förutsägbar modell för prognoser för framtida händelser I den här instruktionsledda träningen lär deltagarna att använda Matlab för att bygga prediktiva modeller och tillämpa dem på stora provdatasatser för att förutsäga framtida händelser baserat på data Vid slutet av denna utbildning kommer deltagarna att kunna: Skapa prediktiva modeller för att analysera mönster i historiska och transaktionsdata Använd prediktiv modellering för att identifiera risker och möjligheter Bygg matematiska modeller som tar viktiga trender Använd data från enheter och affärssystem för att minska avfall, spara tid eller minska kostnader Publik utvecklare ingenjörer Domänexperter Kursens format Delföreläsning, diskussion, övningar och tung handson-övning .
7 timmar
Översikt
I denna instruktörsledda, liveträning kommer deltagarna att lära sig de grundläggande koncepten bakom MapR Stream Architecture när de utvecklar en realtidsströmningsapplikation.

I slutet av denna utbildning kan deltagarna bygga tillverkare och konsumentapplikationer för realtidsströmuppgifter.

Publik

- utvecklare
- Administratörer

Kursformat

- Delföreläsning, delvis diskussion, övningar och tung praktisk övning

Notera

- För att begära en anpassad utbildning för denna kurs, vänligen kontakta oss för att ordna.
14 timmar
Översikt
Magellan är en open source-distribuerad exekveringsmotor för geospatial analytics på big data. Implementerad ovanpå Apache Spark , den utökar Spark SQL och ger en relationell abstraktion för geospatial analytics.

Denna instruktörsledda, liveträning introducerar koncept och metoder för implementering av geospacial analytics och leder deltagarna genom skapandet av en prediktiv analysapplikation med Magellan on Spark.

I slutet av denna träning kommer deltagarna att kunna:

- Fråga effektivt, analysera och anslut geospatiala datasätt i skala
- Implementera geospatial data i business intelligence och prediktiva analysapplikationer
- Använd rumsligt sammanhang för att utöka kapaciteten för mobila enheter, sensorer, loggar och bärbara

Kursformat

- Interaktiv föreläsning och diskussion.
- Massor av övningar och träning.
- Praktisk implementering i en levande labbmiljö.

Alternativ för kursanpassning

- För att begära en anpassad utbildning för denna kurs, vänligen kontakta oss för att ordna.
14 timmar
Översikt
Apache Kylin är en extrem, distribuerad analysmotor för stora data I den här instruktörsledda levande träningen lär deltagarna att använda Apache Kylin för att skapa ett realtiddatagalleri Vid slutet av denna utbildning kommer deltagarna att kunna: Konsumera realtidsströmmande data med Kylin Använd Apache Kylins kraftfulla funktioner, inklusive snowflake schema support, ett rikt SQL-gränssnitt, gnista-kuber och undersökningsfördröjning Notera Vi använder den senaste versionen av Kylin (som det här skrivet, Apache Kylin v20) Publik Stora datainstruktörer Stora dataanalytiker Kursens format Delföreläsning, diskussion, övningar och tung handson-övning .
7 timmar
Översikt
Confluent KSQL is a stream processing framework built on top of Apache Kafka. It enables real-time data processing using SQL operations.

This instructor-led, live training (online or onsite) is aimed at developers who wish to implement Apache Kafka stream processing without writing code.

By the end of this training, participants will be able to:

- Install and configure Confluent KSQL.
- Set up a stream processing pipeline using only SQL commands (no Java or Python coding).
- Carry out data filtering, transformations, aggregations, joins, windowing, and sessionization entirely in SQL.
- Design and deploy interactive, continuous queries for streaming ETL and real-time analytics.

Format of the Course

- Interactive lecture and discussion.
- Lots of exercises and practice.
- Hands-on implementation in a live-lab environment.

Course Customization Options

- To request a customized training for this course, please contact us to arrange.
35 timmar
Översikt
KNIME is a free and open-source data analytics, reporting and integration platform. KNIME integrates various components for machine learning and data mining through its modular data pipelining concept. A graphical user interface and use of JDBC allows assembly of nodes blending different data sources, including preprocessing (ETL: Extraction, Transformation, Loading), for modeling, data analysis and visualization without, or with only minimal, programming. To some extent as advanced analytics tool KNIME can be considered as a SAS alternative.

Since 2006, KNIME has been used in pharmaceutical research, it also used in other areas like CRM customer data analysis, business intelligence and financial data analysis.
21 timmar
Översikt
KNIME Analytics-plattformen är ett ledande alternativ med öppen källkod för datadriven innovation, som hjälper dig att upptäcka potentialen gömd i dina data, min för ny insikt eller förutsäga nya framtider. Med mer än 1000 moduler, hundratals färdiga exempel, ett omfattande utbud av integrerade verktyg och det bredaste urvalet av avancerade algoritmer tillgängliga är KNIME Analytics Platform den perfekta verktygslådan för alla datavetare och affärsanalytiker.

Denna kurs för KNIME Analytics-plattformen är en idealisk möjlighet för nybörjare, avancerade användare och KNIME experter att introduceras till KNIME , lära sig att använda den mer effektivt och hur man skapar tydliga, omfattande rapporter baserade på KNIME arbetsflöden
21 timmar
Översikt
Kunskapsupptäckt i databaser (KDD) är processen för att upptäcka användbar kunskap från en datainsamling. Verklighetsapplikationer för denna teknik för data mining inkluderar marknadsföring, bedrägeri, telekommunikation och tillverkning.

I denna instruktörsledda, livekurs introducerar vi de processer som är involverade i KDD och genomför en serie övningar för att öva implementeringen av dessa processer.

Publik

- Dataanalytiker eller någon som är intresserad av att lära sig att tolka data för att lösa problem

Kursformat

- Efter en teoretisk diskussion av KDD kommer instruktören att presentera verkliga fall som kräver tillämpning av KDD för att lösa ett problem. Deltagarna kommer att förbereda, välja och rengöra provdatauppsättningar och använda sina förkunskaper om data för att föreslå lösningar baserade på resultaten från deras observationer.
21 timmar
Översikt
Stream Processing avser realtidsbehandling av "data i rörelse", det vill säga att göra beräkningar på data när de tas emot. Sådan data läses som kontinuerliga strömmar från datakällor som sensorhändelser, webbplatsanvändaraktivitet, finansiella affärer, kreditkortsväxlar, klickströmmar etc. Stream Processing kan läsa stora volymer inkommande data och ge värdefulla insikter nästan omedelbart.

I denna instruktörsledda, live-utbildning (på plats eller fjärrkontroll) kommer deltagarna att lära sig hur man ställer in och integrerar olika Stream Processing med befintliga stordatalagringssystem och relaterade mjukvaruapplikationer och mikroservices.

I slutet av denna träning kommer deltagarna att kunna:

- Installera och konfigurera olika Stream Processing ramverk, som Spark Streaming och Kafka Streaming.
- Förstå och välj den lämpligaste ramen för jobbet.
- Behandla data kontinuerligt, samtidigt och rekord-för-rekord.
- Integrera Stream Processing med befintliga databaser, datalager, datasjöar, etc.
- Integrera det mest lämpliga strömbearbetningsbiblioteket med företagsapplikationer och mikroservrar.

Publik

- utvecklare
- Programvaruarkitekter

Format Kursens

- Delföreläsning, delvis diskussion, övningar och tung praktisk övning

anteckningar

- För att begära en anpassad utbildning för denna kurs, vänligen kontakta oss för att ordna.
21 timmar
Översikt
Uppskattningar av saker för Internet eller IoT-marknadsvärde är enorma, eftersom IoT per definition är ett integrerat och diffunderat lager av enheter, sensorer och datorkraft som överlagrar hela konsument-, företags-till-företags- och statliga industrier. IoT kommer att redovisa ett allt större antal anslutningar: 1,9 miljarder enheter idag och 9 miljarder år 2018. Det året kommer det att vara ungefär lika med antalet smartphones, smarta TV-apparater, tabletter, bärbara datorer och datorer kombinerat. ; I konsumentutrymmet har många produkter och tjänster redan övergått till IoT, inklusive köks- och hushållsapparater, parkering, RFID, belysning och värmeprodukter och ett antal applikationer inom Industrial Internet. Men den underliggande tekniken i IoT är inget nytt, eftersom M2M-kommunikation existerade sedan Internetens födelse. Men vad som förändrats under de senaste åren är framväxten av ett antal billiga trådlösa tekniker som tillkom genom överväldigande anpassning av smarta telefoner och Tablet i varje hem. Explosiv tillväxt av mobila enheter ledde till nuvarande efterfrågan från IoT. & Nbsp; På grund av obundna möjligheter i IoT-verksamheten hoppade ett stort antal små och medelstora företagare i bandwagon av IoT Gold Rush. Också på grund av uppkomsten av öppen källkodelektronik och IoT-plattform blir kostnaderna för utveckling av IoT-systemet och ytterligare hantering av sin betydande produktion alltmer överkomliga. Befintliga ägare av elektroniska produkter upplever tryck för att integrera enheten med Internet eller Mobil app. & Nbsp; Denna utbildning är avsedd för en teknik och affärsöversyn av en ny industri, så att IOT-entusiaster / entreprenörer kan förstå grunderna för IoT-teknik och företag. Kursmål och nbsp; Kursens huvudsyfte är att introducera nya tekniska möjligheter, plattformar och fallstudier av IoT-implementering i hemmet och stadens automatisering (smarta hem och städer), industriellt internet, sjukvård, govt, mobilcell och andra områden. & nbsp; Grundläggande introduktion av alla element i IoT-Mekanisk, Elektronik / Sensorplattform, Trådlösa och trådlösa protokoll, Mobil till elektronikintegration, Mobil till företagsintegration, Dataanalys och Total kontrollplan. M2M trådlösa protokoll för IoT-WiFi, Zigbee / Zwave, Bluetooth, ANT +: När och var du ska använda vilken? & nbsp; Mobil / Skrivbord / Webapp - för registrering, datainsamling och kontroll & ndash; Tillgänglig & nbsp; M2M-datainsamlingsplattform för IoT- & ndash; Xively, Omega och NovoTech, etc. Säkerhetsproblem och säkerhetslösningar för IoT Open source / kommersiell elektronikplattform för IoT-Rasberry Pi, Adruino, ArmMbedLPC etc & nbsp; Öppna källkod / kommersiell företags molnplattform för IoT-Ayla, iO Bridge, Libellium, Axeda, Cisco-froskmoln Studier av företag och teknik hos några av de gemensamma IoT-enheterna som hemmaautomation, rökalarm, fordon, militär, & nbsp; hem hälsa etc. Målgrupp & nbsp; Investerare och IoT-entreprenörer & nbsp; Chefer och ingenjörer vars företag satsar på IoT-utrymme & nbsp; Affärsanalytiker & amp; Investerare
28 timmar
Översikt
MonetDB är en opensource-databas som pionjerar kolumnteknologin I denna instruktionsledda, levande träning kommer deltagarna att lära sig hur man använder MonetDB och hur man får mest ut av det Vid slutet av denna utbildning kommer deltagarna att kunna: Förstå MonetDB och dess funktioner Installera och börja med MonetDB Utforska och utför olika funktioner och uppgifter i MonetDB Accelerera leveransen av sitt projekt genom att maximera MonetDB-kapacitet Publik utvecklare Tekniska experter Kursens format Delföreläsning, diskussion, övningar och tung handson-övning .
14 timmar
Översikt
Audience

- Developers

Format of the Course

- Lectures, hands-on practice, small tests along the way to gauge understanding
21 timmar
Översikt
Cloudera Impala är en öppen källkod med massiv parallellbehandling (MPP) SQL-sökmotor för Apache Hadoop-kluster Impala gör det möjligt för användare att utfärda lowlatency SQL-frågor till data lagrade i Hadoop Distributed File System och Apache Hbase utan att behöva data rörelse eller transformation Publik Kursen riktar sig till analytiker och datavetenskapare som analyserar data lagrad i Hadoop via Business Intelligence eller SQL-verktyg Efter kursen kommer delegater att kunna Extrahera meningsfull information från Hadoop-kluster med Impala Skriv specifika program för att underlätta Business Intelligence i Impala SQL Dialect Felsöka Impala .
7 timmar
Översikt
Denna kurs behandlar hur man använder Hive SQL språk (AKA: Hive HQL, SQL på Hive , Hive QL) för personer som extraherar data från Hive
21 timmar
Översikt
Hortonworks Data Platform (HDP) är en open-source Apache Hadoop supportplattform som ger en stabil grund för att utveckla big data-lösningar på Apache Hadoop ekosystemet.

Den här instruktörsledda, liveträningen (på plats eller fjärrkontroll) introducerar Hortonworks Data Platform (HDP) och leder deltagarna genom implementeringen av Spark + Hadoop lösningen.

I slutet av denna träning kommer deltagarna att kunna:

- Använd Hortonworks för att pålitligt köra Hadoop i stor skala.
- Förena Hadoop säkerhets-, styrelseförmåga- och driftsfunktioner med Sparks agila analytiska arbetsflöden.
- Använd Hortonworks för att undersöka, validera, certifiera och stödja alla komponenter i ett Spark-projekt.
- Bearbeta olika typer av data, inklusive strukturerade, ostrukturerade, i rörelse och vila.

Kursformat

- Interaktiv föreläsning och diskussion.
- Massor av övningar och träning.
- Praktisk implementering i en levande lab-miljö.

Alternativ för kursanpassning

- För att begära en anpassad utbildning för denna kurs, vänligen kontakta oss för att ordna.
21 timmar
Översikt
Denna kurs introducerar HBase - en No SQL butik ovanpå Hadoop . Kursen är avsedd för utvecklare som kommer att använda HBase för att utveckla applikationer, och administratörer som kommer att hantera HBase-kluster.

Vi kommer att gå en utvecklare genom HBase-arkitektur och datamodellering och applikationsutveckling på HBase. Det kommer också att diskutera att använda MapReduce med HBase, och några administrationsämnen, relaterade till prestandaoptimering. Kursen är mycket praktisk med massor av labbövningar.

Varaktighet : 3 dagar

Publik : Utvecklare och administratörer
28 timmar
Översikt
Hadoop är ett populärt ramverk för stor databehandling Python är ett högkvalitets programmeringsspråk känt för sin tydliga syntax och kodläsbarhet I den här instruktörsledda träningen kommer deltagarna att lära sig hur man arbetar med Hadoop, MapReduce, Pig och Spark med Python, eftersom de går igenom flera exempel och använder fall Vid slutet av denna utbildning kommer deltagarna att kunna: Förstå de grundläggande begreppen bakom Hadoop, MapReduce, Pig och Spark Använd Python med Hadoop Distributed File System (HDFS), MapReduce, Pig och Spark Använd Snakebite för att programmera åt HDFS inom Python Använd mrjob för att skriva MapReduce jobb i Python Skriv Spark-program med Python Utvid funktionaliteten hos gris med Python UDF Hantera MapReduce-jobb och grisskript med Luigi Publik utvecklare IT-proffs Kursens format Delföreläsning, diskussion, övningar och tung handson-övning .
28 timmar
Översikt
Publik:

Denna kurs är avsedd att avmystifiera big data / hadoop-teknik och för att visa att det inte är svårt att förstå.
14 timmar
Översikt
Eftersom fler och fler mjukvaru- och IT-projekt flyttar från lokal bearbetning och datahantering till distribuerad bearbetning och stor datalagring, finner projektledare behovet av att uppgradera sina kunskaper och färdigheter för att förstå de begrepp och rutiner som är relevanta för Big Data-projekt och möjligheter Kursen introducerar projektledare till de mest populära Big Data-bearbetningsramarna: Hadoop I denna instruktörsutbildning lär deltagarna kärnkomponenterna i Hadoop ekosystemet och hur dessa tekniker kan användas för att lösa stora problem Vid lärandet av dessa fundament kommer deltagarna också att förbättra sin förmåga att kommunicera med utvecklarna och implementatörerna av dessa system samt de datavetenskapare och analytiker som många IT-projekt innebär Publik Projektledare som önskar implementera Hadoop i sin befintliga utvecklings- eller IT-infrastruktur Projektledare behöver kommunicera med tvärfunktionella team som inkluderar stora datainstruktörer, datavetenskapare och företagsanalytiker Kursens format Delföreläsning, diskussion, övningar och tung handson-övning .
21 timmar
Översikt
Hadoop är den mest populära Big Data-bearbetningsramen .
7 timmar
Översikt
This instructor-led, live training (online or onsite) is aimed at technical persons who wish to learn how to implement a machine learning strategy while maximizing the use of big data.

By the end of this training, participants will:

- Understand the evolution and trends for machine learning.
- Know how machine learning is being used across different industries.
- Become familiar with the tools, skills and services available to implement machine learning within an organization.
- Understand how machine learning can be used to enhance data mining and analysis.
- Learn what a data middle backend is, and how it is being used by businesses.
- Understand the role that big data and intelligent applications are playing across industries.

Format of the Course

- Interactive lecture and discussion.
- Lots of exercises and practice.
- Hands-on implementation in a live-lab environment.

Course Customization Options

- To request a customized training for this course, please contact us to arrange.
21 timmar
Översikt
Apache NiFi (Hortonworks DataFlow) är en realtid integrerad datalogistik och enkel händelsehanteringsplattform som gör det möjligt att flytta, spåra och automatisera data mellan system. Det är skriven med flödesbaserad programmering och ger ett webbaserat användargränssnitt för att hantera dataflöden i realtid.

I denna instruktörsledda, live-träning (på plats eller fjärrkontroll) kommer deltagarna att lära sig hur man distribuerar och hanterar Apache NiFi i en levande laboratoriemiljö.

I slutet av denna träning kommer deltagarna att kunna:

- Installera och konfigurera Apachi NiFi.
- Källa, transformera och hantera data från olika, distribuerade datakällor, inklusive databaser och big data sjöar.
- Automatisera dataflöden.
- Aktivera strömningsanalys.
- Använd olika metoder för intag av data.
- Förvandla Big Data och till affärsinblick.

Kursformat

- Interaktiv föreläsning och diskussion.
- Massor av övningar och träning.
- Praktisk implementering i en levande lab-miljö.

Alternativ för kursanpassning

- För att begära en anpassad utbildning för denna kurs, vänligen kontakta oss för att ordna.
14 timmar
Översikt
Teradata är en populär Relational Database Management System för att bygga storskaliga datalagringstillämpningar. Teradata uppnår detta genom parallellism.

Den här instruktörsledda, liveutbildningen (på plats eller fjärrkontroll) riktar sig till applikationsutvecklare och ingenjörer som vill behärska mer sofistikerade användningar av Teradata databasen.

I slutet av denna träning kommer deltagarna att kunna:

- Hantera Teradata utrymme.
- Skydda och distribuera data i Teradata .
- Läs Explain Plan.
- Förbättra SQL kompetens.
- Använd huvudverktygen för Teradata .

Kursformat

- Interaktiv föreläsning och diskussion.
- Massor av övningar och träning.
- Praktisk implementering i en levande labbmiljö.

Alternativ för kursanpassning

- För att begära en anpassad utbildning för denna kurs, vänligen kontakta oss för att ordna.
7 timmar
Översikt
Spark SQL är Apache Spark modul för att arbeta med strukturerad och ostrukturerad data. Spark SQL ger information om datastrukturen och beräkningen som utförs. Denna information kan användas för att utföra optimeringar. Två vanliga användningar för Spark SQL är:
- för att köra SQL frågor.
- att läsa data från en befintlig Hive installation.

I denna instruktörsledda, liveträning (på plats eller fjärrkontroll) kommer deltagarna att lära sig att analysera olika typer av datamängder med Spark SQL .

I slutet av denna träning kommer deltagarna att kunna:

- Installera och konfigurera Spark SQL .
- Utför dataanalys med hjälp av Spark SQL .
- Frågeställningar i olika format.
- Visualisera data och sökresultat.

Kursformat

- Interaktiv föreläsning och diskussion.
- Massor av övningar och träning.
- Praktisk implementering i en levande lab-miljö.

Alternativ för kursanpassning

- För att begära en anpassad utbildning för denna kurs, vänligen kontakta oss för att ordna.
14 timmar
Översikt
Apache Zeppelin är en webbaserad anteckningsbok för att fånga, utforska, visualisera och dela Hadoop och Spark-baserade data.

Den här instruktörsledda, liveträningen introducerar koncepten bakom interaktiv dataanalys och leder deltagarna genom implementeringen och användningen av Zeppelin i en enkelanvändare eller flera användarmiljöer.

I slutet av denna träning kommer deltagarna att kunna:

- Installera och konfigurera Zeppelin
- Utveckla, organisera, köra och dela data i ett webbläsarbaserat gränssnitt
- Visualisera resultaten utan att hänvisa till kommandoraden eller klusterdetaljer
- Kör och samarbeta om långa arbetsflöden
- Arbeta med något av ett antal plug-in-språk / databehandlings-backend, till exempel Scala (med Apache Spark ), Python (med Apache Spark ), Spark SQL , JDBC, Markdown och Shell.
- Integrera Zeppelin med Spark, Flink och Map Reduce
- Säkra instanser av flera användare av Zeppelin med Apache Shiro

Publik

- Dataingenjörer
- Dataanalytiker
- Datavetare
- Programvaruutvecklare

Kursformat

- Delföreläsning, delvis diskussion, övningar och tung praktisk övning
14 timmar
Översikt
Vespa en opensource stor databehandling och servering motor skapad av Yahoo Det används för att svara på användarfrågor, göra rekommendationer och tillhandahålla personligt innehåll och annonser i realtid Denna instruktionsledda, levande utbildning introducerar utmaningarna med att betjäna storskaliga data och går deltagare genom att skapa en applikation som kan beräkna svar på användarförfrågningar, över stora dataset i realtid Vid slutet av denna utbildning kommer deltagarna att kunna: Använd Vespa för att snabbt beräkna data (lagra, söka, rangordna, organisera) vid visningstid medan en användare väntar Implementera Vespa i befintliga applikationer med funktionssökning, rekommendationer och anpassning Integrera och distribuera Vespa med befintliga stora datasystem som Hadoop och Storm Publik utvecklare Kursens format Delföreläsning, diskussion, övningar och tung handson-övning .
Helg Big Data kurs, kvällBig Data utbildning, Big Data bootcamp, Big Data instruktörledd, Helg Big Data utbildning, Kväll Big Data kurs, Big Data coaching, Big Data instruktör, Big Data tränare, Big Data kurs, Big Data klasser, Big Data on-site, Big Data privata kurser, Big Data en till en utbildning

Rabatterade kurser

Nyhetsbrev & Erbjudanden

Anmäl dig till vårt nyhetsbrev så får du information om aktuella rabatter på öppna kurser. Vi respekterar ditt privatliv, så att din e-postadress kommer endast att användas för sändning vårt nyhetsbrev. När som helst kan du ändra inställningarna eller helt avbeställa den.

Våra kunder

is growing fast!

We are looking to expand our presence in Sweden!

As a Business Development Manager you will:

  • expand business in Sweden
  • recruit local talent (sales, agents, trainers, consultants)
  • recruit local trainers and consultants

We offer:

  • Artificial Intelligence and Big Data systems to support your local operation
  • high-tech automation
  • continuously upgraded course catalogue and content
  • good fun in international team

If you are interested in running a high-tech, high-quality training and consulting business.

Apply now!

This site in other countries/regions