SMACK Stack för Data Science Träningskurs
SMACK är en samling dataplattformsprogramvaror, nämligen Apache Spark, Apache Mesos, Apache Akka, Apache Cassandra och Apache Kafka. Genom att använda SMACK-stacken kan användare skapa och skalera dataprocesserande plattformar.
Denna instruktörförledd, live-träning (online eller på plats) är riktad till data scientist som vill använda SMACK-stacken för att bygga dataprocesserande plattformar för stora datalösningar.
Vid slutet av denna träning kommer deltagarna att kunna:
- Implementera en data pipeline-arkitektur för att processera stora datamängder.
 - Utveckla en klusterinfrastruktur med Apache Mesos och Docker.
 - Analysera data med Spark och Scala.
 - Hantera ostrukturerade data med Apache Cassandra.
 
Kursens format
- Interaktiv föreläsning och diskussion.
 - Många övningar och praktik.
 - Handson-implementering i en live-lab-miljö.
 
Kursanpassningsalternativ
- För att begära en anpassad träning för denna kurs, vänligen kontakta oss för att arrangera.
 
Kursplan
Introduktion
Översikt över SMACK Stack
- Vad är Apache Spark? Apache Sparks egenskaper
 - Vad är Apache Mesos? Apache Mesoss egenskaper
 - Vad är Apache Akka? Apache Ackas egenskaper
 - Vad är Apache Cassandra? Apache Cassandras egenskaper
 - Vad är Apache Kafka? Apache Kafkas egenskaper
 
Scala-språket
- Scalas syntax och struktur
 - Scalas kontrollflöde
 
Förberedandet av utvecklingsmiljön
- Installation och konfiguration av SMACK-stacken
 - Installation och konfiguration av Docker
 
Apache Akka
- Använda aktörer
 
Apache Cassandra
- Skapa en databas för läsåtgärder
 - Arbeta med säkerhetskopian och återställning
 
Kopplingar
- Skapa en ström
 - Bygga ett Akka-program
 - Lagra data med Cassandra
 - Granska kopplingar
 
Apache Kafka
- Arbeta med kluster
 - Skapa, publicera och konsumera meddelanden
 
Apache Mesos
- Allokera resurser
 - Kör kluster
 - Arbeta med Apache Aurora och Docker
 - Kör tjänster och jobb
 - Distribuera Spark, Cassandra och Kafka på Mesos
 
Apache Spark
- Hantera dataflöden
 - Arbeta med RDDs och dataframes
 - Utför dataanalys
 
Felsökning
- Hantera tjänstefel och felmeddelanden
 
Sammanfattning och slutsats
Krav
- En förståelse för dataprocesserande system
 
Målgrupp
- Data Scientist
 
Öppna Utbildningskurser kräver 5+ deltagare.
SMACK Stack för Data Science Träningskurs - Bokning
SMACK Stack för Data Science Träningskurs - Fråga
SMACK Stack för Data Science - Konsultfråga
Konsultfråga
Vittnesmål (1)
very interactive...
Richard Langford
Kurs - SMACK Stack for Data Science
Kommande Kurser
Relaterade Kurser
Anaconda Ekosystem för Data Scientists
14 timmarDenna instruktörsledda, liveutbildning i Sverige (online eller på plats) riktar sig till datavetare som vill använda Anaconda-ekosystemet för att fånga, hantera och distribuera paket och arbetsflöden för dataanalys på en enda plattform.
I slutet av denna utbildning kommer deltagarna att kunna:
- Installera och konfigurera Anaconda komponenter och bibliotek.
 - Förstå de grundläggande begreppen, funktionerna och fördelarna med Anaconda.
 - Hantera paket, miljöer och kanaler med hjälp av Anaconda Navigator.
 - Använd Conda-, R- och Python-paket för datavetenskap och maskininlärning.
 - Lär känna några praktiska användningsfall och tekniker för att hantera flera datamiljöer.
 
Big Data Business Intelligence för Telecom och Communication Service Providers
35 timmarÖversikt
Communications tjänsteleverantörer (CSP) står inför tryck för att minska kostnaderna och maximera genomsnittliga intäkter per användare (ARPU), samtidigt som en utmärkt kundupplevelse säkerställs, men datavolymerna fortsätter att växa. Den globala mobila datatrafiken kommer att växa med en kombinerad årlig tillväxthastighet (CAGR) på 78 procent mot 2016, upp till 10,8 exabytes per månad.
Samtidigt genererar CSPs stora volymer av data, inklusive samtaldetaljer (CDR), nätverksdata och kunddata. Företag som fullt ut utnyttjar dessa data får en konkurrenskraftig marginal. Enligt en ny undersökning av The Economist Intelligence Unit, företag som använder data-driven beslutsfattande njuter av en 5-6% ökning i produktivitet. Men 53% av företagen använder bara hälften av sina värdefulla data, och en fjärdedel av respondenterna noterade att enorma mängder användbara data går oförglömliga. Datavolymerna är så höga att manuell analys är omöjlig, och de flesta legacy mjukvarusystem kan’t behålla, vilket resulterar i värdefulla data som tas bort eller ignoreras.
Med Big Data & Analytics’ höghastighet, skalbar stordata programvara, kan CSPs gruva alla sina data för bättre beslutsfattande på mindre tid. Olika Big Data produkter och tekniker ger en end-to-end programplattform för att samla in, förbereda, analysera och presentera insikter från stora data. Tillämpningsområdena inkluderar nätverksprestandaövervakning, bedrägeridetektion, kundchurndetektion och kreditriskanalys. Big Data & Analytics produkter skala för att hantera terabytes av data men genomförandet av sådana verktyg kräver en ny typ av molnbaserad databassystem som Hadoop eller massiv skala parallell dataprocessor (KPU etc.)
Denna kurs arbetar på Big Data BI för Telco täcker alla framväxande nya områden där CSP investerar för produktivitetsökning och öppnar nya affärsinkomster. Kursen kommer att ge en komplett 360-grad överblick av Big Data BI i Telco så att beslutsfattare och chefer kan ha en mycket bred och omfattande översikt över möjligheter Big Data BI i Telco för produktivitet och inkomstvinster.
Kursens mål
Huvudsyftet med kursen är att introducera nya Big Data affärsintelligence tekniker i 4 sektorer av Telecom Business (Marketing/Sales, Network Operation, Financial Operation och Customer Relation Management). Studenter kommer att introduceras till att följa:
- Introduktion till Big Data-vad är 4Vs (volym, hastighet, variation och sannolikhet) i Big Data- Generation, utvinning och hantering från Telco perspektiv
 - Hur Big Data analytik skiljer sig från arvdata analytik
 - In-house motivering av Big Data -Telco perspektiv
 - Introduktion till Hadoop Ecosystem- bekantskap med alla Hadoop verktyg som Hive, Pig, SPARC –när och hur de används för att lösa Big Data problem
 - Hur Big Data extraheras för analys för analysverktyg-hur Business Analysis’s kan minska sina smärtspunkter av insamling och analys av data genom integrerad Hadoop dashboardmetod
 - Grundläggande introduktion av Insight-analys, visualiseringsanalys och prediktiv analys för Telco
 - Customer Churn analytics och Big Data-how Big Data analytics kan minska kundchurn och kund missnöje i Telco-case studier
 - Analys av nätverksfel och servicefel från nätverksmetadata och IPDR
 - Finansiell analys - bedrägeri, vassage och ROI-bedömning från försäljning och operativa data
 - Kundens förvärvsproblem-Targetmarknadsföring, kundsegmentering och cross-sales från försäljningsdata
 - Introduktion och sammanfattning av alla Big Data analytiska produkter och var de passar i Telco analytiska utrymme
 - Slutsats-hur man tar steg för steg tillvägagångssätt för att introducera Big Data Business Intelligence i din organisation
 
Målgrupp
- Nätverksoperationer, finansiella chefer, CRM-chefer och topp IT-chefer i Telco CIO-kontoret.
 - Business Analytiker i Telco
 - CFO kontorsledare/analytiker
 - Operativa chefer
 - QA ledare
 
En praktisk introduktion till data science
35 timmarDeltagare som avslutar denna utbildning kommer att få en praktisk, verklighetsnära förståelse för Data Science och dess relaterade tekniker, metodik och verktyg.
Deltagarna får möjlighet att tillämpa detta kunskap i praktiken genom handsonövningar. Gruppinteraktion och instruktörsfeedback utgör ett viktigt element i kursen.
Kursen börjar med en introduktion till grundläggande koncept inom Data Science, för att sedan fortsätta med de verktyg och metodik som används inom området.
Målgrupp
- Utvecklare
 - Tekniska analytiker
 - IT-konsulter
 
Kursformat
- Del föreläsning, del diskussion, övningar och intensiv praktisk tillämpning
 
Obs!
- För att begära en anpassad utbildning för denna kurs, vänligen kontakta oss för att arrangera.
 
Data Science for Big Data Analytics
35 timmarBig data är datauppsättningar som är så omfattande och komplexa att traditionell applikationsprogramvara för databehandling är otillräcklig för att hantera dem. Stora datautmaningar inkluderar fånga data, datalagring, dataanalys, sökning, delning, överföring, visualisering, fråga, uppdatering och informationssekretess.
Data Science essential för Marknadssäljare/Marknadsföringsspecialister
21 timmarDenna kurs är avsedd för marknadsförings- och försäljningsprofesionella som avser att dyka djupare in i tillämpningen av data science inom marknadsföring/försäljning. Kursen ger detaljerad behandling av olika data science-tekniker som används för "upsale", "cross-sale", marknadssegmentering, branding och CLV.
Skillnad mellan marknadsföring och försäljning - Hur skiljer sig försäljning och marknadsföring åt?
På ett mycket enkelt sätt kan försäljning beskrivas som en process som fokuserar eller syftar på enskilda personer eller små grupper. Marknadsföring syftar däremot till en större grupp eller det allmänna publiket. Marknadsföring inkluderar forskning (identifiering av kundbehov), utveckling av produkter (produktion av innovativa produkter) och främjande av produkten (genom reklam) samt skapandet av medvetenhet om produkten bland konsumenterna. På så sätt innebär marknadsföring generering av leads eller potentiella kunder. När produkten har släppts på marknaden är det uppgiften för försäljningspersonen att övertala kunden att köpa produkten. Försäljning innebär omvandlingen av leads eller potentiella kunder till inköp och beställningar, medan marknadsföring riktas mot långsiktigare mål, medan försäljning handlar om kortfristiga mål.
Jupyter för Data Science Team
7 timmarDenna instruktörsledda, liveutbildning på plats eller online introducerar idén om samarbetsutveckling inom datavetenskap och demonstrerar hur man använder Jupyter för att spåra och delta i ett team i "livscykeln för en beräkningsidé". Den vägleder deltagarna genom skapandet av ett exempelprojekt inom datavetenskap baserat på Jupyter-ekosystemet.
Efter denna utbildning kommer deltagarna att kunna:
- Installera och konfigurera Jupyter, inklusive skapande och integration av ett teamrepository på Git.
 - Använda Jupyter-funktioner som tillägg, interaktiva widgetar, multiuserläge och mer för att möjliggöra projektkollaboration.
 - Skapa, dela och organisera Jupyter Notebooks med teammedlemmar.
 - Välja mellan Scala, Python, R, för att skriva och köra kod mot stora datasystem såsom Apache Spark, allt via Jupyter-gränssnittet.
 
Kaggle
14 timmarDenna instruktörsledda, liveutbildning i Sverige (online eller på plats) riktar sig till datavetare och utvecklare som vill lära sig och bygga sina karriärer i Data Science med hjälp av Kaggle.
I slutet av denna utbildning kommer deltagarna att kunna:
- Lär dig mer om datavetenskap och maskininlärning.
 - Utforska dataanalys.
 - Lär dig mer om Kaggle och hur det fungerar.
 
MATLAB Grundläggande, Data Science & Rapportgenerering
35 timmarI den första delen av den här utbildningen går vi igenom grunderna i MATLAB och dess funktion som både ett språk och en plattform. I den här diskussionen ingår en introduktion till MATLAB syntax, matriser och matriser, datavisualisering, skriptutveckling och objektorienterade principer.
I den andra delen visar vi hur man använder MATLAB för datautvinning, maskininlärning och prediktiv analys. För att ge deltagarna ett tydligt och praktiskt perspektiv på MATLABs tillvägagångssätt och kraft gör vi jämförelser mellan att använda MATLAB och att använda andra verktyg som kalkylblad, C, C++ och Visual Basic.
I den tredje delen av utbildningen lär sig deltagarna hur de kan effektivisera sitt arbete genom att automatisera sin databehandling och rapportgenerering.
Under hela kursen kommer deltagarna att omsätta de idéer som de lärt sig genom praktiska övningar i en labbmiljö i praktiken. I slutet av utbildningen kommer deltagarna att ha ett grundligt grepp om MATLAB:s kapacitet och kommer att kunna använda den för att lösa verkliga datavetenskapsproblem samt för att effektivisera sitt arbete genom automatisering.
Bedömningar kommer att genomföras under hela kursen för att mäta framstegen.
Kursens upplägg
- Kursen innehåller teoretiska och praktiska övningar, inklusive falldiskussioner, provkodsinspektion och praktisk implementering.
 
Not
- Övningssessioner kommer att baseras på förarrangerade exempeldatarapportmallar. Om du har specifika krav, vänligen kontakta oss för att ordna.
 
Machine Learning för Data Science med Python
21 timmarDenna instruktörsledda, liveutbildning online eller på plats är riktad till dataanalytiker, utvecklare eller blivande dataforskare på mellannivå som vill tillämpa maskininlärningstekniker i Python för att dra slutsatser, göra förutsägelser och automatisera datadrivna beslut.
Vid kursens slut kommer deltagarna kunna:
- Förstå och skilja mellan olika viktiga maskininlärningsparadigm.
 - Uppleva förberedelsetekniker för data och modellutvärderingsmått.
 - Tillämpa maskininlärningsalgoritmer för att lösa verkliga dataproblem.
 - Använda Python bibliotek och Jupyter-notebooks för praktisk utveckling.
 - Bygga modeller för förutsägelser, klassificering, rekommendationer och klusteranalys.
 
Accelerating Python Pandas Workflows with Modin Accelerera Python Pandas-arbetsflöden med Modin
14 timmarDenna instruktörsledda, liveutbildning i Sverige (online eller på plats) riktar sig till datavetare och utvecklare som vill använda Modin för att bygga och implementera parallella beräkningar med Pandas för snabbare dataanalys.
I slutet av denna utbildning kommer deltagarna att kunna:
- Konfigurera den miljö som krävs för att börja utveckla Pandas arbetsflöden i stor skala med Modin.
 - Förstå funktionerna, arkitekturen och fördelarna med Modin.
 - Känn till skillnaderna mellan Modin, Dask och Ray.
 - Utför Pandas operationer snabbare med Modin.
 - Implementera hela Pandas API:et och funktionerna.
 
Python-programmering för finans
35 timmarPython är ett programmeringsspråk som har fått stort genomslag i finansindustrin. Antaget av de största investeringsbankerna och hedgefonderna används det för att skapa en bred uppsättning finansiella program, från grundläggande handelssystem till riskhanteringssystem.
I detta instruktörsledda liveutbildning kommer deltagarna att lära sig hur man använder Python för att utveckla praktiska applikationer för att lösa ett antal specifika finansrelaterade problem.
När denna utbildning är avslutad kommer deltagarna att kunna:
- Förstå grunderna i Python-programmeringsspråket
 - Ladda ner, installera och underhålla de bästa utvecklingsverktygen för att skapa finansiella applikationer i Python
 - Välja och använda de lämpligaste Python-paket och programmeringstekniker för att organisera, visualisera och analysera finansiell data från olika källor (CSV, Excel, databaser, webben etc.)
 - Bygga applikationer som löser problem relaterade till tillgångsallokering, riskanalys, investeringsprestanda och mer
 - Felsöka, integrera, distribuera och optimera en Python-applikation
 
Målgrupp
- Utvecklare
 - Analytiker
 - Kvantitativa analytiker (Quants)
 
Kursformat
- Del föreläsning, del diskussion, övningar och mycket praktisk övning
 
Notering
- Denna utbildning syftar till att erbjuda lösningar på några av de huvudsakliga problem som finansprofessorer står inför. Om du har ett specifikt ämne, verktyg eller teknik som du önskar lägga till eller utveckla mer, vänligen kontakta oss för att ordna.
 
Python i data vetenskap
35 timmarKursen kommer att hjälpa deltagarna att förbereda sig för webbapplikationsutveckling med Python-programmering och dataanalys. Sådan datavisualisering är ett utmärkt verktyg för toppledningen i beslutsfattande.
GPU Data Science with NVIDIA RAPIDS
14 timmarDenna instruktörsledda, live-utbildning (online eller på plats) riktar sig till datavetare och utvecklare som vill använda RAPIDS för att bygga GPU-accelererade datapipelines, arbetsflöden och visualiseringar, med tillämpning av maskininlärningsalgoritmer, såsom XGBoost, cuML etc.
Efter avslutad utbildning kommer deltagarna kunna:
- Installera nödvändiga utvecklingsmiljöer för att bygga datamodeller med NVIDIA RAPIDS.
 - Förstå funktioner, komponenter och fördelar med RAPIDS.
 - Utnyttja GPUer för att accelerera slut- till-slut datapipelines och analyser.
 - Implementera GPU-accelererad datapreparation och ETL med cuDF och Apache Arrow.
 - Lära sig hur man utför maskininlärningsuppgifter med XGBoost- och cuML-algoritmer.
 - Bygga datavisualiseringar och utföra grafanalyser med cuXfilter och cuGraph.
 
Python och Spark för Big Data (PySpark)
21 timmarI denna instruktörsledda, liveträning i Sverige kommer deltagarna att lära sig hur man använder Python och Spark tillsammans för att analysera big data medan de arbetar med praktiska övningar.
I slutet av denna utbildning kommer deltagarna att kunna:
- Lär dig hur du använder Spark med Python för att analysera Big Data.
 - Arbeta med övningar som efterliknar verkliga fall.
 - Använda olika verktyg och tekniker för analys av stora datamängder med hjälp av PySpark.
 
Stratio: Rocket och Intelligence Modules med PySpark
14 timmarStratio är en datacentrisk plattform som integrerar stora data, AI och styrning i en enda lösning. Dess Rocket- och Intelligence-moduler möjliggör snabb datautforskning, transformering och avancerad analys i företagsmiljöer.
Denna instruktörsledda, levande utbildning (online eller på plats) riktar sig till mellannivådatafagliga personer som vill använda Rocket- och Intelligence-modulerna i Stratio effektivt med PySpark, med fokus på loopstrukturer, användardefinierade funktioner och avancerad datalogi.
Vid slutet av denna utbildning kommer deltagarna att kunna:
- Navigera och arbeta inom Stratio-plattformen med Rocket- och Intelligence-modulerna.
 - Använda PySpark i samband med datainsamling, transformering och analys.
 - Använda loopar och villkorlig logik för att kontrollera datarutiner och funktioner för databehandling.
 - Skapa och hantera användardefinierade funktioner (UDFs) för återanvändbara databehandlingsoperationer i PySpark.
 
Kursformat
- Interaktiv föreläsning och diskussion.
 - Många övningar och praktik.
 - Hands-on-implementering i en levande labbmiljö.
 
Kursanpassningsalternativ
- För att begära en anpassad utbildning för denna kurs, kontakta oss för att arrangera.