Big Data Analytics in Health Träningskurs
Big data-analys innefattar processen att undersöka stora mängder olika datauppsättningar för att avslöja korrelationer, dolda mönster och andra användbara insikter.
Hälsoindustrin har enorma mängder komplexa heterogena medicinska och kliniska data. Att tillämpa big data-analyser på hälsodata ger en stor potential att få insikter för att förbättra leveransen av sjukvård. Emellertid innebär enorma mängder av dessa datamängder stora utmaningar i analyser och praktiska tillämpningar i en klinisk miljö.
I denna instruktörsledda, live-träning (fjärrkontroll) kommer deltagarna att lära sig att utföra big data-analys i hälsa när de går igenom en serie praktiska live-lab-övningar.
I slutet av denna träning kommer deltagarna att kunna:
- Installera och konfigurera big data-analysverktyg som Hadoop MapReduce och Spark
- Förstå egenskaperna för medicinsk information
- Använd big data-tekniker för att hantera medicinska data
- Studera big data system och algoritmer i samband med hälsoapplikationer
Publik
- utvecklare
- Datavetare
Kursformat
- Delföreläsning, delvis diskussion, övningar och tung praktisk övning.
Notera
- För att begära en anpassad utbildning för denna kurs, vänligen kontakta oss för att ordna.
Kursplan
Introduktion till Big Data Analytics i hälsa
Översikt över Big Data Analytics Technologies
- Apache Hadoop MapReduce
- Apache Spark
Installera och konfigurera Apache Hadoop MapReduce
Installera och konfigurera Apache Spark
Använda prediktiv modellering för hälsodata
Använda Apache Hadoop MapReduce för hälsodata
Utföra fenotypning och klustring av hälsodata
- Klassificering Utvärdering Metrics
- Klassificering Ensemble metoder
Använder Apache Spark för hälsodata
Arbetar med medicinsk ontologi
Använda grafanalys på hälsodata
Dimensionalitetsminskning på hälsodata
Arbeta med Patient Similarity Metrics
Felsökning
Sammanfattning och slutsats
Krav
- En förståelse för maskininlärning och datautvinningskoncept
- Avancerad programmeringserfarenhet (Python, Java, Scala)
- Kunskaper i data och ETL-processer
Open Training Courses require 5+ participants.
Big Data Analytics in Health Träningskurs - Booking
Big Data Analytics in Health Träningskurs - Enquiry
Big Data Analytics in Health - Consultancy Enquiry
Vittnesmål (1)
The VM I liked very much The Teacher was very knowledgeable regarding the topic as well as other topics, he was very nice and friendly I liked the facility in Dubai.
Safar Alqahtani - Elm Information Security
Kurs - Big Data Analytics in Health
Upcoming Courses
Relaterade Kurser
Python and Spark for Big Data (PySpark)
21 timmarI denna instruktörsledda, liveträning i Sverige kommer deltagarna att lära sig hur man använder Python och Spark tillsammans för att analysera big data medan de arbetar med praktiska övningar.
I slutet av denna utbildning kommer deltagarna att kunna:
- Lär dig hur du använder Spark med Python för att analysera Big Data.
- Arbeta med övningar som efterliknar verkliga fall.
- Använda olika verktyg och tekniker för analys av stora datamängder med hjälp av PySpark.
Introduction to Graph Computing
28 timmarI denna instruktörsledda, liveträning i Sverige kommer deltagarna att lära sig om teknikerbjudandena och implementeringsmetoderna för bearbetning av grafdata. Målet är att identifiera verkliga objekt, deras egenskaper och relationer, sedan modellera dessa relationer och bearbeta dem som data med hjälp av en Graph Computing (även känd som Graph Analytics) metod. Vi börjar med en bred översikt och begränsar oss till specifika verktyg när vi går igenom en serie fallstudier, praktiska övningar och live-distributioner.
I slutet av denna utbildning kommer deltagarna att kunna:
- Förstå hur diagramdata bevaras och gås igenom.
- Välj det bästa ramverket för en viss uppgift (från grafdatabaser till ramverk för batchbearbetning).
- Implementera Hadoop, Spark, GraphX och Pregel för att utföra grafberäkning på många datorer parallellt.
- Se verkliga big data-problem i form av grafer, processer och traverser.
Artificial Intelligence - the most applied stuff - Data Analysis + Distributed AI + NLP
21 timmarDen här kursen är avsedd för utvecklare och datavetare som vill förstå och implementera AI i sina applikationer. Särskild uppmärksamhet ägnas åt dataanalys, distribuerad artificiell intelligens och behandling av naturligt språk.
Apache Spark MLlib
35 timmarMLlib är Sparks maskinlärningsbibliotek. Målet är att göra praktisk maskininlärning skalbar och enkel. Det består av vanliga inlärningsalgoritmer och verktyg, inklusive klassificering, regression, klustering, samarbetsfiltrering, dimensionalitetsminskning samt primitiv för optimering av lägre nivåer och API: er på högre nivå.
Den delar upp i två paket:
spark.mllib innehåller det ursprungliga API som är byggt ovanpå RDD: er.
spark.ml tillhandahåller API på högre nivå byggd ovanpå DataFrames för konstruktion av ML-rörledningar.
Publik
Kursen riktar sig till ingenjörer och utvecklare som vill använda ett inbyggt maskinbibliotek för Apache Spark
Hortonworks Data Platform (HDP) for Administrators
21 timmarDen här instruktörsledda, liveutbildningen i Sverige (online eller på plats) introducerar Hortonworks Data Platform (HDP) och vägleder deltagarna genom distributionen av Spark + Hadoop-lösningen.
I slutet av denna utbildning kommer deltagarna att kunna:
- Använd Hortonworks för att på ett tillförlitligt sätt köra Hadoop i stor skala.
- Förena Hadoop:s säkerhets-, styrnings- och driftfunktioner med Sparks flexibla analysarbetsflöden.
- Använd Hortonworks för att undersöka, validera, certifiera och stödja var och en av komponenterna i ett Spark-projekt.
- Bearbeta olika typer av data, inklusive strukturerade, ostrukturerade, i rörelse och i vila.
Apache Ambari: Efficiently Manage Hadoop Clusters
21 timmarApache Ambari är en hanteringsplattform med öppen källkod för provisionering, hantering, övervakning och skydd av Apache Hadoop-kluster.
I denna instruktörsledda liveträning kommer deltagarna att lära sig de hanteringsverktyg och metoder som tillhandahålls av Ambari för att framgångsrikt hantera Hadoop kluster.
I slutet av denna utbildning kommer deltagarna att kunna:
- Konfigurera ett livekluster Big Data med Ambari
- Tillämpa Ambaris avancerade funktioner och funktionalitet på olika användningsfall
- Lägg till och ta bort noder sömlöst efter behov
- Förbättra prestanda för ett Hadoop-kluster genom justering och justering
Publik
- DevOps
- Systemadministratörer
- Dba
- Hadoop Professionella testare
Kursens upplägg
- Delvis föreläsning, delvis diskussion, övningar och tung praktisk övning
Impala for Business Intelligence
21 timmarCloudera Impala är en öppen källkod för massivt parallell bearbetning (MPP) SQL frågemotor för Apache Hadoop-kluster.
Impala gör det möjligt för användare att utfärda frågor med låg latens SQL till data som lagras i Hadoop Distributed File System och Apache Hbase utan att data flyttas eller transformeras.
Publik
Kursen riktar sig till analytiker och datavetare som utför analyser på data som lagras i Hadoop via Business Intelligence eller SQL verktyg.
Efter denna kurs kommer delegaterna att kunna
- Extrahera meningsfull information från Hadoop kluster med Impala.
- Skriv specifika program för att underlätta Business Intelligens på Impala SQL Dialekt.
- Felsök Impala.
Data Analysis with Hive/HiveQL
7 timmarDenna kurs behandlar hur man använder Hive SQL språk (AKA: Hive HQL, SQL på Hive , Hive QL) för personer som extraherar data från Hive
Hadoop and Spark for Administrators
35 timmarDenna instruktörsledda, liveutbildning i Sverige (online eller på plats) riktar sig till systemadministratörer som vill lära sig hur man konfigurerar, distribuerar och hanterar Hadoop kluster inom sin organisation.
I slutet av denna utbildning kommer deltagarna att kunna:
- Installera och konfigurera Apache Hadoop.
- Förstå de fyra huvudkomponenterna i Hadoop ekosystem: HDFS, MapReduce, YARN och Hadoop Common.
- Använd Hadoop Distributed File System (HDFS) för att skala ett kluster till hundratals eller tusentals noder.
- Konfigurera HDFS för att fungera som lagringsmotor för Spark-distributioner på plats.
- Ställ in Spark för att komma åt alternativa lagringslösningar som Amazon S3 och NoSQL databassystem som Redis, Elasticsearch, Couchbase, Aerospike, etc.
- Utför administrativa uppgifter som provisionering, hantering, övervakning och säkrande av ett Apache Hadoop-kluster.
A Practical Introduction to Stream Processing
21 timmarI denna instruktörsledda, liveutbildning i Sverige (på plats eller på distans) kommer deltagarna att lära sig hur man ställer in och integrerar olika Stream Processing ramverk med befintliga big data-lagringssystem och relaterade mjukvaruapplikationer och mikrotjänster.
I slutet av denna utbildning kommer deltagarna att kunna:
- Installera och konfigurera olika Stream Processing ramverk, som Spark Streaming och Kafka Streaming.
- Förstå och välj det mest lämpliga ramverket för jobbet.
- Bearbeta data kontinuerligt, samtidigt och på ett rekord-för-post-sätt.
- Integrera Stream Processing lösningar med befintliga databaser, datalager, datasjöar etc.
- Integrera det mest lämpliga strömbehandlingsbiblioteket med företagsapplikationer och mikrotjänster.
Magellan: Geospatial Analytics on Spark
14 timmarMagellan är en öppen källkod distribuerad exekutionsmotor för geospatiell analys av stora data. Genomförd ovanför Apache Spark utökar den Spark SQL och ger en relativ abstraktion för geospatiell analys.
Denna instruktörledda, levande träning introducerar begrepp och metoder för genomförande av geospatiell analys och vandrar deltagarna genom skapandet av en förutsägande analysansökan med Magellan på Spark.
Vid slutet av denna utbildning kommer deltagarna att kunna:
- Effektivt fråga, parsa och ansluta geospatiala dataset i skala
- Genomförande av geospatiala data i företagsintelligens och prediktiva analysapplikationer
- Använd rymdkontext för att utöka kapaciteten hos mobila enheter, sensorer, loggar och bärbara enheter
Format för kursen
- Interaktiv föreläsning och diskussion.
- Många övningar och övningar.
- Hand-on implementering i en live-lab miljö.
Kursanpassningsalternativ
- För att begära en anpassad utbildning för denna kurs, vänligen kontakta oss för att arrangera.
Apache Spark for .NET Developers
21 timmarDenna instruktörsledda, liveutbildning i Sverige (online eller på plats) riktar sig till utvecklare som vill utföra big data-analyser med Apache Spark i sina .NET-applikationer.
I slutet av denna utbildning kommer deltagarna att kunna:
- Installera och konfigurera Apache Spark.
- Förstå hur .NET implementerar Spark API:er så att de kan nås från en .NET-applikation.
- Utveckla databehandlingsapplikationer med C# eller F#, som kan hantera datamängder vars storlek mäts i terabyte och pedabyte.
- Utveckla maskininlärningsfunktioner för en .NET-applikation med Apache Spark-funktioner.
- Utför explorativ analys med hjälp av SQL frågor om stora datamängder.
SMACK Stack for Data Science
14 timmarDenna instruktörsledda, liveutbildning i Sverige (online eller på plats) riktar sig till datavetare som vill använda SMACK-stacken för att bygga databehandlingsplattformar för big data-lösningar.
I slutet av denna utbildning kommer deltagarna att kunna:
- Implementera en datapipeline-arkitektur för bearbetning av big data.
- Utveckla en klusterinfrastruktur med Apache Mesos och Docker.
- Analysera data med Spark och Scala.
- Hantera ostrukturerad data med Apache Cassandra.
Apache Spark Fundamentals
21 timmarDenna instruktörsledda, liveutbildning i Sverige (online eller på plats) riktar sig till ingenjörer som vill sätta upp och distribuera Apache Spark system för att bearbeta mycket stora mängder data.
I slutet av denna utbildning kommer deltagarna att kunna:
- Installera och konfigurera Apache Spark.
- Bearbeta och analysera snabbt mycket stora datamängder.
- Förstå skillnaden mellan Apache Spark och Hadoop MapReduce och när du ska använda vilken.
- Integrera Apache Spark med andra verktyg för maskininlärning.