Big Data Analytics in Health Träningskurs
Big data-analys innefattar processen att undersöka stora mängder olika datauppsättningar för att avslöja korrelationer, dolda mönster och andra användbara insikter.
Hälsoindustrin har enorma mängder komplexa heterogena medicinska och kliniska data. Att tillämpa big data-analyser på hälsodata ger en stor potential att få insikter för att förbättra leveransen av sjukvård. Emellertid innebär enorma mängder av dessa datamängder stora utmaningar i analyser och praktiska tillämpningar i en klinisk miljö.
I denna instruktörsledda, live-träning (fjärrkontroll) kommer deltagarna att lära sig att utföra big data-analys i hälsa när de går igenom en serie praktiska live-lab-övningar.
I slutet av denna träning kommer deltagarna att kunna:
- Installera och konfigurera big data-analysverktyg som Hadoop MapReduce och Spark
- Förstå egenskaperna för medicinsk information
- Använd big data-tekniker för att hantera medicinska data
- Studera big data system och algoritmer i samband med hälsoapplikationer
Publik
- utvecklare
- Datavetare
Kursformat
- Delföreläsning, delvis diskussion, övningar och tung praktisk övning.
Notera
- För att begära en anpassad utbildning för denna kurs, vänligen kontakta oss för att ordna.
Kursplan
Introduktion till Big Data Analytics i hälsa
Översikt över Big Data Analytics Technologies
- Apache Hadoop MapReduce
- Apache Spark
Installera och konfigurera Apache Hadoop MapReduce
Installera och konfigurera Apache Spark
Använda prediktiv modellering för hälsodata
Använda Apache Hadoop MapReduce för hälsodata
Utföra fenotypning och klustring av hälsodata
- Klassificering Utvärdering Metrics
- Klassificering Ensemble metoder
Använder Apache Spark för hälsodata
Arbetar med medicinsk ontologi
Använda grafanalys på hälsodata
Dimensionalitetsminskning på hälsodata
Arbeta med Patient Similarity Metrics
Felsökning
Sammanfattning och slutsats
Krav
- En förståelse för maskininlärning och datautvinningskoncept
- Avancerad programmeringserfarenhet (Python, Java, Scala)
- Kunskaper i data och ETL-processer
Open Training Courses require 5+ participants.
Big Data Analytics in Health Träningskurs - Booking
Big Data Analytics in Health Träningskurs - Enquiry
Big Data Analytics in Health - Consultancy Enquiry
Vittnesmål (1)
The VM I liked very much The Teacher was very knowledgeable regarding the topic as well as other topics, he was very nice and friendly I liked the facility in Dubai.
Safar Alqahtani - Elm Information Security
Kurs - Big Data Analytics in Health
Upcoming Courses
Relaterade Kurser
Python and Spark for Big Data (PySpark)
21 timmarI denna instruktörsledda, liveutbildning i Sverige kommer deltagarna att lära sig hur man använder Python och Spark tillsammans för att analysera big data medan de arbetar med praktiska övningar.
I slutet av denna utbildning kommer deltagarna att kunna:
- Lär dig hur du använder Spark med Python för att analysera Big Data.
- Arbeta med övningar som efterliknar verkliga fall.
- Använd olika verktyg och tekniker för big data-analys med PySpark.
Introduction to Graph Computing
28 timmarI denna instruktörsledda, liveutbildning i Sverige kommer deltagarna att lära sig om teknikerbjudandena och implementeringsmetoder för bearbetning av grafdata. Syftet är att identifiera verkliga objekt, deras egenskaper och relationer, sedan modellera dessa relationer och bearbeta dem som data med en Graph Computing (även känd som Graph Analytics) tillvägagångssätt. Vi börjar med en bred översikt och begränsar oss till specifika verktyg när vi går igenom en serie fallstudier, praktiska övningar och livedistributioner.
I slutet av denna utbildning kommer deltagarna att kunna:
- Förstå hur grafdata bevaras och korsas.
- Välj det bästa ramverket för en given uppgift (från grafdatabaser till ramverk för batchbearbetning.)
- Implementera Hadoop, Spark, GraphX och Pregel för att utföra grafberäkning över många maskiner parallellt.
- Se verkliga big data-problem i form av grafer, processer och övergångar.
Apache Spark MLlib
35 timmarMLlib är Sparks maskinlärningsbibliotek. Målet är att göra praktisk maskininlärning skalbar och enkel. Det består av vanliga inlärningsalgoritmer och verktyg, inklusive klassificering, regression, klustering, samarbetsfiltrering, dimensionalitetsminskning samt primitiv för optimering av lägre nivåer och API: er på högre nivå.
Den delar upp i två paket:
spark.mllib innehåller det ursprungliga API som är byggt ovanpå RDD: er.
spark.ml tillhandahåller API på högre nivå byggd ovanpå DataFrames för konstruktion av ML-rörledningar.
Publik
Kursen riktar sig till ingenjörer och utvecklare som vill använda ett inbyggt maskinbibliotek för Apache Spark
Artificial Intelligence - the most applied stuff - Data Analysis + Distributed AI + NLP
21 timmarDen här kursen är avsedd för utvecklare och datavetare som vill förstå och implementera AI i sina applikationer. Särskild uppmärksamhet ägnas åt dataanalys, distribuerad artificiell intelligens och naturlig språkbehandling.
Hortonworks Data Platform (HDP) for Administrators
21 timmarDenna instruktörsledda, liveutbildning i Sverige (online eller på plats) introducerar Hortonworks Data Platform (HDP) och leder deltagarna genom implementeringen av Spark + Hadoop-lösningen.
I slutet av denna utbildning kommer deltagarna att kunna:
- Använd Hortonworks för att tillförlitligt köra Hadoop i stor skala. Förena Hadoops funktioner för säkerhet, styrning och drift med Sparks agila analytiska arbetsflöden. Använd Hortonworks för att undersöka, validera, certifiera och stödja var och en av komponenterna i ett Spark-projekt. Bearbeta olika typer av data, inklusive strukturerad, ostrukturerad, i rörelse och i vila.
Apache Ambari: Efficiently Manage Hadoop Clusters
21 timmarApache Ambari är en open source-managementplattform för att tillhandahålla, hantera, övervaka och säkra Apache Hadoop kluster.
I denna instruktörsledda liveträning kommer deltagarna att lära sig hanteringsverktygen och praxis som Ambari tillhandahåller för att framgångsrikt hantera Hadoop kluster.
I slutet av denna träning kommer deltagarna att kunna:
- Ställ in ett live Big Data kluster med Ambari
- Använd Ambaris avancerade funktioner och funktioner i olika användningsfall
- Lägg till och ta bort noder sömlöst efter behov
- Förbättra ett Hadoop klustrets prestanda genom att ställa in och justera
Publik
- DevOps
- Systemadministratörer
- databasadministratörer
- Hadoop testare
Kursformat
- Delföreläsning, delvis diskussion, övningar och tung praktisk övning
Impala for Business Intelligence
21 timmarCloudera Impala är en frågemotor för massiv parallell bearbetning (MPP) SQL med öppen källkod för Apache Hadoop-kluster.
Impala gör det möjligt för användare att skicka frågor med låg latens SQL till data lagrade i Hadoop Distributed File System och Apache Hbase utan att kräva dataförflyttning eller transformation.
Publik
Den här kursen vänder sig till analytiker och datavetare som utför analys av data lagrad i Hadoop via Business Intelligence eller SQL verktyg.
Efter denna kurs kommer delegater att kunna
- Extrahera meningsfull information från Hadoop-kluster med Impala. Skriv specifika program för att underlätta Business Intelligence i Impala SQL Dialect. Felsöka Impala.
Data Analysis with Hive/HiveQL
7 timmarDenna kurs behandlar hur man använder Hive SQL språk (AKA: Hive HQL, SQL på Hive , Hive QL) för personer som extraherar data från Hive
Spark for Developers
21 timmarMÅL:
Denna kurs kommer att introducera Apache Spark . Studenterna kommer att lära sig hur Spark passar in i Big Data ekosystemet och hur man använder Spark för dataanalys. Kursen täcker gnisterskal för interaktiv dataanalys, gnistinternaler, gnist-API: er, gnist SQL , gnistrströmning, och maskininlärning och grafX.
PRIS:
Utvecklare / dataanalytiker
Magellan: Geospatial Analytics on Spark
14 timmarMagellan är en öppen källkod distribuerad exekutionsmotor för geospatiell analys av stora data. Genomförd ovanför Apache Spark utökar den Spark SQL och ger en relativ abstraktion för geospatiell analys.
Denna instruktörledda, levande träning introducerar begrepp och metoder för genomförande av geospatiell analys och vandrar deltagarna genom skapandet av en förutsägande analysansökan med Magellan på Spark.
Vid slutet av denna utbildning kommer deltagarna att kunna:
- Effektivt fråga, parsa och ansluta geospatiala dataset i skala
- Genomförande av geospatiala data i företagsintelligens och prediktiva analysapplikationer
- Använd rymdkontext för att utöka kapaciteten hos mobila enheter, sensorer, loggar och bärbara enheter
Format för kursen
- Interaktiv föreläsning och diskussion.
- Många övningar och övningar.
- Hand-on implementering i en live-lab miljö.
Kursanpassningsalternativ
- För att begära en anpassad utbildning för denna kurs, vänligen kontakta oss för att arrangera.
Apache Spark SQL
7 timmar Spark SQL är Apache Spark modul för att arbeta med strukturerad och ostrukturerad data. Spark SQL ger information om datastrukturen och beräkningen som utförs. Denna information kan användas för att utföra optimeringar. Två vanliga användningar för Spark SQL är:
- för att köra SQL frågor.
- att läsa data från en befintlig Hive installation.
I denna instruktörsledda, liveträning (på plats eller fjärrkontroll) kommer deltagarna att lära sig att analysera olika typer av datamängder med Spark SQL .
I slutet av denna träning kommer deltagarna att kunna:
- Installera och konfigurera Spark SQL .
- Utför dataanalys med hjälp av Spark SQL .
- Frågeställningar i olika format.
- Visualisera data och sökresultat.
Kursformat
- Interaktiv föreläsning och diskussion.
- Massor av övningar och träning.
- Praktisk implementering i en levande lab-miljö.
Alternativ för kursanpassning
- För att begära en anpassad utbildning för denna kurs, vänligen kontakta oss för att ordna.
A Practical Introduction to Stream Processing
21 timmarI denna instruktörsledda, liveutbildning i Sverige (på plats eller på distans) kommer deltagarna att lära sig hur man ställer in och integrerar olika Stream Processing ramverk med befintliga big data-lagringssystem och relaterade mjukvaruapplikationer och mikrotjänster.
I slutet av denna utbildning kommer deltagarna att kunna:
- Installera och konfigurera olika Stream Processing ramverk, som Spark Streaming och Kafka Streaming.
- Förstå och välj det mest lämpliga ramverket för jobbet.
- Bearbeta data kontinuerligt, samtidigt och på ett rekord-för-post-sätt.
- Integrera Stream Processing lösningar med befintliga databaser, datalager, datasjöar etc.
- Integrera det mest lämpliga strömbehandlingsbiblioteket med företagsapplikationer och mikrotjänster.
Apache Spark in the Cloud
21 timmarApache Spark inlärningskurva ökar långsamt i början, det krävs mycket ansträngning för att få den första returen. Denna kurs syftar till att hoppa igenom den första tuffa delen. Efter att ha tagit den här kursen kommer deltagarna att förstå grunderna i Apache Spark , de kommer tydligt att differentiera RDD från DataFrame, de kommer att lära sig Python och Scala API, de kommer att förstå exekutörer och uppgifter, osv. Genom att följa bästa praxis fokuserar den här kursen starkt på molnutsättning, Databricks och AWS. Studenterna kommer också att förstå skillnaderna mellan AWS EMR och AWS Glue, en av de senaste Spark-tjänsterna i AWS.
PUBLIK:
Data Engineer, DevOps , Data Scientist
Apache Spark Streaming with Scala
21 timmarDenna instruktörsledda, liveutbildning i Sverige (online eller på plats) riktar sig till mjukvaruingenjörer som vill strömma big data med Spark Streaming och Scala.
I slutet av denna utbildning kommer deltagarna att kunna:
- Skapa Spark-applikationer med programmeringsspråket Scala.
- Använd Spark Streaming för att bearbeta kontinuerliga dataströmmar.
- Bearbeta strömmar av realtidsdata med Spark Streaming.