Data Mining with R Träningskurs
R är ett fritt programmeringsspråk med öppen källkod för statistisk beräkning, dataanalys och grafik. R används av ett växande antal chefer och dataanalytiker inom företag och akademi. R har ett brett utbud av paket för data mining.
Kursplan
Källor till metoder
- Artificiell intelligens
- Maskininlärning
- Statistics
- Datakällor
Förbehandling av data
- Dataimport/export
- Datautforskning och visualisering
- Dimensionalitetsminskning
- Att hantera saknade värden
- R-paket
Data mining huvuduppgifter
- Automatisk eller halvautomatisk analys av stora mängder data
- Extrahera tidigare okända intressanta mönster
- grupper av dataposter (klusteranalys)
- ovanliga uppgifter (avvikelsedetektering)
- beroenden (association rule mining)
Data mining
- Anomalidetektering (Outlier/ändring/avvikelsedetektering)
- Associationsregelinlärning (beroendemodellering)
- Klustring
- Klassificering
- Regression
- Sammanfattning
- Frekvent mönsterbrytning
- Text Mining
- Beslutsträd
- Regression
- Neural Networks
- Sekvensgruvdrift
- Frekvent mönsterbrytning
Datamuddring, datafiske, datasnokning
Krav
God R-kunskap.
Open Training Courses require 5+ participants.
Data Mining with R Träningskurs - Booking
Data Mining with R Träningskurs - Enquiry
Data Mining with R - Consultancy Enquiry
Vittnesmål (1)
Very tailored to needs.
Yashan Wang
Kurs - Data Mining with R
Upcoming Courses
Relaterade Kurser
Knowledge Discovery in Databases (KDD)
21 timmarKunskap upptäckt i databaser (KDD) är processen att upptäcka användbar kunskap från en insamling av data. Verkliga applikationer för denna data mining teknik inkluderar marknadsföring, bedrägeri upptäckt, telekommunikation och tillverkning.
I denna instruktörledda, levande kurs introducerar vi de processer som är inblandade i KDD och utför en serie övningar för att öva genomförandet av dessa processer.
Publiken
- Dataanalytiker eller någon som är intresserad av att lära sig hur man tolkar data för att lösa problem
Format för kursen
- Efter en teoretisk diskussion om KDD kommer instruktören att presentera verkliga fall som kräver tillämpningen av KDD för att lösa ett problem. Deltagarna kommer att förbereda, välja och rengöra provdata uppsättningar och använda sina tidigare kunskaper om data för att föreslå lösningar baserat på resultaten av sina observationer.
Introduction to Data Visualization with Tidyverse and R
7 timmarTidyverse är en samling mångsidiga R-paket för rengöring, bearbetning, modellering och visualisering av data. Några av de paket som ingår är: ggplot2, dplyr, tidyr, readr, purrr och tibble.
I denna instruktörsledda, liveträning, kommer deltagarna att lära sig att manipulera och visualisera data med hjälp av verktygen som ingår i Tidyverse .
I slutet av denna träning kommer deltagarna att kunna:
- Utför dataanalys och skapa tilltalande visualiseringar
- Dra användbara slutsatser från olika datamängder av provdata
- Filtrera, sortera och sammanfatta data för att besvara utforskande frågor
- Förvandla bearbetade data till informativa raddiagram, stapelldiagram, histogram
- Importera och filtrera data från olika datakällor, inklusive Excel , CSV- och SPSS-filer
Publik
- Nybörjare till R-språket
- Nybörjare till dataanalys och datavisualisering
Kursformat
- Delföreläsning, delvis diskussion, övningar och tung praktisk övning
Statistics with SPSS Predictive Analytics Software
14 timmarGo al:
Lära sig att arbeta med SPSS på självständighetsnivå
Adressaterna:
Analytiker, forskare, forskare, studenter och alla de som vill skaffa sig förmågan att använda SPSS-paketet och lära sig populär datateknik.
Data Mining
21 timmarKursen kan förses med alla verktyg, inklusive gratis programvara och applikationer för öppen källkodsutvinning
From Data to Decision with Big Data and Predictive Analytics
21 timmarPublik
Om du försöker skapa mening med de data du har tillgång till eller vill analysera ostrukturerade data som finns tillgängliga på nätet (som Twitter, Länkade in osv ...) är den här kursen för dig.
Det riktar sig mest till beslutsfattare och människor som behöver välja vilka data som är värda att samla in och vad som är värt att analysera.
Det är inte riktat till personer som konfigurerar lösningen, men dessa människor kommer dock att dra nytta av den stora bilden.
Leveransläge
Under kursen kommer delegaterna att presenteras med fungerande exempel på mestadels open source-teknik.
Korta föreläsningar följs av presentation och enkla övningar av deltagarna
Innehåll och programvara som används
All mjukvara som används uppdateras varje gång kursen körs, så vi kontrollerar de senaste versionerna som möjligt.
Det täcker processen från att skaffa, formatera, bearbeta och analysera data, för att förklara hur man automatiserar beslutsfattande med maskininlärning.
Oracle SQL Intermediate - Data Extraction
14 timmarSyftet med kursen är att göra det möjligt för deltagarna att behärska hur man arbetar med SQL språket i Oracle databasen för dataextraktion på mellannivå.
Data Mining and Analysis
28 timmarIntroductory R for Biologists
28 timmarR är ett fritt programmeringsspråk med öppen källkod för statistisk beräkning, dataanalys och grafik. R används av ett växande antal chefer och dataanalytiker inom företag och akademi. R har också hittat följare bland statistiker, ingenjörer och forskare utan datorprogrammeringsfärdigheter som tycker det är lätt att använda. Dess popularitet beror på den ökande användningen av data mining för olika mål såsom fastställda annonspriser, snabbare hitta nya läkemedel eller finjustera finansiella modeller. R har ett brett utbud av paket för data mining.
Data Mining & Machine Learning with R
14 timmarR är ett gratis programmeringsspråk med öppen källkod för statistisk beräkning, dataanalys och grafik. R används av ett växande antal chefer och dataanalytiker inom företag och den akademiska världen. R har ett brett utbud av paket för datautvinning.
Data Visualization
28 timmarKursen är avsedd för ingenjörer och beslutsfattare som arbetar med data mining och knoweldge-upptäckt.
Du kommer att lära dig att skapa effektiva tomter och sätt att presentera och representera dina data på ett sätt som tilltalar beslutsfattarna och hjälper dem att förstå dold information.
Data Science for Big Data Analytics
35 timmarBig data är datauppsättningar som är så omfattande och komplexa att traditionell applikationsprogramvara för databehandling är otillräcklig för att hantera dem. Stora datautmaningar inkluderar fånga data, datalagring, dataanalys, sökning, delning, överföring, visualisering, fråga, uppdatering och informationssekretess.
Process Mining
21 timmarprocess Mining, eller Automated Business Process Discovery (ABPD), är en teknik som använder algoritmer för att händelse loggar för att analysera affärs processer. Process brytning går utöver data lagring och data analys; den överbryggar data med processer och ger insikter om trender och mönster som påverkar process effektiviteten.
format för kursen
- kursen inleds med en översikt över de vanligaste teknikerna för process utvinning. Vi diskuterar de olika processidentifieringsalgoritmerna och verktygen som används för att upptäcka och modellera processer baserade på rå händelse data. Fallstudier i verkliga livet unders öks och data uppsättningar analyseras med hjälp av ProM Open-Source Framework.
Data Vault: Building a Scalable Data Warehouse
28 timmarI denna instruktörsledda, liveutbildning i Sverige kommer deltagarna att lära sig hur man bygger en Data Vault.
I slutet av denna utbildning kommer deltagarna att kunna:
- Förstå arkitekturen och designkoncepten bakom Data Vault 2.0, och dess interaktion med Big Data, NoSQL och AI.
- Använd datavalvtekniker för att möjliggöra granskning, spårning och inspektion av historiska data i ett datalager.
- Utveckla en konsekvent och repeterbar ETL-process (extrahera, transformera, ladda).
- Bygg och distribuera mycket skalbara och repeterbara lager.
MonetDB
28 timmarFoundation R
7 timmarMålet med kursen är att göra det möjligt för deltagarna att få en behärskning av grundläggande för R och hur man arbetar med data.