Kursplan

Uppdelning av ämnen på daglig basis: (Varje session är 2 timmar)

Dag-1: Session -1: Business Översikt över varför Big Data Business Intelligence in Telco.

  • Fallstudier från T-Mobile, Verizon etc.
  • Big Data anpassningshastighet i nordamerikanska telekom och hur de anpassar sin framtida affärsmodell och verksamhet kring Big Data BI
  • Användningsområde i bred skala
  • Nätverks- och tjänstehantering
  • Kundavgång Management
  • Data Integration & Dashboardvisualisering
  • Bedrägerihantering
  • Business Regelgenerering
  • Kundprofilering
  • Lokaliserad annonstryckning

Dag-1: Session-2: Introduktion av Big Data-1

  • Huvudegenskaper för Big Data-volym, variation, hastighet och sanningsenlighet. MPP-arkitektur för volym.
  • Data Warehouses – statiskt schema, långsamt utvecklande dataset
  • MPP Databases som Greenplum, Exadata, Teradata, Netezza, Vertica etc.
  • Hadoop Baserade lösningar – inga villkor för datauppsättningens struktur.
  • Typiskt mönster: HDFS, MapReduce (crunch), hämta från HDFS
  • Batch-lämpad för analytisk/icke-interaktiv
  • Volym : CEP-strömmande data
  • Typiska val – CEP-produkter (t.ex. Infostreams, Apama, MarkLogic etc)
  • Mindre produktionsklar – Storm/S4
  • NoSQL Databases – (kolumn och nyckel-värde): Lämpar sig bäst som analytiskt komplement till datalager/databas

Dag-1 : Session -3 : Introduktion till Big Data-2

NoSQL lösningar

  • KV Store - Keyspace, Flare, SchemaFree, RAMCloud, Oracle NoSQL Database (OnDB)
  • KV Store - Dynamo, Voldemort, Dynomite, SubRecord, Mo8onDb, DovetailDB
  • KV Store (hierarkisk) - GT.m, Cache
  • KV Store (beställd) - TokyoTyrant, Lightcloud, NMDB, Luxio, MemcacheDB, Actord
  • KV Cache - Memcached, Repcached, Coherence, Infinispan, EXtremeScale, JBossCache, Velocity, Terracoqua
  • Tuple Store - Gigaspaces, Coord, Apache River
  • Objekt Database - ZopeDB, DB40, Shoal
  • Document Store - CouchDB, Cloudant, Couchbase, MongoDB, Jackrabbit, XML-Databases, ThruDB, CloudKit, Prsevere, Riak-Basho, Scalaris
  • Wide Columnar Store - BigTable, HBase, Apache Cassandra, Hypertable, KAI, OpenNeptune, Qbase, KDI

Datavarianter: Introduktion till Data Cleaning nummer i Big Data

  • RDBMS – statisk struktur/schema, främjar inte smidig, utforskande miljö.
  • NoSQL – semistrukturerad, tillräckligt med struktur för att lagra data utan exakt schema innan data lagras
  • Datarensningsproblem

Dag-1: Session-4: Big Data Introduktion-3: Hadoop

  • När ska man välja Hadoop?
  • STRUKTURERAD - Företagsdatalager/databaser kan lagra enorma data (till en kostnad) men påtvinga struktur (inte bra för aktiv utforskning)
  • HALVSTRUKTURERAD data – svårt att göra med traditionella lösningar (DW/DB)
  • Lagerdata = ENORM ansträngning och statisk även efter implementering
  • För variation och volym av data, knäppt på råvaruhårdvara – HADOOP
  • Vara H/W behövs för att skapa ett Hadoop kluster

Introduktion till Map Reduce /HDFS

  • MapReduce – distribuera datoranvändning över flera servrar
  • HDFS – gör data tillgänglig lokalt för beräkningsprocessen (med redundans)
  • Data – kan vara ostrukturerad/schemalös (till skillnad från RDBMS)
  • Utvecklaransvar för att förstå data
  • Programming MapReduce = arbetar med Java (för-/nackdelar), laddar data manuellt till HDFS

Dag-2: Session-1.1: Spark: I minnesdistribuerad databas

  • Vad är "In memory"-behandling?
  • Spark SQL
  • Spark SDK
  • Spark API
  • RDD
  • Spark Lib
  • Hanna
  • Hur man migrerar ett befintligt Hadoop system till Spark

Dag-2 Session -1.2: Storm -Realtidsbearbetning i Big Data

  • Strömmar
  • Groddar
  • Bultar
  • Topologier

Dag-2: Session-2: Big Data Management System

  • Rörliga delar, beräkningsnoder startar/misslyckas :ZooKeeper - För konfigurations-/koordinations-/namntjänster
  • Komplex pipeline/arbetsflöde: Oozie – hantera arbetsflöde, beroenden, seriekedja
  • Distribuera, konfigurera, klusterhantering, uppgradering etc (sys admin) :Ambari
  • In Cloud: Whirr
  • Utvecklande Big Data plattformsverktyg för spårning
  • ETL-lagerapplikationsproblem

Dag-2: Session-3: Predictive analytics i Business Intelligence -1: Fundamental Techniques & Machine learning based BI:

  • Introduktion till maskininlärning
  • Att lära sig klassificeringstekniker
  • Bayesian Prediction-förberedande träningsfil
  • Markov slumpmässigt fält
  • Övervakat och oövervakat lärande
  • Särdragsextraktion
  • Stöd Vector Machine
  • Neuralt nätverk
  • Förstärkningsinlärning
  • Big Data stort variabelt problem -Slumpmässig skog (RF)
  • Representationsinlärning
  • Djup lärning
  • Big Data Automationsproblem – Multi-modell ensemble RF
  • Automatisering genom Soft10-M
  • LDA och ämnesmodellering
  • Agile lärande
  • Agentbaserat lärande- Exempel från Telco-drift
  • Distribuerat lärande – Exempel från Telco-drift
  • Introduktion till Open source-verktyg för prediktiv analys: R, Rapidminer, Mahut
  • Mer skalbart Analytic-Apache Hama, Spark och CMU Graph lab

Dag-2: Session-4 Predictive analytics ekosystem-2: Vanliga prediktiva analytiska problem i Telecom

  • Insiktsanalys
  • Visualiseringsanalytisk
  • Strukturerad prediktiv analys
  • Ostrukturerad prediktiv analys
  • Kundprofilering
  • Rekommendation Motor
  • Mönsterdetektering
  • Upptäckt av regel/scenario – misslyckande, bedrägeri, optimering
  • Rotorsak upptäckt
  • Sentimentanalys
  • CRM-analys
  • Nätverksanalys
  • Textanalys
  • Teknikstödd granskning
  • Bedrägerianalys
  • Realtidsanalys

Dag-3 : Session-1 : Nätverksdriftsanalys – rotorsaksanalys av nätverksfel, tjänstavbrott från metadata, IPDR och CRM:

  • CPU-användning
  • Minnesanvändning
  • QoS-köanvändning
  • Enhetstemperatur
  • Gränssnittsfel
  • IoS-versioner
  • Routing händelser
  • Latensvariationer
  • Syslog-analys
  • Paketförlust
  • Lastsimulering
  • Topologi slutledning
  • Prestandatröskel
  • Enhetsfällor
  • IPDR (IP detailed record) insamling och bearbetning
  • Användning av IPDR-data för abonnentbandbreddsförbrukning, nätverksgränssnitt, modemstatus och diagnostik
  • HFC-information

Dag-3: Session-2: Verktyg för analys av nätverkstjänstfel:

  • Nätverksöversikt Dashboard: övervaka övergripande nätverksinstallationer och spåra din organisations nyckelprestandaindikatorer
  • Peak Period Analysis Dashboard: förstå applikations- och prenumeranttrender som driver toppanvändning, med platsspecifik granularitet
  • Routing Efficiency Dashboard: kontrollera nätverkskostnader och skapa affärscase för kapitalprojekt med en fullständig förståelse för sammankoppling och transitrelationer
  • Realtidsunderhållningsinstrumentpanel: åtkomst till mätvärden som är viktiga, inklusive videovisningar, varaktighet och videokvalitet för upplevelsen (QoE)
  • IPv6 Transition Dashboard: undersök den pågående adoptionen av IPv6 i ditt nätverk och få insikt i applikationer och enheter som driver trender
  • Fallstudie-1: Alcatel-Lucents Big Network Analytics (BNA) Data Miner
  • Multidimensionell mobil intelligens (m.IQ6)

Dag-3: Session 3: Big Data BI för Marketing/Försäljning – Förstå försäljning/marknadsföring från försäljningsdata: (Alla av dem kommer att visas med en liveförutsägande analytisk demo)

  • För att identifiera klienter med högsta hastighet
  • För att identifiera kunder för en given produkt
  • För att identifiera rätt produktuppsättning för en kund (Recommendation Engine)
  • Marknadssegmenteringsteknik
  • Korsförsäljning och uppförsäljningsteknik
  • Klientsegmenteringsteknik
  • Teknik för prognostisering av försäljningsintäkter

Dag-3: Session 4: BI behövs för Telco CFO-kontor:

  • Översikt över Business Analysarbeten som behövs på ett CFO-kontor
  • Riskanalys på nyinvestering
  • Intäkter, vinstprognoser
  • Prognos för nya kundförvärv
  • Förlustprognoser
  • Bedrägerianalys om ekonomi (detaljer nästa session)

Dag-4: Session-1: Fraud prevention BI från Big Data i Telco-Fraud analytic:

  • Bandbreddsläckage / Bandbreddsbedrägeri
  • Leverantörsbedrägeri/överdebitering för projekt
  • Kundåterbetalning/skadebedrägerier
  • Bedrägerier med reseersättning

Dag-4: Session-2: Från churning-prediktion till churn-prevention:

  • 3 typer av avhopp: aktiv/avsiktlig, roterande/oavsiktlig, passiv ofrivillig
  • 3 klassificering av churned kunder: Total, Hidden, Partial
  • Förstå CRM-variabler för churn
  • Insamling av kundbeteendedata
  • Insamling av kunduppfattningsdata
  • Insamling av kunddemografisk data
  • Rengöring av CRM-data
  • Ostrukturerad CRM-data (kundsamtal, biljetter, e-postmeddelanden) och deras konvertering till strukturerad data för Churn-analys
  • Social Media CRM-nytt sätt att extrahera kundnöjdhetsindex
  • Fallstudie-1: T-Mobile USA: Churn-minskning med 50 %

Dag-4: Session-3: Hur man använder prediktiv analys för grundorsaksanalys av missnöje hos kunder:

  • Fallstudie -1: Koppla missnöje till problem – Redovisning, tekniska fel som tjänstavbrott, dålig bandbreddstjänst
  • Fallstudie-2: Big Data QA-instrumentpanel för att spåra kundnöjdhetsindex från olika parametrar som eskalering av samtal, kritiska problem, väntande serviceavbrottshändelser etc.

Dag-4: Session-4: Big Data Instrumentpanel för snabb åtkomst av olika data och visning:

  • Integrering av befintlig applikationsplattform med Big Data Dashboard
  • Big Data ledning
  • Fallstudie av Big Data Dashboard: Tableau och Pentaho
  • Använd appen Big Data för att driva platsbaserad annons
  • Spårningssystem och ledning

Dag-5: Session-1: Hur man motiverar Big Data BI-implementering inom en organisation:

  • Definiera ROI för Big Data implementering
  • Fallstudier för att spara analytikertid för insamling och förberedelse av data – ökad produktivitetsökning
  • Fallstudier av intäktsvinst från kundförlust
  • Intäktsvinst från platsbaserad och annan riktad annons
  • En integrerad kalkylbladsmetod för att beräkna ca. kostnad kontra intäktsvinst/besparingar från Big Data implementering.

Dag-5: Session-2: Steg för steg-procedur för att ersätta äldre datasystem till Big Data System:

  • Förstå praktiska Big Data Migration Roadmap
  • Vilken är den viktiga information som behövs innan en Big Data-implementering utformas
  • Vilka är de olika sätten att beräkna volym, hastighet, variation och sanningshalt för data
  • Hur man uppskattar datatillväxt
  • Fallstudier i 2 Telco

Dag-5: Session 3 & 4: Granskning av Big Data leverantörer och recension av deras produkter. Frågestund:

  • Accenture Alcatel-Lucent
  • Amazon –A9
  • APTEAN (tidigare CDC-programvara)
  • Cisco System
  • Cloudera
  • Dell
  • EMC
  • GoodData Corporation
  • Guavus
  • Hitachi datasystem
  • Hortonworks
  • Huawei
  • HP
  • IBM
  • Informatica
  • Intel
  • Jaspersoft
  • Microsoft
  • MongoDB (tidigare 10Gen)
  • MU Sigma
  • Netapp
  • Operalösningar
  • Oracle
  • Pentaho
  • Platfora
  • Qliktech
  • Kvant
  • Rackspace
  • Revolution Analytics
  • Salesforce
  • SAP
  • SAS Institutet
  • Sisense
  • Software AG/Terracotta
  • Soft10 Automation
  • Splunk
  • Sqrrl
  • Supermicro
  • Tableau Programvara
  • Teradata
  • Tänk Big Analytics
  • Tidemark Systems
  • VMware (Del av EMC)

Krav

  • Bör ha grundläggande kunskaper om verksamhetsdrift och datasystem inom Telecom inom sin domän
  • Måste ha grundläggande förståelse för SQL/Oracle eller relationsdatabas
  • Grundläggande förståelse för statistik (i Excel-nivåer)
 35 timmar

Antal deltagare



Price per participant

Vittnesmål (2)

Relaterade Kategorier