[email protected]. Agenda Daten -> Informationen -> Wissen (Status Quo) Intelligente...

25

Transcript of [email protected]. Agenda Daten -> Informationen -> Wissen (Status Quo) Intelligente...

Page 2: Marc.hirschleber@hpstg.de. Agenda Daten -> Informationen -> Wissen (Status Quo) Intelligente Datenanalysen (Predictive Analytics, Unterschiede zu klassischen.

[email protected]

Agenda

Daten -> Informationen -> Wissen (Status Quo)

Intelligente Datenanalysen (Predictive Analytics,Unterschiede zu klassischen BI-Lösungen, Enterprise Performance Management)

KXEN Life-Demo

F & A(Proof-of-Value für IUG-Mitglieder )

Page 3: Marc.hirschleber@hpstg.de. Agenda Daten -> Informationen -> Wissen (Status Quo) Intelligente Datenanalysen (Predictive Analytics, Unterschiede zu klassischen.

[email protected]

Legacydata

web

DataWarehouse

RDBMSDataMart

We (take) care about yourINFORMATION!

Software Engineering (> 15 Jahre)

Daten-Management (> 10 Jahre)

Intelligente Datenanalysen (> 7 Jahre)

(Data Mining) Produkte seit 1998 im deutschsprachigen Raum eingeführt

(Deutsche Telekom, AOL Deutschland, ABB, Fraunhofer Institut, Gruner + Jahr ...)

Page 4: Marc.hirschleber@hpstg.de. Agenda Daten -> Informationen -> Wissen (Status Quo) Intelligente Datenanalysen (Predictive Analytics, Unterschiede zu klassischen.

[email protected]

Gründung im Juli 1998Gründung im Juli 1998Firmensitz in San Francisco, R&D in FrankreichFirmensitz in San Francisco, R&D in FrankreichErfahrenes Management TeamErfahrenes Management Team

R. Haddad (CEO), E. Marcade (CTO), M. Bera (CSO), J. Gerault (CFO)R. Haddad (CEO), E. Marcade (CTO), M. Bera (CSO), J. Gerault (CFO)

Aktiver wissenschaftlicher BeiratAktiver wissenschaftlicher Beirat Vladimir Vapnik, Gregory Piatetsky-Shapiro, Gilbert Saporta, Yann Le Cun, Bernhard Schölkopf u.a.Vladimir Vapnik, Gregory Piatetsky-Shapiro, Gilbert Saporta, Yann Le Cun, Bernhard Schölkopf u.a.

KXEN Analytic Framework in 3. VersionKXEN Analytic Framework in 3. Version 400+ Kunden setzen KXEN produktiv ein400+ Kunden setzen KXEN produktiv einPartner: SAP, Cognos, BO, Teradata, SPSS u.a.Partner: SAP, Cognos, BO, Teradata, SPSS u.a.

Page 5: Marc.hirschleber@hpstg.de. Agenda Daten -> Informationen -> Wissen (Status Quo) Intelligente Datenanalysen (Predictive Analytics, Unterschiede zu klassischen.

[email protected]

OperationalSystems

Break Even

RO

I (%

)

NegativeReturns

PositiveReturns

Time (Years)

Business Intelligence

Predictive Analytics

Cumulative

ROI

Source: Jack Noonan, 2002

3 komplementäre Bereiche eines modernen

analytischen Unternehmens

Page 6: Marc.hirschleber@hpstg.de. Agenda Daten -> Informationen -> Wissen (Status Quo) Intelligente Datenanalysen (Predictive Analytics, Unterschiede zu klassischen.

[email protected]

UNDERSTAND  Customer Satisfaction Product Revenue  Cost of Goods Sold  HR Turnover

BusinessIntelligence

OLAP

DataQuality

Query/ReportData

Warehouse

PredictiveAnalytics

Recommendations

Scoring

Data Mining

OPTIMIZE ROI Analysis Customer Retention Promotions Demand Planning Quality Improvement

ENABLE  Customer Interaction  Inventory Control  Supply Chain Mgmt  Quality Measurement   Employee Self Service

OperationalSystems

ERP

ERM

WEB

CRM

Source: Jack Noonan, 2002

Ein modernes analytisches Unternehmen entsteht aus 3 komplementären Bereichen

Page 7: Marc.hirschleber@hpstg.de. Agenda Daten -> Informationen -> Wissen (Status Quo) Intelligente Datenanalysen (Predictive Analytics, Unterschiede zu klassischen.

[email protected]

Intelligente Datenanalysen (1)

0%

2%

4%

6%

8%

10%K

ündi

gerr

ate

[pro

Jah

r]

Ost Süd West NordRegion

Page 8: Marc.hirschleber@hpstg.de. Agenda Daten -> Informationen -> Wissen (Status Quo) Intelligente Datenanalysen (Predictive Analytics, Unterschiede zu klassischen.

[email protected]

Intelligente Datenanalysen (2)

0%

2%

4%

6%

8%

10%K

ündi

gerr

ate

[pro

Jah

r]

Ost Süd West NordRegion

Page 9: Marc.hirschleber@hpstg.de. Agenda Daten -> Informationen -> Wissen (Status Quo) Intelligente Datenanalysen (Predictive Analytics, Unterschiede zu klassischen.

[email protected]

Intelligente Datenanalysen (3)

0%

2%

4%

6%

8%

10%

Kün

dige

rrat

e [p

ro J

ahr]

Q3 2003 Q4 2003 Q1 2004 Q2 2004 Q3 2004 Q4 2004

OstSüdWestNord

Page 10: Marc.hirschleber@hpstg.de. Agenda Daten -> Informationen -> Wissen (Status Quo) Intelligente Datenanalysen (Predictive Analytics, Unterschiede zu klassischen.

[email protected]

Intelligente Datenanalysen (4)

0

10

20

30

40

50

60

70

Kunden-jahre

Call CenterAnrufe

durchschn.Auftrag

Kunden-gruppe

Region

Kündiger-Indikatoren(nach Relevanz)

Page 11: Marc.hirschleber@hpstg.de. Agenda Daten -> Informationen -> Wissen (Status Quo) Intelligente Datenanalysen (Predictive Analytics, Unterschiede zu klassischen.

[email protected]

Customer Value / Alter

0123456789

10

18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45

Intelligente Datenanalysen (5)

Page 12: Marc.hirschleber@hpstg.de. Agenda Daten -> Informationen -> Wissen (Status Quo) Intelligente Datenanalysen (Predictive Analytics, Unterschiede zu klassischen.

[email protected]

Intelligente Datenanalysen (6)

Customer Value / Alter

0

1

2

3

4

5

6

7

8

18 - 25 26 - 35 36 - 45

Page 13: Marc.hirschleber@hpstg.de. Agenda Daten -> Informationen -> Wissen (Status Quo) Intelligente Datenanalysen (Predictive Analytics, Unterschiede zu klassischen.

[email protected]

Customer Value / Alter

0123456789

18 - 28 29 - 39 40 - 45

Intelligente Datenanalysen (7)

Page 14: Marc.hirschleber@hpstg.de. Agenda Daten -> Informationen -> Wissen (Status Quo) Intelligente Datenanalysen (Predictive Analytics, Unterschiede zu klassischen.

[email protected]

Was sind Daten-Analysen?

Konzept Technologie Beispiel

Manual DataExploration Data Cubes Kündiger-Historie

per Quartal und RegionOLAP

Data Aggregationand Summarization

SQL,Spreadsheets

Kündiger-Historie quartalsweise

Query undReporting

Data Prediction Classification,Regression

Kündigungs-Wahrscheinlichkeit

für jeden einzelnen Kunden und eine Erklärung “warum”

PredictiveModeling

Automated Data Exploration

Clustering,Associations

Charakteristika von “Kündigern” und

“Nicht-Kündigern”

DescriptiveModeling

Page 15: Marc.hirschleber@hpstg.de. Agenda Daten -> Informationen -> Wissen (Status Quo) Intelligente Datenanalysen (Predictive Analytics, Unterschiede zu klassischen.

[email protected]

Reporting OLAP Statistics PredictiveAnalytics

ProductionModeling

EmbeddedModeling

ExploratoryModeling

Cognos, BO, Hyperion

KXEN

SAS, SPSS u.a.

Anzahl Variablen

1 10 100 1000

AnalyticsKlassifikation von

Daten-Analysen

Page 16: Marc.hirschleber@hpstg.de. Agenda Daten -> Informationen -> Wissen (Status Quo) Intelligente Datenanalysen (Predictive Analytics, Unterschiede zu klassischen.

[email protected]

05

1015202530354045

MaritalStatus

Customervalue

Age

Marketing

Beispiel einer Cross-selling

Analyse

Transaktionen Q2-> Q3 2004

Q4 Kunden Informationen

Analyze

Mitarbeiter

APPLY

Page 17: Marc.hirschleber@hpstg.de. Agenda Daten -> Informationen -> Wissen (Status Quo) Intelligente Datenanalysen (Predictive Analytics, Unterschiede zu klassischen.

[email protected]

Komplexität (Komplexität (Guru Faktor)Guru Faktor) Traditionelle Statistik-/Data Mining Applikationen erfordern sehr hohen Skill-LevelTraditionelle Statistik-/Data Mining Applikationen erfordern sehr hohen Skill-Level (Vor-) Auswahl der Kriterien/Variablen ist sehr aufwendig und nicht trivial(Vor-) Auswahl der Kriterien/Variablen ist sehr aufwendig und nicht trivial Zuverlässigkeit der Ergebnisse bzgl. zukünftiger Daten/Vorgänge ist entscheidendZuverlässigkeit der Ergebnisse bzgl. zukünftiger Daten/Vorgänge ist entscheidend

Zeit und KostenZeit und Kosten Ergebnisse erzeugen mit traditionellen Verfahren/Tools beansprucht WochenErgebnisse erzeugen mit traditionellen Verfahren/Tools beansprucht Wochen Experten verwenden 60-90% ihrer Zeit für die Datenvorbereitung Experten verwenden 60-90% ihrer Zeit für die Datenvorbereitung Web logs (als Datengeneratoren) müssen evaluiert werden - real timeWeb logs (als Datengeneratoren) müssen evaluiert werden - real time

Geschwindigkeit (Umsetzung in Geschäftsprozesse)Geschwindigkeit (Umsetzung in Geschäftsprozesse) In kurzen Zyklen sich verändernde Daten erfordern zeitgerechte UmsetzungIn kurzen Zyklen sich verändernde Daten erfordern zeitgerechte Umsetzung Analytische Systeme duplizieren Daten, sind Resourcen-intensiv und schwer integrierbarAnalytische Systeme duplizieren Daten, sind Resourcen-intensiv und schwer integrierbar

Predictive Analytics für jedermann?

Nur wenige Projekte rechtfertigten Einsatz/Kosten von traditionellen Verfahren/ToolsOft wurden (wenige) Modelle umgesetzt und Jahre lang (unverändert) genutzt

Page 18: Marc.hirschleber@hpstg.de. Agenda Daten -> Informationen -> Wissen (Status Quo) Intelligente Datenanalysen (Predictive Analytics, Unterschiede zu klassischen.

[email protected]

Traditioneller Data Mining Ansatz

3 Weeks

Select Variables Understand

Bus

ines

s Q

uest

ion

Apply Prepare Data Build Model Test Model

Our company builds hundreds of predictive Our company builds hundreds of predictive models in the same time we used to build one.models in the same time we used to build one.

KXEN allows us to save millions of dollars KXEN allows us to save millions of dollars with more effective campaigns with more effective campaigns

Financial Industry CustomerFinancial Industry Customer

Traditionell

KXEN Ansatz

3 Hours

Bus

ines

s Q

uest

ion

Bui

ld M

odel

Und

erst

and

App

ly

mit KXEN

Was ist neu?

Page 19: Marc.hirschleber@hpstg.de. Agenda Daten -> Informationen -> Wissen (Status Quo) Intelligente Datenanalysen (Predictive Analytics, Unterschiede zu klassischen.

[email protected]

SRM = Qualität + Zuverlässigkeit + Geschwindigkeit

SRM erspart 3 entscheidende SchritteSRM erspart 3 entscheidende Schritte Nutzung aller verfügbaren VariablenNutzung aller verfügbaren Variablen Automatisierte DatenvorbereitungAutomatisierte Datenvorbereitung

Variablen-Decodierung – Variablen-Decodierung – Nominal, Ordinal, ContinuousNominal, Ordinal, Continuous

Handling von FehlwertenHandling von Fehlwerten Erkennen von AusreisserwertenErkennen von Ausreisserwerten Zieloptimierte Gruppierung – Zieloptimierte Gruppierung – Sinnvolle WertebereicheSinnvolle Wertebereiche Ereignisbezogene Aggregation – Ereignisbezogene Aggregation – Zeit, Wert, SequenzZeit, Wert, Sequenz

Automatisierter Modell-TestAutomatisierter Modell-Test

Select Variables Prepare Data Build Model Test Model

Page 20: Marc.hirschleber@hpstg.de. Agenda Daten -> Informationen -> Wissen (Status Quo) Intelligente Datenanalysen (Predictive Analytics, Unterschiede zu klassischen.

[email protected]

Die analytische Lücke

ModelingData Prediction

5 Statisticians 10 Questions

OLAP Manual Data Exploration

Query & ReportingData Aggregation and Summarization

10,000’s Business Users 10,000’s Questions

Page 21: Marc.hirschleber@hpstg.de. Agenda Daten -> Informationen -> Wissen (Status Quo) Intelligente Datenanalysen (Predictive Analytics, Unterschiede zu klassischen.

[email protected]

KXEN-Integration ins gesamte Unternehmen

Kiosk Web Phone POS Call Center Email Mail

ExploratoryModels

Production Models

OutboundProductRecom-

mendationCross-sell

Up-sellCampaign Managem.

Feedback

Order

ChurnPrevention

FraudDetection

RiskAnalysis

DemandForecast

ChannelOptimizat.

Inbound

Data Warehouse

ExternalData

Offer

LifestyleLife-stage

Segmen-tation

Lifetime Valuation

CustomerTouch-Points

Example: CRM

Page 22: Marc.hirschleber@hpstg.de. Agenda Daten -> Informationen -> Wissen (Status Quo) Intelligente Datenanalysen (Predictive Analytics, Unterschiede zu klassischen.

[email protected]

KXENAnalytic

Framework

Data Manipulation

DataPreparation

DataModeling

ModelDeployment ProductionData

Access

ConsistentCoderK2C

Event LogKEL

SequenceCoderKSC

Time SeriesKTS

RobustRegression

K2RSmart

SegmenterK2S Model

ExportKMX

Scoring Scoring C, JAVA, VB, SAS, HTML, XML …

SQLUDFPMMLJAVA …

37383940414243444546

price promo place product

455 23456 13457 235458 38

REPORT

Exploration

Association RulesKAR

RDBMS Oracle, Teradata, DB/2, MS, IBM Informix ...

Text Filescsv, txt, tab …

NativeSAP BW, SAS, SPSS, Excel …

Page 23: Marc.hirschleber@hpstg.de. Agenda Daten -> Informationen -> Wissen (Status Quo) Intelligente Datenanalysen (Predictive Analytics, Unterschiede zu klassischen.

[email protected]

LIFE DEMO - American Census

Business Case:Business Case: Who in my dB is earning more than $50K and what are the important criteria?

Available Information:Available Information:– UCI UniversityUCI University– International BenchmarkInternational Benchmark

Dataset:Dataset:– 4848 000 Records 000 Records– 1155 attributes attributes– 24% of responders24% of responders

Page 24: Marc.hirschleber@hpstg.de. Agenda Daten -> Informationen -> Wissen (Status Quo) Intelligente Datenanalysen (Predictive Analytics, Unterschiede zu klassischen.

[email protected]

SearsSearsWal-MartWal-MartBottega VerdeBottega VerdeAC NielsenAC NielsenMicrosoft EuropeMicrosoft EuropeID AnalyticsID AnalyticsEarthlinkEarthlinkLa PosteLa PostePowerGenPowerGenPfizerPfizerVeolia WatersVeolia WatersebayebayNFONFO

Handel u.a.Handel u.a.

E*TradeE*TradeWashington MutualWashington MutualJP Morgan ChaseJP Morgan ChaseFidelityFidelityBarclaysBarclaysLloyds TSBLloyds TSBSociété GénéraleSociété GénéraleSocredoSocredoBank Austria Bank Austria DisbankDisbankCrédit LyonnaisCrédit LyonnaisGreat Eastern LifeGreat Eastern LifeInsuranceInsurance

FinanzwesenFinanzwesen

AT&TAT&TBell CanadaBell CanadaCingularCingularChina TelecomChina TelecomMCIMCICox Com.Cox Com.PCSPCSFrance TelecomFrance TelecomOrangeOrangeSwisscomSwisscomBelgacomBelgacomVodafone D2 Vodafone D2 WanadooWanadoo

TelekommunikationTelekommunikation

KXEN-Referenzen

Page 25: Marc.hirschleber@hpstg.de. Agenda Daten -> Informationen -> Wissen (Status Quo) Intelligente Datenanalysen (Predictive Analytics, Unterschiede zu klassischen.

[email protected]

F & A

Proof of Value (PoV) für IUG-Mitglieder

Aufgabenstellung definierenTermin vereinbaren

PoV durchführenkostenfrei

Aufwand: 3 - 4 Std.

Anruf (+49-40-2388 1740) odereMail ([email protected]) genügt