Predictive Analytics für Einsteiger
Wetterprognosen und Science Fiction mit Predictive Analytics
Seit geraumer Zeit geistert der Ausdruck Predictive Analytics durch die Netz- und Business-Welt. Was heißt Predictive Analytics? Wo kommt Predictive Analytics her? Wo kann Predictive Analytics angewendet werden? Ich werde versuchen, Ihnen einen möglichst unkomplizierten Einblick zu vermitteln.
Richten wir unseren Blick auf das Wetter und einen Film, denn die Wettervorhersage und der Hollywoodstreifen „Minority Report“ haben etwas gemeinsam: Predictive Analytics. In Bezug auf eine möglichst realistische Wettervorhersage wird eine große Anzahl von Daten eingesetzt, um für die nächsten Tage eine Prognose abzugeben, deren Eintrittswahrscheinlichkeit möglichst hoch ist.
Im Film „Minority Report“ wiederum werden Verbrechen verhindert, bevor sie überhaupt begangen werden. Algorithmen, d.h. in Software verankerte mathematisch-statische Formeln, prognostizieren eine Eintrittswahrscheinlichkeit von annähernd 100 Prozent.
Sicherlich, der „Minority Report“ ist Science Fiction pur. Dennoch setzen Sicherheitsbehörden mittlerweile Vorhersagemodelle, d.h. Predictive Analytics zur Kriminalprävention ein. Dafür werden Daten ausgewertet, um beispielsweise zu ermitteln, in welchen Stadtvierteln die Wahrscheinlichkeit von Einbrüchen erhöht ist, um anschließend effektive Maßnahmen zu ergreifen. Eine Maßnahme könnte die Erhöhung der Polizeipräsenz sein. Die Erhöhung der Polizeipräsenz wiederum führt zum Rückgang von Verbrechen, da sie potenzielle Täter von Vornherein von einer Straftat abhält. Denn das Risiko, „erwischt“ zu werden, ist für den potenziellen Täter sehr hoch, sodass er bzw. sie abwägt, die potenzielle Tat an einen anderen Ort zu verlegen oder erst gar nicht in Erwägung zu ziehen.
Ist das Thema Predictive Analytics neu?
Wie man unschwer erkennen kann, stammt der Ausdruck aus dem Englischen. Meine Großmutter hätte jetzt gesagt: “Siehst du, das ist Englisch und Englisch ist modern“. Ob Predictive Analytics sich vornehmlich im anglo-amerikanischen Sprachraum entwickelt hat, möchte ich bezweifeln. Zumindest können wir festhalten, dass ein englischer Ausdruck sich in wissenschaftlichen Publikationen auf globaler Ebene optimal verbreiten lässt.
Die Frage, ob Predictive Analytics modern ist, kann mit „Jein“ beantwortet werden, da bei der Kreditvergabe von Banken, aber auch im Versandhandel bereits seit 20 Jahren mit Risiko-Scores gearbeitet wird. Hierzu wurden soziodemographische Daten, aber auch microgeographische Daten gewichtet und in Beziehung zur Auskunft gesetzt. Ziel war die Prüfung, ob der Kreditnehmer aller Wahrscheinlichkeit nach seinen Zahlungsverpflichtungen nachkommen konnte bzw. welche Zahlweise dem Versandhandelskunden eingeräumt wurde (z.B. Kauf auf Rechnung, Vorauskasse bzw. Nachnahme).
Bereits zu jener Zeit begannen Statistiker in Versicherungsunternehmen Daten von ihren Kunden zu gewichten, um daraus Prämien zu berechnen. Ein Beispiel, das jeder von uns kennt, sind die sogenannten Risiko- oder Schadensfreiheitsklassen.
Informationen konnten bereits zu früheren Zeiten monetarisiert werden. Ein Beispiel dafür ist Nathan Rothschild, auch „Der Schlachtenbummler“ genannt, der per Brieftaube vom Ausgang der Schlacht von Waterloo erfuhr, an der Londoner Börse Kriegsanleihen kaufte und damit seinen Reichtum binnen weniger Tage deutlich vermehrte. Diese Information führte aufgrund ihrer Eindeutigkeit zu einer klaren Handlungsempfehlung und ist nur ein Beispiel dafür, wie wertvoll Informationen und Eintrittswahrscheinlichkeiten sind.
Wo steht Predictive Analytics heute?
Die Verfahren, die heute eingesetzt werden, sind sehr granular. Die Technik ist ausgereifter (Stichworte „Artificial Intelligence“, „Machine Learning“ etc.) als früher, und die zur Verfügung stehende Datenmenge ist so riesig, dass sie ohne maschinellen Einsatz nicht mehr analysierbar ist.
Um zu verstehen, wo das Thema Predictive Analytics heute steht, müssen wir nochmal einen kurzen Rückblick wagen, und zwar wie man vor dem Einsatz von elektronischer Datenverarbeitung Entscheidungen in Unternehmen getroffen hat. Zur damaligen Zeit wurden Wissen und Erfahrungen von verdienten Mitarbeitern vom Chef herangezogen. Der Chef traf anschließend, aufgrund der neu gewonnenen Informationen und auf sein Bauchgefühl vertrauend, eine Entscheidung.
Mit dem Einzug elektronischer Buchhaltungsprogramme ließen sich dann archivierte Daten aus der Vergangenheit ex-post analysieren, um daraus objektive Daten zur Entscheidungsfindung zu ermitteln. Aber auch hierbei kam es zu einer subjektiven Interpretation.
Somit gelangten wir dazu, Daten zu clustern, segmentieren oder klassifizieren, um Muster zu ermitteln, die sich aus mathematisch–statistischen Verfahren ergeben. Die subjektive Interpretationsmöglichkeit ist deutlich eingeschränkter bei den durch Computereinsatz ermittelte Daten.
Wichtig ist es zu wissen, dass die Mustererkennung ohne „Maschineneinsatz“ gar nicht möglich wäre, da die Datenmengen mittlerweile zu groß und vielfältig sind. Mit bloßem Auge sind Abweichung, Klassen und Muster nicht zu erkennen.
Predictive Analytics repräsentiert aber nicht das Ende der Fahnenstange. Geht es bei Predictive Analytics um das „Was wird geschehen?“, so geht die Prediscriptive Analytics noch weiter und befasst sich mit der Fragestellung: „Was muss getan werden, um einen bestimmten Trend zu fördern?“.
Wie wird Predictive Analytics eingesetzt?
Zunächst erfasst man alle Rohdaten, also alle strukturierten und unstrukturierten Daten, denen man im heutigen Big Data Kontext habhaft werden kann.
Durch Exploration sollen dann in den Daten spezielle Muster erkannt werden, welche die Eintrittswahrscheinlichkeit der zugrundeliegenden Fragestellungen ermittelt.
Zum Einsatz kommen Segmentierung, Klassifikation, aber auch neuronale Netzwerke, d.h. Techniken, mit denen eine Gruppenbildung von Merkmalen Hinweise darauf erlauben, wie sich ein Mensch oder eine Anlage zukünftig verhalten werden.
Aus diesen Daten und Eintrittswahrscheinlichkeiten wird dann ein Modell entwickelt. Dieses Modell ist nicht starr, sondern wird ständig weiter mit Daten und Erkenntnissen gefüttert, um zu lernen bzw. das Modell zu verbessern. Auf dieser Basis werden weitere granulare Ergebnisse produziert.
Wo lässt sich Predictive Analytics methodisch einordnen?
Wir befinden uns von der Methodik her im Bereich Business Analytics, genauer gesagt, in der Sparte Business Intelligence. Ein Teil von Business Intelligence ist das sogenannte Data Mining. Der Ausdruck Data Mining ist ein wenig verwirrend, da er impliziert, dass nach neuen Daten geschürft wird. Das ist aber nicht der Fall. Es geht darum, in bestehenden Daten zu schürfen, um darin Muster bzw. tiefere Erkenntnisse zu gewinnen. Predictive Analytics stellt demnach ein Data Mining-Verfahren dar.
Was bezwecken Unternehmen mit dem Einsatz von Predictive Analytics?
Laut einer Studie von Computerwoche und Lufthansa Industrie Solution verfolgen die befragten Unternehmen einen bunten Strauß von Zielen. Zusammenfassend kann man sagen, dass Predictive Analytics die betrieblichen Prozesse und Entscheidungen optimieren soll. Als Sekundärziele sind die Verbesserung der Produktqualität und Dienstleistungen zu nennen, aber auch die Erhöhung der Kundenzufriedenheit und Gewinnung eines besseren Kundenverständnisses, gefolgt von höherem Umsatz und höherer Kosteneffizienz sind von großer Bedeutung.
Wo wenden wir Predictive Analytics an?
Beispiel: Anwendung von Predictive Analytics im Retail
Im Retail wird Predictive Analytics einerseits für aktive Kunden zur Ermittlung des sogenannten „Next Best Offer“ ermittelt. Dazu werden Gruppen gebildet bzw. Muster erkannt, die eine Korrelation bestimmter Produkte oder Einkäufe zeigt. Auf diesem Wege kann dem Kunden ein Angebot mit einer hohen Kaufwahrscheinlichkeit unterbreitet werden. Die Korrelation „Cola und Salzstangen“ lässt sich relativ einfach herstellen. Aber die Beziehung zwischen „Bier und Windeln“, wie vor geraumer Zeit in Kanada ermittelt wurde, liegt nicht klar auf der Hand. Es wurde festgestellt, dass am Wochenende vielfach die Kombination „Bier und Windeln“ gekauft wurde. Aber warum? Nach eingehender Untersuchung stellte sich heraus, dass junge Väter am Wochenende zum Einkaufen von Windeln geschickt wurden, wobei auch das Bier den Weg in den Einkaufswagen fand.
Ähnliche Zusammenhänge lassen sich auch bei anderen Einkaufskonstellationen finden. Kunden können folglich Produktangebote unterbreitet werden, die sich nicht unbedingt aus ihrem historischen Einkaufsverhalten herleiten lassen.
Ein weiterer wichtiger Punkt neben der für den Händler positiven Kaufentscheidung ist auch der sogenannte „Churn“, d.h. die Abwanderung des Kunden. Es ist eine Binsenweisheit, dass die Gewinnung von Neukunden wesentlicher kostenintensiver ist als einen Bestandskunden zu halten. Aus diesem Grund sind insbesondere die Score-Werte zum Thema „Churn“ von großer Bedeutung. Moderne „Black-Box Scores“ in diesem Bereich zeigen dem Analysten/Data Scientist jedoch Grenzen auf. Diese Grenzen sind nicht technischer, sondern menschlicher Natur. Ein CRM-Mitarbeiter möchte nicht nur das Ergebnis oder die Prozentzahl kennen, wie hoch die Wahrscheinlichkeit der Kündigung ist. Er möchte zudem verstehen, wie es zu dieser Aussage kommt. Mögliche Gründe sind u.a. eine längere Inaktivität des Kunden oder aber auch die Tatsache, dass der Kunde bereits die Kündigungsmöglichkeit recherchiert hat.
Beispiel: Anwendung von Predictive Analytics bei der Sortimentsplanung
Sofern ich verlässliche Annahmen über die Absatzmenge und zu erwartende Nachfrage treffen kann, bin ich in der Lage, meine Lagerhaltung zu optimieren. Das Risiko, zum Saisonende auf saisonalen Artikeln „sitzen“ zu bleiben, wird durch Predictive Analytics minimiert. Hierbei wird u.a. bei der Ermittlung von optimalen Bestellmengen auch der Wettertrend mit einbezogen. Erwarte ich im Juli/August kein Sommerwetter, sondern herbstliche Temperaturen, dann verzichte ich zunächst auf die Nachbestellung bestimmter Artikel.
Beispiel: Anwendung von Predictive Analytics bei Serviceanbietern
Die Möglichkeit, das Ausfallrisiko zu minimieren bzw. auf der Versicherungsseite die Häufigkeit des Schadeneintritts bei bestimmten Versicherungsnehmern zu bestimmen (Schadensfreiheitklassen) sind wir bereits eingegangen.
Auch Airlines setzen Modelle ein, um einen möglichst optimalen Auslastungsgrad ihrer Flüge zu erreichen. Hierzu werden alle verfügbaren Daten im Zusammenhang mit Flugzielen, Ereignissen wie Großveranstaltungen, aber auch die politische Lage zur Gewichtung des Ziels in Verbindung mit den zu erzielenden Flugpreisen gesetzt.
Beispiel: Anwendung von Predictive Analytics im produzierenden Gewerbe und bei Versorgungsdienstleistern
Um möglichst reibungslose Produktionsabläufe und eine optimale Wartung zu gewährleisten, werden ständig Last- und Sensorinformationen (IOT) herangezogen. Die Vorhaltung von Ersatzteilen von Maschinen, bei denen die Wahrscheinlichkeit des Ausfalls erhöht ist, reduziert die Zeit des Gesamtausfalls erheblich.
Auch für Energieversorger oder Betreiber von anderen Netzen wird man mit Hilfe von Predictive Analytics in der Lage sein, bestimmte Fehlerbilder oder Konstellationen zu erkennen, die im direkten Zusammenhang mit Lasten oder, besser gesagt, mit Lastproblemen stehen. Diese Frühwarnsysteme führen nicht nur zu Verbesserung des Produkts an sich, sondern auch zur Verbesserung der Kundenbeziehung. Der Kunde kann im Problemfall proaktiv informiert werden, d.h. die Mitteilung über eine Störung wird nicht zeitverzögert vom Kunden selbst an den Dienstleister übermittelt.
Was ist der Mehrwert von Predictive Analytics?
Mit Predictive Analytics haben wir keine Kristallkugel, in der wir die Zukunft vorhersehen können. Predictive Analytics verschafft uns aber einen wesentlichen Informationsvorteil mit Blick auf Kundenverhalten und bestimmte Geschäftsentwicklungen. Die Wahrscheinlichkeit, mit Unterstützung von Predictive Analytics möglichst realistische Vorhersagen zu treffen, ist deutlich höher als der Verlass auf das „Bauchgefühl“.
Sie möchten mehr über Predictive Analytics erfahren? Kontaktieren Sie uns gerne – wir freuen uns auf Sie!
Verfasser: Michael Böschen, DataLab. GmbH
Die DataLab. GmbH ist einer der führenden Dienstleister im Bereich Customer Equity im deutschsprachigen Raum. Das Unternehmensziel ist die messbare Steigerung des Customer Value in B2C-Märkten.