Hier erhalten Sie den letzten Auszug aus unserem Whitepaper zum Thema „6 Schritte zum erfolgreichen Data Science-Projekt“.
Herausforderung 5: Verwaltung verschiedener Data Use Cases in Produktion
Mit zunehmender Anzahl von erfolgreich implementierten Data Use Cases ist die Verwaltung der zugrundeliegenden Modelle eine immer größere Herausforderung. Eine effiziente Skalierung des Modellmanagements ist nun ein wesentlicher Erfolgsfaktor für die dauerhafte Etablierung von datengetriebenen Geschäftsprozessen.
Lösung
Wir empfehlen den Einsatz von sogenannten Model Management Frameworks: Systeme zur simultanen Wartung, Strukturierung und Qualitätssicherung von einer Vielzahl von Data Mining oder Machine Learning Modellen. Die Grundidee dabei ist, jedes Modell in Analyse-Teilschritte (z. B. anhand des CRISP-DM) zuzu zerlegen, um diese dann automatisiert ausführen zu lassen. Damit kann beispielsweise die Effektivität von Empfehlungssystemen kontinuierlich überwacht und im Bedarfsfall ein Modell-Update automatisch initiiert werden. Ein weiterer Vorteil dieser Frameworks ist die Möglichkeit, bereits entwickelte Teilschritte eines Data Mining Modells für einen anderen Data Use Case wiederzuverwenden. So kann beispielsweise für eine Kundensegmentierung auf diverse Aspekte eines bestehenden Empfehlungssystems (z. B. Datenaufbereitung, Plausibilität-Checks etc.) zurückgegriffen werden. So kann der Data Scientist mehr Zeit auf die Modellentwicklung verwenden anstatt Daten aufzubereiten.
Herausforderung 6: Große Bandbreite benötigter Methoden und Technologien
Die Verfügbarkeit günstiger und skalierbarer Rechenleistung und Speicherplatz durch Cloudservices in Kombination mit Lösungen zur Automatisierung des Data Mining Prozesses lassen die Realisierung von Data Use Cases fast als Selbstläufer erscheinen. Um einen Data Use Case tatsächlich operativ umzusetzen, bedarf es jedoch einer Vielzahl von technischen, methodischen und fachlichen Skills. Schließlich ist der komplette Zyklus von „Business Understanding“ bis zum „Deployment“ vollständig zu durchlaufen. So sind sowohl die technischen Aspekte, als auch die korrekte Anwendung von statistischen oder Machine Learning Verfahren sicherzustellen. Dies beinhaltet Aufgaben von der Anbindung von Datensystemen, ggf. mit Big Data Technologien, über das Parameter-Tuning von Machine-Learning-Algorithmen bis hin zur Administration produktiver Systeme.
Lösung
Idealerweise wird je Data Use Case ein Projekt-Team cross-funktional mit Fachanwendern aus dem Business, Data Scientists aus dem Analytics-Team und (Big) Data Engineers aus der IT besetzt. Damit wird verteilt über mehrere Mitarbeiter ein sehr breites Skill-Set abgedeckt, dass ggf. durch externe Spezialisten noch ausgeweitet werden kann. Über kurze Projektstatus-Berichte der Projektteam-Mitglieder in ihrer jeweiligen Organisationseinheit (Fachbereich, Analytics, IT) kann weiteres Expertenwissen mit in eine Problemlösung einfließen. Durch ein transparentes Vorgehen in sämtlichen Projektschritten verbunden mit einem dokumentierten Projektreview können Projektlearnings in Folgeprojekten berücksichtigt werden. Das was (methodisch oder organisatorisch) gut funktioniert hat, kann so über die Zeit als Best-Practice etabliert und Fehler vermieden werden.
Sie haben Frage, Anmerkungen oder wünschen weitere Informationen?
Jan-Hendrik Seidel freut sich auf Ihre Nachricht unter 0211 / 417 419 67 42 oder auch gerne per E-Mail an jseidel@datalab-crm.de