Aktuelles

Informieren Sie sich über aktuelle Veranstaltungen und verpassen Sie keine unserer spannenden Events.

Data Science - Alte Probleme, neue Ideen
Ein Artikel von Dr. Thomas Wörmann

Die Auswertung von betriebswirtschaftlichen Daten mit Hilfe statistischer Methoden hat eine lange Tradition, mit einer ebenso langen Liste von Namen, die wir dafür gefunden haben. Das täuscht uns leider häufig genug darüber hinweg, dass wir auch heute noch vor immer den gleichen Problemen stehen, wenn wir eine konkrete Idee nicht nur in unseren Köpfen, sondern auch in der rauhen Wirklichkeit unseres Unternehmen umsetzen wollen.

Ein kurzer Blick in die Praxis offenbart schnell die Hürden, die sich demjenigen in den Weg stellen, der auf eine schnelle, einfache Lösung gehofft hat: Angefangen bei einer aufwendigen Data Warehouse Technologie mit Planungsintervallen, die sich eher in Jahren als in Monaten beschreiben lassen, über ein auf zu viele Abteilungen verteiltes Know how für die einfachsten Datenbewirtschaftungsprozesse, bis hin zu einer grundsätzlichen Skepsis gegenüber der Validität statistischer Methoden.

Der Begriff Data Science tritt also scheinbar ein schweres Erbe an, wenn wir darunter nicht nur ein cleveres (Selbst-)Marketing verstehen wollen, sondern tatsächlich mit dem neuen Begriff auch einen neuen datasciencekonzeptionellen Ansatz für die Datenanalyse verbinden.

Data Science, das neue Big Data?

Denn machen wir uns nichts vor, für die sinnvolle Auswertung von Unternehmensdaten werden wir auch in Zukunft die klassischen Verfahren für Bereinigung und Integration der Datenquellen brauchen. Auch in Zukunft werden wir mühsam fehlerhafte Daten aussortieren, unvollständige vervollständigen und sich widersprechende harmonisieren. Aber muss das immer im Rahmen des klassischen Data Warehouse geschehen? Die Antwort der Big Data Apologeten ist natürlich ein klares Nein.

Schauen wir uns aber das aktuelle Lösungsportfolio von Big Data etwas genauer an, so stellen wir nur allzu häufig fest, das gerade bei unserer Problemstellung der Aufwand für Installation und Programmierung unverhältnismäßig hoch ist und der erwartete Nutzen durch praktisch beliebige Skalierung gar nicht zum Tragen kommt.

Data Science, die neuen Experten

An dieser Stelle gibt uns nun Data Science das Versprechen, mit einem breiten Methodenspektrum und den unterschiedlichsten Infrastrukturen einfach und schnell zu implementierende Lösungen für unsere Anforderung bereitzustellen. Dabei dreht sich alles um den neuen Experten für Data Science, der nicht nur statistische und mathematische Algorithmen beherrscht, sondern diese auch auf betriebswirtschaftliche Fragestellungen anwendet, der Daten aufbereitet und sinnvoll visualisiert und darüber hinaus Datenquellen mit unterschiedlichsten Verfahren integriert. Diese zunächst utopisch anmutende Qualifikation wird deutlich realistischer, wenn wir diese Beschreibung nicht auf eine einzelne Person beziehen, sondern sie als eine Dienstleistung begreifen, die Ressourcen aus unterschiedlichen Bereichen der Informatik harmonisiert zusammenfügt.

Data Science, der Prozeß

In diesem Zusammenhang werden wir auch einen kritischen Blick auf die Werkzeuge werfen müssen, die wir in unseren Data Science Projekten einsetzen. Weder das reine Statistikwerkzeug, noch das klassische Werkzeug für die ETL-Entwicklung sind alleine tragfähig, um eine komplexe Fragestellung mit betriebswirtschaftlichen Hintergrund schnell und ohne großen Aufwand technisch umzusetzen. Vielmehr sind Werkzeuge gefordert, die sowohl klassische Aufgaben der Datenbewirtschaftung, als auch die direkte Anwendung statistischer oder mathematischer Verfahren in einer prozessorientierten Arbeitsoberfläche vereinen.

Die Versprechungen von Data Science werden sich in der Praxis nur dann bewahrheiten, wenn wir das typische Data Science Projekt weder als die Erstellung einer einmaligen (wenn auch noch so anspruchsvollen) Power Point Auswertung noch als Datenveredelung ohne konkrete betriebswirtschaftliche Zielsetzung begreifen. Der Nutzen von Data Science ergibt sich vielmehr aus der Imlementierung als gesamtheitlichen Prozess als wiederholbare und valide Methode zur Generierung betriebswirtschaftlich relevanter Informationen. Dafür hat sich in der Praxis bereits der einfache und intuitive Begriff des „Data Product“ etabliert, der dieses Ziel in eleganter Weise als eine harmonische Kombination aus Daten, Methoden und Werkzeugen beschreibt. 

Data Science, aus Daten werden Produkte

Wir werden Data Science also in Zukunft immer häufiger als Dienstleistung zur Umsetzung und Bereitstellung eines Data Product sehen, das ein individuelles Lösungsszenario für eine konkrete Aufgabenstellung implementiert. Das Data Product als Verbindung von technischer Flexibilität und dienstleistungsorientiertem Know how-Transfer wird zur idealen Basis für die Erprobung neuer analytischer Verfahren, ohne auf eine finanzielle und zeitliche Planbarkeit zu verzichten. Dies macht natürlich die Attraktivität von Data Science für die Fachanwendungsseite aus, bedeutet aber neue Herausforderungen für die klassische BI-Beratung, denen sich noch längst nicht alle Dienstleister stellen.

Sie haben noch Fragen? Dann schreiben Sie uns oder rufen Sie uns an. Wir stehen Ihnen für weitere Auskünfte jederzeit zur Verfügung.