Читать книгу Data Science - Michael Zimmer - Страница 22
2.2Die DIKW-Pyramide erklimmen
Оглавление»Where is the wisdom we have lost in knowledge?
Where is the knowledge we have lost in information?«
T. S. Eliot (1934)8
Bereits in diesem bekannten Zitat des Literaturnobelpreisträgers T. S. Eliot klingen die Beziehungen an, die 50 Jahre später von Ackhoff und anderen im sogenannten DIKW-Modell populär gemacht wurden. Dieses stellt die Zusammenhänge von Daten, Information, Wissen und Weisheit auf. Datenanalyse wird zwar schon seit Jahrhunderten betrieben, aber dennoch haben die konzeptionellen und technologischen Fortschritte der vergangenen 20 Jahre dem Bereich eine neue Bedeutung, eine neue Sichtbarkeit und natürlich eine neue Qualität ermöglicht.
Abb. 2–2 Die klassische DIKW-Pyramide
Die Darstellung der DIKW-Hierarchie findet sich oft in Form einer Pyramide, womit vereinfacht gezeigt werden soll, dass die einzelnen Schichten aufeinander aufbauen und man stufenweise vorgehen muss.9 Die Komplexität der zu verwendenden Modelle nimmt dabei zur Pyramidenspitze hin zu. Die in vielen Darstellungen nicht zu sehende unterste Schicht stellt die reale Welt dar, die auf der nächsten Ebene über die Daten beschrieben wird. Den eigentlichen Datenlieferanten stellt also die reale Welt dar. Hier ist festzustellen, dass es in den vergangenen 20 Jahren massive Veränderungen gegeben hat. Die Anzahl der Datenquellen hat ebenso rasant zugenommen wie die Vielfältigkeit der Datenformate und die Geschwindigkeit, mit der die Daten generiert werden. Big Data ist daher einer der Katalysatoren für den Erfolg von Data Science. Die Unternehmen verfügen heute über viel mehr Möglichkeiten, geeignete Daten für die Datenanalyse zu verwenden. Dabei stehen sowohl interne als auch externe Daten in einer Granularität zur Verfügung, die zeitnahe und qualitativ hochwertige Auswertungen ermöglichen und für die Entscheidungsunterstützung oder gar eine Entscheidungsautomatisierung herangezogen werden können. Wie oben bereits erwähnt stehen darüber hinaus auch die notwendigen Werkzeuge in Form von Software (z.B. Frameworks wie Hadoop oder Spark) und Hardware (hier seien nur das Cloud Computing oder die Entwicklungen im GPU-Processing angesprochen) zur Verfügung, die praktisch ein »Data Science für jedermann« ermöglichen. Komplexe Operationen, deren Durchführung früher nur für eine sehr begrenzte Gruppe von Unternehmen möglich war, können heute praktisch von jedem Start-up realisiert werden.10 Da weder Daten noch Werkzeuge die Begrenzung darstellen, liegt diese jetzt im vorhandenen Know-how des Unternehmens.
Nach Mcafee und Brynjolfsson befinden wir uns im »Second Machine Age«. Dieses teilen die beiden Autoren in zwei Phasen ein. In Phase 1 des zweiten Zeitalters der Maschinen übernahmen Computer Routineaufgaben und lösten einen Produktiviätsschub in vielen Bereichen der Wirtschaft aus. Diese Phase 1 setzte gemäß den Autoren Mitte der 1990er-Jahre ein. Der Übergang zu Phase 2, in der die Maschinen lernen, wie sie selbst Problemstellungen lösen können, wird von Mcafee und Brynjolfsson auf den Beginn des zweiten Jahrzehnts dieses Jahrtausends gelegt. Sie sprechen hier von einer Initialzündung für die Phase 2 [Mcafee & Brynjolfsson 2018, S. 24 ff.]. Diese Initialzündung steht in engem Zusammenhang mit den oben beschriebenen Entwicklungen und dem damit verbundenen Durchbruch von Data Science in der Breite:
»Systeme maschinellen Lernens werden besser, je größer sie werden, wenn sie auf schnellerer und stärker spezialisierter Hardware laufen, Zugang zu mehr Daten bekommen und verbesserte Algorithmen enthalten. All diese Verbesserungen finden jetzt statt, deshalb entwickelt sich maschinelles Lernen rasant«
[Mcafee & Brynjolfsson 2018, S. 103].
Abb. 2–3 Data-Science-Pyramide
Durch die oben beschriebene Entwicklung ist es den Unternehmen nun möglich, sich weiter in Richtung »Wisdom«, also der Spitze der Pyramide, vorzuarbeiten. Dabei lässt sich eine zweite Pyramide (vgl. Abb. 2–3) heranziehen, die verdeutlicht, dass es ähnliche Abhängigkeiten auch im Falle der Werkzeuge und Techniken gibt, die auf den jeweiligen Stufen zum Einsatz kommen.11 Je höher man diese Pyramide erklimmt, umso größer ist das Potenzial des Informationssystems für die Entscheidungsunterstützung. Steht zunächst das Aggregieren von Daten und die Bereitstellung von Reports im Mittelpunkt, um die Daten der verschiedenen Datenquellen zusammenzufassen, wird auf der nächsten Stufe die Datenexploration genutzt, um die Entscheidungsfindung zu unterstützen. Nach der darüberliegenden Stufe mit Machine Learning, auf der sich zahlreiche Unternehmen aktuell befinden, folgt dann die automatisierte Entscheidungsfindung, bei der der Human Factor quasi vollständig ausgeschaltet ist. In zahlreichen Bereichen wie etwa der Preisfindung oder der Beschaffung findet man solche Systeme bereits im Produktivbetrieb.12