Читать книгу Data Science - Michael Zimmer - Страница 62

4.4.6Kontinuierliche Verbesserung mit der Datenwertschöpfungskette

Оглавление

Wenn man herausgefunden hat, auf welche Art man ein Datenprodukt dem Nutzer anbieten kann, geht es im nächsten Schritt darum, die Vorhersagegüte kontinuierlich zu verbessern. Dies kann gelingen, indem andere Algorithmen zum Einsatz kommen und/oder mehr Datenquellen benutzt werden. Teilweise wird man auch Situationen/Fälle identifizieren, die auch durch eine Verbesserung des Algorithmus nicht zum richtigen Ergebnis führen. Diese Fälle gilt es zu bewerten und im Zweifelsfall manuell zu behandeln. Weiterhin kann davon ausgegangen werden, dass die Nutzung der ersten Version des Datenprodukts weitere klassifizierte Daten generiert, die für Trainingszwecke zur Algorithmenoptimierung genutzt werden können.

Damit man alle Daten, die innerhalb der Customer Journey anfallen bzw. anfallen könnten, betrachtet, können die Datenflüsse mithilfe der Datenwertschöpfungskette4 analysiert werden (vgl. Abb. 4–4). Diese beschreibt den Fluss der Daten von deren Entstehung bis zur Nutzung. Die Datenwertschöpfungskette sollte für alle Datenobjekte betrachtet werden. Nicht immer werden zum Beispiel alle Schritte für Stamm- und Transaktionsdaten gleichermaßen gut unterstützt. Insbesondere der Rückfluss wird oft vergessen, d.h., es wird nicht protokolliert, wie der Nutzer mit den Daten interagiert. Eine typische Datenwertschöpfungskette enthält die Schritte, die der folgenden Abbildung zu entnehmen sind:

Abb. 4–4 Abdeckung der Datenwertschöpfung bewerten

Data Science

Подняться наверх