Читать книгу Predictive Analytic und die Haftung für fehlerhafte Ergebnisse gegenüber betroffenen Einzelpersonen - Susanne Mentel - Страница 44
IV. Data Mining und Klassifizierung
ОглавлениеEine Möglichkeit, einen Nutzen aus großen Datenmengen zu ziehen, ist das sog. Data Mining. In der Literatur wird der Begriff Predictive Analytic häufig mit dem des Data Mining vermischt. Eine klare Abgrenzung wird vor allem dadurch erschwert, dass die Methodik des Data Mining oft ein wesentlicher Bestandteil einer Predictive Analytic ist.136 Das Erkennen von Zusammenhängen, Mustern und Korrelationen ist Voraussetzung einer jeden Predictive Analytic-Anwendung.137 Data Mining kann dabei eine wichtige Rolle spielen. Der Begriff lässt sich frei aus dem Englischen mit Daten-Bergbau übersetzen. Dieser sperrig anmutende Begriff erschließt sich historisch dahingehend, dass Daten vor dem digitalen Zeitalter schwer zu sammeln und zu verarbeiten waren.138 Bereits 1997 wurde unter der Bezeichnung CRISP-DM (Cross Industry Standard Process for Data Mining) ein Standardprozess für Data Mining entwickelt.139 Der Vorteil heutiger Datenanalyse-Verfahren liegt vor allem in der fortgeschrittenen Technik bei der Erfassung, Verarbeitung und Auswertung der Daten. Demzufolge ist die Größe der zu analysierenden Daten sowie die Anzahl der überprüften Muster nahezu unbegrenzt. Durch Data Mining können verwandte Strukturen erkannt und einander zugeordnet werden. Die Software erfasst in diesem ersten Schritt alle Daten und untersucht sie auf Ähnlichkeiten. Weisen sie gleichartige Merkmale auf, werden sie einer gewissen Gruppe (sog. Cluster) zugewiesen. Bereits auf dieser Stufe des Predictive Analytic-Prozesses können Erkenntnisse über die in einer Gruppe zusammengefassten Personen abgeleitet werden. So kann das in der TV-Branche praktizierte Clustering, welches Haushalte danach einteilt, welches Fernsehprogramm sie einschalten, bereits zu einer Erkenntnis über das durchschnittliche Alter dieses Haushaltes führen: Die einfache Einteilung danach, welches Programm in welchem Haushalt gesehen wird, kann schon ein Muster beinhalten. Dieses gilt es in einem nächsten Schritt auf die Zukunft zu übertragen. Erst mit diesem Schritt kommt die eigentliche Zielsetzung einer Predictive Analytic-Anwendung zum Tragen. Es wird versucht, mithilfe bekannter Muster, die als feste Variablen dienen, eine ungewisse Variable, mithin eine Vorhersage für die Zukunft, zu bestimmen. Die mithilfe von Data Mining erkannten Muster werden als allgemeinverbindliche Muster zugrunde gelegt, die auch neuen Situationen Stand halten sollen. Die besondere Fähigkeit der heute praktizierten Data Mining-Verfahren ist das intelligente und automatisierte Auffinden von Mustern in großen Datenmengen.140