Читать книгу Predictive Analytic und die Haftung für fehlerhafte Ergebnisse gegenüber betroffenen Einzelpersonen - Susanne Mentel - Страница 48

VIII. Predictive Analytic im eigentlichen Sinne

Оглавление

Die dargestellten vorangehenden Prozesse münden in die eigentliche Predictive Analytic in Gestalt einer Vorhersage. Mithilfe des durch ein Predictive Model erstellten Score-Wertes lässt sich eine Vorhersage darüber aufstellen, wie wahrscheinlich ein bestimmtes Verhalten eines Einzelnen ist.148 Ein Beispiel für eine mögliche Fragestellung kann die Vorhersage der Kündigungsbereitschaft eines Kunden sein. Dabei bedarf es einer Ausgangsfrage in Form einer Hypothese. In diesem Beispiel würde diese lauten: „Der Kunde ist kündigungsbereit.“ In der Folge wird versucht, diese Ausgangshypothese, die sog. Nullhypothese, zu widerlegen. Mögliche Alternativen zur Nullhypothese werden demgemäß als Alternativhypothesen bezeichnet. Um eine Einteilung der Ergebnisse in eine wahrscheinliche und eine weniger wahrscheinliche Kategorie vorzunehmen, müssen Grenzwerte vergeben werden, bei deren Überschreiten die zugrunde liegende Hypothese als zutreffend oder widerlegt eingeordnet wird. Die Ergebnisse können in zweierlei Kategorien ausgedrückt werden: metrisch149 oder binär. Bei allgemeinen Klassifizierungen, wie im Falle logistischer Regression, werden die Variablen binär erklärt. Das bedeutet, dass es immer nur zwei Ausprägungen gibt.150 Beispiele hierfür sind: ja/nein, kaufbereit/nicht kaufbereit, kündigungsbereit/nicht kündigungsbereit, krank/nicht krank, etc. Der ersten Alternative wird beispielsweise die Zahl 1, der zweiten die Zahl 0 zugeordnet. Zudem muss ein Grenzwert bestimmt werden, der festlegt, ab welchem Wahrscheinlichkeitswert welche Kategorie greift. Wird der Grenzwert beispielsweise bei 0,5 festgesetzt, bestätigen alle Vorhersagen mit einem Wert > 0,5 die Nullhypothese, alle Werte < 0,5 sprechen für die Widerlegung der These. Durch diese Vorgehensweise wird die Hypothese – und damit der ihr zugrunde liegende Sachverhalt – als eher wahrscheinlich oder eher unwahrscheinlich eingeordnet. Diese Wahrscheinlichkeitsaussage ist die Predictive Analytic im eigentlichen Sinne.

109 S. Big Data Insider, Whitepaper Predictive Analytics, 2016, S. 3. 110 Hildebrand, ISreport 2006, 17. 111 Weichert, ZRP 2014, 168, 169. 112 Meffert, So wird aus Big Data Smart Data, 7.6.2017, http://www.bigdata-insider.de/so-wirdaus-big-data-smart-data-a-604998/, zuletzt abgerufen am 27.6.2018. 113 Thon/Nes, edpl 2017, 16. 114 So können bsp. Daten aus Flugdatenbanken entnommen werden. Deren Nutzung läuft laut Wiebe, K&R 2014, 239 auch nicht der normalen Auswertung der Datenbank zuwider. 115 Weichert, ZD 2013, 251, 252. 116 Big Data Insider, Whitepaper Predictive Analytics, 2016, S. 3. 117 Matzer, So verhilft Customer Intelligence zu zufriedeneren Kunden, 12.6.2017, http://www.bigdata-insider.de/so-verhilft-customer-intelligence-zu-zufriedeneren-kunden-a-612405/, zuletzt abgerufen am 27.6.2018. 118 Bezogen auf Scoring-Verfahren allgemein Roßnagel, ZD 2013, 562, 562. 119 S. Big Data Insider, Whitepaper Predictive Analytics, 2016, S. 6. 120 Iffert, Controlling & Management Review, Sonderheft 1/2016, 16, 17. 121 Zur möglichen Reanonymisierung von personenbezogenen Daten hat bereits das BVerfG, 15.12.1983 – 1 BvR 209/83, BVerfGE 65, 1, Rn. 110 – Volkszählungsurteil, Stellung genommen. Es ging bereits davon aus, dass „scheinbar undurchbrechbare Anonymisierungen mit einfachen mathematischen Verfahren wieder repersonalisiert werden können“. 122 So aber die implizierte Definition von Predictive Analytic bei Schulz, in: Gola, Datenschutz-Grundverordnung, 2017, Art. 6 Rn. 197. 123 S. die dahingehende Untersuchung der Datenschutzaspekte bei Crawford/Schultz, 55 Boston College Law Review 93, 1, 4. 124 S. hierzu bereits unter B. IV. 3. a) bb). 125 S. die Ausführungen in Big Data Insider, Whitepaper Predictive Analytics, 2016, S. 5. 126 Big Data Insider, Whitepaper Predictive Analytics, 2016, S. 5. 127 S. z.B. auf der Cloud Plattform von SAP, Cloud Plattform, abrufbar unter https://www.sap.com/germany/products/cloud-platform.html, zuletzt abgerufen am 27.6.2018. 128 Zu cloudbasierten Services s. Iffert, Controlling & Management Review, Sonderheft 1/2016, 16, 22. 129 S. die In-Memory-Lösung SAP HANA, abrufbar unter https://www.sap.com/germany/products/hana.html., zuletzt abgerufen am 27.6.2018; sowie von IBM, BLU Acceleration Solution – Power Systems Edition, abrufbar unter http://www.ibm.com/systems/power/solutions/bigdata-analytics/editions/db2-blu.html, zuletzt abgerufen am 27.6.2018; ebenfalls Oracle, Database In-Memory, abrufbar unter https://www.oracle.com/de/database/database-in-memory/index.html, zuletzt abgerufen am 27.6.2018. 130 S. zur Datenstruktur bereits unter C. I. 6. 131 Vgl. Markl, in: Hoeren, Big Data und Recht, 2014, S. 9, wonach unstrukturierte Daten wie Text- , Bild-, Audio- oder Videodateien zuerst vorverarbeitet werden müssen. 132 S. z.B. die Unified Data Architecture Software des Anbieters teradata, Teradata – Big Data and Advanced Analytics Teradata, abrufbar unter http://www.teradata.com/products-and-services/analytics-from-aster-overview, zuletzt abgerufen am 27.6.2018. 133 S. das Angebot der Alteryx GmbH, Whitepaper: 6 Schritte zu schnellerem Data Blending für Tableau, 7.6.2017, S. 6, abrufbar unter http://www.bigdata-insider.de/data-blending-mit-koepfchen-v-38294-12529/?cmp=nl-ta-wp-lead-Alteryx-20170616, zuletzt abgerufen am 27.6.2018, die ein Data Blending (Datenverschmelzung) anbietet, das die Daten von verschiedensten Quellen miteinander verknüpft, bereinigt und anschließend analysiert. 134 Rouse, Whatsl.com, Extract, Transform, Load (ETL), abrufbar unter http://www.searchenterprisesoftware.de/definition/Extract-Transform-Load-ETL, zuletzt abgerufen am 27.6.2018. 135 S. Claßen, So orchestrieren Sie den Machine Learning Workflow, 28.7.2017, abrufbar unter https://www.bigdata-insider.de/so-orchestrieren-sie-den-machine-learning-workflow-a-618118/, zuletzt abgerufen am 27.6.2018. 136 Vgl. hierzu: Koeffer, Mit Predictive Analytics in die Zukunft blicken, 17.4.2014, http://www.derwesten.de/wirtschaft/digital/mit-predictive-analytics-in-die-zukunft-blicken-id9252539.html, zuletzt abgerufen am 27.6.2018. 137 Big Data Insider, Whitepaper Predictive Analytics, 2016, S. 3. 138 Eine frühe Form fortschrittlicher Mustererkennung aus einer größeren Menge an selbst dokumentierten Daten stellt die im Jahr 1932 von den Anthropologie Professoren Driver und Kroeber aus Berkeley veröffentlichte, quantitative Darstellung von Klassifizierungen kultureller Beziehungen dar. S. hierzu Kroeber, American Anthropologist 1935, 539. 139 Das Modell erfasst den Zyklus eines Data Mining-Prozesses in sechs Phasen, s. grundlegend http://crisp-dm.eu/home/about-crisp-dm/, zuletzt abgerufen am 27.6.2018. 140 S. hierzu sogleich unter VII. Zum Zusammenhang zwischen Data Mining und Machine Learning s. Fraunhofer Institut für sichere Informationstechnologie, Begleitpapier Bürgerdialog Chancen durch Big Data und die Frage des Privatsphärenschutzes, 2015, S. 24. 141 Siegel, Predictive Analytics: the power to predict who will click, buy, lie, or die, 2013, S. 26. 142 S. hierzu sogleich unter VIII. 143 Anlehnung der Beispiele an die in Siegel, Predictive Analytics: the power to predict who will click, buy, lie, or die, 2013, S. 26 genannten Berechnungsmethoden. 144 Eine Auseinandersetzung mit den unterschiedlichen Definitionen von Machine Learning findet sich bei Puget, What Is Machine Learning?, 18.5.2016, abrufbar unter https://www.ibm.com/developerworks/community/blogs/jfp/entry/What_Is_Machine_Learning, zuletzt abgerufen am 27.6.2018. 145 Fraunhofer Institut für sichere Informationstechnologie, Begleitpapier Bürgerdialog Chancen durch Big Data und die Frage des Privatsphärenschutzes, 2015, S. 24. 146 Surden, 89 Washington Law Review Rev. 87, 1, 2 (2014). 147 Ausführlich beschreibt dieses Beispiel Surden, 89 Washington Law Review Rev. 87, 1, 2-4 (2014). 148 Vorhersagen ohne Bezug zu einer Einzelperson werden im Folgenden ausgeklammert. 149 Eine metrische Einordnung erfolgt in Form eines genauen Wertes, z.B. in kg, l, m oder einer sonstigen Maßeinheit. 150 Wagner, INWT Statistics, Logistische Regression – Modell und Grundlagen, 15.7.2015, https://www.inwt-statistics.de/blog-artikel-lesen/Logistische_Regression.html, zuletzt abgerufen am 27.6.2018.

Predictive Analytic und die Haftung für fehlerhafte Ergebnisse gegenüber betroffenen Einzelpersonen

Подняться наверх