Читать книгу Praxiseinstieg Machine Learning mit Scikit-Learn, Keras und TensorFlow - Aurélien Géron - Страница 33
Modellbasiertes Lernen
ОглавлениеEine andere Möglichkeit, von einem Beispieldatensatz zu verallgemeinern, ist, ein Modell aus den Beispielen zu entwickeln und dieses Modell dann für Vorhersagen zu verwenden. Das wird als modellbasiertes Lernen bezeichnet (siehe Abbildung 1-16).
Abbildung 1-16: Modellbasiertes Lernen
Nehmen wir an, Sie möchten herausfinden, ob Geld glücklich macht. Sie laden dazu die Daten des Better Life Index von der Webseite des OECD (https://homl.info/4) herunter und Statistiken zum Pro-Kopf-Bruttoinlandsprodukt (BIP) von der Webseite des IMF (https://homl.info/5). Anschließend führen Sie beide Tabellen zusammen und sortieren nach dem BIP pro Kopf. Tabelle 1-1 zeigt einen Ausschnitt des Ergebnisses.
Tabelle 1-1: Macht Geld Menschen glücklicher?
Land | BIP pro Kopf (USD) | Zufriedenheit |
Ungarn | 12240 | 4,9 |
Korea | 27195 | 5,8 |
Frankreich | 37675 | 6,5 |
Australien | 50962 | 7,3 |
Vereinigte Staaten | 55805 | 7,2 |
Stellen wir die Daten für einige dieser Länder dar (siehe Abbildung 1-17).
Abbildung 1-17: Sehen Sie hier eine Tendenz?
Es scheint so etwas wie einen Trend zu geben! Auch wenn die Daten verrauscht sind (also teilweise zufällig), sieht es so aus, als stiege die Zufriedenheit mehr oder weniger mit dem Pro-Kopf-BIP des Lands linear an. Sie beschließen also, die Zufriedenheit als lineare Funktion des Pro-Kopf-Bruttoinlandsprodukts zu modellieren. Diesen Schritt bezeichnet man als Modellauswahl: Sie wählen ein lineares Modell der Zufriedenheit mit genau einem Merkmal aus, nämlich dem Pro-Kopf-BIP (siehe Formel 1-1).