Читать книгу Praxiseinstieg Machine Learning mit Scikit-Learn, Keras und TensorFlow - Aurélien Géron - Страница 58

Schreibweisen

Оглавление

In dieser Gleichung werden mehrere im Machine Learning übliche Schreibweisen verwendet, die wir im gesamten Buch wiedersehen werden:

 m ist die Anzahl Datenpunkte im Datensatz, für den der RMSE bestimmt wird.– Wenn Sie beispielsweise den RMSE für einen Validierungsdatensatz mit 2.000 Bezirken auswerten, dann gilt m = 2000.

 x(i) ist ein Vektor der Werte aller Merkmale (ohne das Label) des i. Datenpunkts im Datensatz, und y(i) ist das dazugehörige Label (der gewünschte Ausgabewert für diesen Datenpunkt).– Wenn der erste Bezirk beispielsweise bei –118,29° Länge und 33,91° nördlicher Breite liegt, 1.416 Einwohner mit einem mittleren Einkommen von 38.372 USD hat und der mittlere Immobilienpreis 156.400 USD beträgt (die übrigen Merkmale ignorieren wir noch), dann gilt:und:y(1) = 156400

 X ist eine Matrix mit den Werten sämtlicher Merkmale (ohne Labels) für alle Datenpunkte im Datensatz. Pro Datenpunkt gibt es eine Zeile, und die i. Zeile entspricht der transponierten Form von x(i), auch als (x(i))T geschrieben.4– Beispielsweise sieht die Matrix X für den oben beschriebenen ersten Bezirk folgendermaßen aus:

 h ist die Vorhersagefunktion Ihres Systems, auch Hypothese genannt. Wenn Ihr System den Merkmalsvektor eines Datenpunkts x(i) erhält, gibt es den Vorhersagewert ŷ(i) = h(x(i)) für diesen Datenpunkt aus.– Sagt Ihr System beispielsweise im ersten Bezirk einen mittleren Immobilienpreis von 158.400 USD vorher, so ist ŷ(1) = h(x(1)) = 158400. Der Vorhersagefehler für diesen Bezirk ist dann ŷ(1) – y(1) = 2000.

 RMSE(X,h) ist die auf den Beispieldaten mit Ihrer Hypothese h gemessene Kostenfunktion.

Wir verwenden kursive Kleinbuchstaben für Skalare (wie m oder y(i)) und Funktionen (wie h), fett gedruckte Kleinbuchstaben für Vektoren (wie x(i)) und fett gedruckte Großbuchstaben für Matrizen (wie X).

Obwohl der RMSE bei Regressionsaufgaben grundsätzlich das Qualitätsmaß erster Wahl ist, sollten Sie in manchen Situationen eine andere Funktion vorziehen. Nehmen wir an, es gäbe viele Ausreißer unter den Bezirken. In diesem Fall könnten Sie den mittleren absoluten Fehler (MAE, auch als mittlere absolute Abweichung bezeichnet; siehe Formel 2-2) berücksichtigen:

Praxiseinstieg Machine Learning mit Scikit-Learn, Keras und TensorFlow

Подняться наверх