Читать книгу Praxiseinstieg Machine Learning mit Scikit-Learn, Keras und TensorFlow - Aurélien Géron - Страница 59

Formel 2-2: mittlerer absoluter Fehler

Оглавление

Sowohl RMSE als auch MAE quantifizieren den Abstand zwischen zwei Vektoren: dem Vektor aller Vorhersagen und dem Vektor mit den Zielwerten. Dabei sind unterschiedliche Abstandsmaße oder Normen möglich:

 Die Wurzel einer quadratischen Summe (RMSE) entspricht dem euklidischen Abstand: Dies ist der Ihnen vertraute Abstand. Sie wird auch als 2-Norm oder || · ||2 (oder einfach || · ||) bezeichnet.

 Das Berechnen einer Summe von Absolutwerten (MAE) entspricht der 1-Norm, geschrieben als || · ||1. Diese nennt man bisweilen auch Manhattan-Metrik, da sie den Abstand zwischen zwei Punkten in einer Stadt angibt, in der man sich nur entlang rechtwinkliger Häuserblöcke bewegen kann.

 Allgemeiner ist die k-Norm eines Vektors v mit n Elementen als definiert. 0 gibt einfach nur die Anzahl der Elemente ungleich null im Vektor wieder, und ∞ berechnet den größten Absolutwert im Vektor.

 Je höher der Index einer Norm ist, umso stärker berücksichtigt er große Werte und vernachlässigt kleinere. Deshalb ist der RMSE empfindlicher für Ausreißer als der MAE. Sind Ausreißer aber exponentiell selten (wie in einer Glockenkurve), funktioniert der RMSE sehr gut und ist grundsätzlich vorzuziehen.

Praxiseinstieg Machine Learning mit Scikit-Learn, Keras und TensorFlow

Подняться наверх