Читать книгу Praktische Statistik für Data Scientists - Peter Bruce - Страница 19
Schlüsselbegriffe zu Lagemaßen
ОглавлениеMittelwert
Die Summe aller Werte dividiert durch die Anzahl der Werte.
Synonyme
arithmetisches Mittel, Durchschnitt
Gewichteter Mittelwert
Die Summe aller Werte, die jeweils mit einem Gewicht bzw. einem Gewichtungsfaktor multipliziert werden, geteilt durch die Summe aller Gewichte.
Synonym
gewichteter Durchschnitt
Median
Der Wert, bei dem die Hälfte der Daten oberhalb und die andere Hälfte unterhalb dieses Werts liegt.
Synonym
50%-Perzentil
Perzentil
Der Wert, bei dem P % der Daten unterhalb dieses Werts liegen.
Synonym
Quantil
Gewichteter Median
Der Wert, bei dem die Summe der Gewichte der sortierten Daten exakt die Hälfte beträgt und der die Daten so einteilt, dass sie entweder oberhalb oder unterhalb diesen Werts liegen.
Getrimmter Mittelwert
Der Mittelwert aller Werte, nachdem eine vorgegebene Anzahl von Ausreißern entfernt wurde.
Synonym
gestutzter Mittelwert
Robust
Nicht sensibel gegenüber Ausreißern.
Ausreißer
Ein Datenwert, der sich stark von den übrigen Daten unterscheidet.
Synonym
Extremwert
Auf den ersten Blick mag für Sie die Ermittlung einer zusammenfassenden Größe, die Aufschluss über einen vorliegenden Datensatz gibt, ziemlich trivial erscheinen: Sie nehmen einfach den Mittelwert, der sich für den Datensatz ergibt. Tatsächlich ist der Mittelwert zwar leicht zu berechnen und relativ zweckmäßig, aber er ist nicht immer das beste Maß zur Bestimmung eines Zentralwerts. Aus diesem Grund haben Statistiker mehrere alternative Schätzer zum Mittelwert entwickelt und befürwortet.
Metriken und Schätzwerte Statistiker verwenden oft den Begriff Schätzwert für einen aus den vorliegenden Daten berechneten Wert, um zwischen dem, was wir aus den Daten ziehen, und der theoretisch wahren oder tatsächlichen Sachlage zu unterscheiden. Data Scientists und Geschäftsanalysten sprechen bei einem solchen Wert von einer Metrik. Der Unterschied spiegelt den Ansatz der Statistik im Vergleich zur Datenwissenschaft wider: Die Berücksichtigung von Unsicherheit steht im Mittelpunkt der statistischen Disziplin, währnd in der Datenwissenschaft konkrete geschäftliche oder organisatorische Ziele im Fokus stehen. Daher kann man sagen, dass Statistiker Schätzungen durchführen und Data Scientists Messungen vornehmen. |