Читать книгу Multivariate Analysemethoden - J. Winke - Страница 16
Auswahl der Methode
ОглавлениеIn diesem Abschnitt soll geklärt werden, welche Methoden es gibt, um fehlende Werte zu ersetzen bzw. mit ihnen umzugehen.
Die Verfahren sind unterteilt in klassische Verfahren, modellbasierte Verfahren und imputationsbasierte Verfahren.
Generell gilt:
Klassische Verfahren werden häufig verwendet, weil sie z. B. bei SPSS voreingestellt sind. Die klassischen Verfahren sind aber in den meisten Fälle nicht zu empfehlen.
Die modellbasierten Verfahren wurden durch die Multiple Imputation weitestgehend abgelöst.
Es gibt keine feste Anleitung und der Umgang mit fehlenden Werten kann sehr subjektiv sein. In den meisten Fällen wird die Multiple Imputation empfohlen.
(Hair, 2010, S. 50-54) & (Bankhofer, 1995)
Klassische Verfahren
a) Listenweiser Fallausschluss
Nur vollständige Fälle werden in die Analyse miteinbezogen. Jeder Fall, der nur einen einzigen fehlenden Wert aufweist, wird ausgeschlossen. Der listenweise Fallausschluss wird häufig verwendet, da es die Voreinstellung bei SPSS ist. Diese Methode wird aber nicht empfohlen. (Lüdtke & Trautwein, 2007) & (IBM Corp., 2017) & (Hair, 2010, S. 50-54)
Voraussetzung: MCAR- Daten
Abbildung 17: Listenweiser Fallausschluss (Vor- und Nachteile)
Eigene Darstellung
b) Paarweiser Fallausschluss
Beim paarweisen Fallausschluss werden die Variablen paarweise betrachtet. Ihre Werte werden dann verwendet, wenn beide Variablen in diesem Fall keine fehlenden Werte aufweisen. Der Vorteil dieser Methode ist, dass es sich hier um das Ad-Hoc-Verfahren handelt, das die größtmögliche Stichprobengröße erreicht. Die Nachteile sind jedoch wiederum bei den variierenden Stichproben zu sehen, da so unterschiedliche Ergebnisse gar nicht wissenschaftlich fundiert verglichen werden können. Außerdem kann es bei einer solchen Vorgehensweise zu einem Bias in den Parameterschätzungen kommen, vor allem wenn es sich nicht um das vorausgesetzte MCAR-Datenniveau handelt.
Diese Art im Umgang fehlender Werte sollte darum nicht angewandt werden. Hier können insbesondere durch die unterschiedlich zusammengesetzten Stichproben ganz verschiedene Ergebnisse entstehen, die dann nicht mehr vergleichbar sind. (Lüdtke & Trautwein, 2007) & (IBM Corp., 2017) & (Hair, 2010, S. 50-54)
Abbildung 18: Paarweiser Fallausschluss (Vor- und Nachteile)
Eigene Darstellung
Imputationsbasierte Verfahren
Bei der Imputation werden die Werte für die fehlenden Daten geschätzt. Imputationsbasierte Verfahren zielen darauf ab, die fehlenden Werte durch möglichst „plausible“ Werte zu ergänzen.
a) Ersetzung durch den Stichprobenmittelwert
Bei der Mittelwert-Imputation werden die Missing Values durch die Mittelwerte der beobachteten Werte der jeweiligen Variablen ersetzt.