Читать книгу Multivariate Analysemethoden - J. Winke - Страница 14
Die Löschung von unvollständigen Daten
ОглавлениеEin Zwischenschritt in der Abfolge der Analyse fehlender Werte ist die Möglichkeit Variablen bzw. Fälle, welche Missing Values beinhalten, zu löschen, um so einen vollständigen Datensatz zu schaffen.
Faustregeln (Hair, Black, Babin, & Anderson, 2010, S. 48):
Fälle oder Variablen mit einem Anteil von 50% (oder mehr) an fehlenden Werten
Variablen mit einem Anteil an fehlenden Werten ab 15% können gelöscht werden, allerdings können fehlende Werte auch von 20-30% noch behoben werden.
Der Rückgang an fehlenden Werten sollte groß genug sein, um das Löschen einer einzelnen Variablen oder eines Falles zu rechtfertigen.
Fälle mit fehlenden Daten für abhängige Variablen werden in der Regel gelöscht, um zu vermeiden, dass ein Zusammenhang stärker dargestellt wird, als er es möglicherweise wirklich ist.
Beim Löschen einer Variablen sollte sichergestellt sein, dass alternative Variablen vorhanden sind, die die Intention der Originalvariablen repräsentieren können.
Generell sollte eine Analyse sowohl ohne als auch mit der gelöschten Variablen durchgeführt werden, um Unterschiede feststellen zu können.
Zusammenfassend lässt sich sagen, dass beim Löschen von Variablen und/ oder Fällen die vorgesehene Analyse sowohl mit dem Originaldatensatz als auch mit dem gekürzten Datensatz durchgeführt werden sollte.
So können eventuell vorhandene Unterschiede in den Ergebnissen identifiziert werden. Wichtig ist hierbei, dass die Stichprobe nach der Löschung noch groß genug für die Analyse ist und nicht viel Repräsentativität verloren hat. Da diese Methode sehr einfach und schnell durchzuführen ist, wird sie auch häufig beim Umgang mit fehlenden Werten angewandt.