Читать книгу Praktische Statistik für Data Scientists - Peter Bruce - Страница 54

Schlüsselbegriffe zur Exploration von zwei oder mehr Variablen

Оглавление

Kontingenztafeln

Eine Kreuztabelle mit den Häufigkeiten von zwei oder mehr kategorialen Variablen (engl. Contingency Table).

Hexagonal-Binning-Diagramm

Ein Diagramm für zwei numerische Variablen, wobei die Beobachtungen in Sechsecken zusammengefasst sind.

Konturdiagramm

Ein Diagramm, bei dem die Wahrscheinlichkeitsdichtefunktion zweier numerischer Variablen wie eine topografische Karte abgebildet wird (engl. Contour Plot).

Violin-Plot

Ähnlich wie ein Box-Plot, zeigt allerdings darüber hinaus noch die geschätzte Dichtefunktion.

Wie bei der univariaten Analyse möchten wir auch bei der bivariaten Analyse einerseits zusammenfassende statistische Kenngrößen ermitteln und andererseits anschauliche Visualisierungen erstellen. Die geeignete Art der bi- bzw. multivariaten Analyse hängt vom Datentyp ab – je nachdem, ob die Daten als numerische oder kategoriale Variablen vorliegen.

Praktische Statistik für Data Scientists

Подняться наверх