Читать книгу R für Data Science - Hadley Wickham - Страница 46

Die »Layered Grammar of Graphics«

Оглавление

In den bisherigen Abschnitten haben Sie viel darüber gelernt, wie Sie Streudiagramme, Balkendiagramme und Boxplots erstellen. Damit beherrschen Sie die Grundlagen, um praktisch jeden Diagrammtyp mit ggplot2 zu erzeugen. Um dies zu veranschaulichen, fügen wir Positionsanpassungen, statistische Transformationen, Koordinatensysteme und Facettenerzeugung in unsere Codevorlage ein:

ggplot(data = <DATA>) +

<GEOM_FUNCTION>(

mapping = aes(<MAPPINGS>),

stat = <STAT>,

position = <POSITION>

) +

<COORDINATE_FUNCTION> +

<FACET_FUNCTION>

Unsere neue Vorlage übernimmt sieben Parameter, die in der Vorlage als Bezeichner in spitzen Klammern erscheinen. In der Praxis muss man kaum alle sieben Parameter bereitstellen, um ein Diagramm zu erstellen, weil ggplot2 zweckmäßige Standardwerte für alles bereitstellt, bis auf die Daten, die Zuordnungen und die geom-Funktion.

Die sieben Parameter in der Vorlage bilden die Grammatik der Grafik, ein formales System für das Erstellen von Diagrammen. Die Grammatik der Grafik basiert auf der Erkenntnis, dass man jedes Diagramm eindeutig beschreiben kann als Kombination von Datenset, geom, einem Satz von Zuordnungen, einer Positionsanpassung, einem Koordinatensystem und einem Facettenschema.

Um sich die Funktionsweise zu veranschaulichen, sehen Sie sich an, wie man ein einfaches Diagramm von Grund auf neu erstellt: Man beginnt mit einem Datenset und transformiert es, um die (mit einem stat) anzuzeigenden Informationen zu erhalten:


Als Nächstes wählen Sie ein geometrisches Objekt aus, um die Beobachtungen in den transformierten Daten wiederzugeben. Dann verwenden Sie die visuellen Eigenschaften der geom-Objekte, um Variablen in den Daten darzustellen. Die Werte jeder Variablen bilden Sie auf die Ebenen einer visuellen Eigenschaft ab:


Dann wählen Sie ein Koordinatensystem aus, in dem die geom-Objekte zu platzieren sind. Anschließend verwenden Sie den Ort der Objekte (der an sich eine visuelle Eigenschaft ist), um die Werte der x- und y-Variablen anzuzeigen. Jetzt wäre schon ein vollständiges Diagramm vorhanden, doch Sie können die Positionen der geom-Objekte innerhalb des Koordinatensystems weiter anpassen (Positionsanpassung) oder das Diagramm in Teildiagramme aufteilen (Facettenbildung). Das Diagramm ließe sich auch durch eine oder mehrere zusätzliche Ebenen erweitern, wobei jede weitere Ebene ein Datenset, ein geom, einen Satz von Zuordnungen, ein stat und eine Positionsanpassung verwendet:


Nach dieser Methode können Sie jedes beliebige Diagramm erzeugen, das Sie sich vorstellen können. Anders ausgedrückt, können Sie die Codevorlage, die Sie in diesem Kapitel kennengelernt haben, nutzen, um unzählige einzigartige Diagramme zu erstellen.

R für Data Science

Подняться наверх