Читать книгу R für Data Science - Hadley Wickham - Страница 5

Inhalt

Оглавление

Vorwort

Teil IErkunden

1Datenvisualisierung mit ggplot2

Einführung

Erste Schritte

Zuordnungen visueller Eigenschaften

Häufige Probleme

Facetten

Geometrische Objekte

Statistische Transformationen

Positionsanpassungen

Koordinatensysteme

Die »Layered Grammar of Graphics«

2Workflow: Grundlagen

Grundlagen der Codierung

Was macht einen Namen aus?

Funktionen aufrufen

3Datentransformation mit dplyr

Einführung

Zeilen mit filter() filtern

Zeilen mit arrange() anordnen

Spalten mit select() auswählen

Neue Variablen mit mutate() hinzufügen

Gruppierte Zusammenfassungen mit summarize()

Gruppierte Veränderungen (und Filter)

4Workflow: Skripte

Code ausführen

RStudio-Fehlerdiagnose

5Explorative Datenanalyse

Einführung

Fragen

Variation

Fehlende Werte

Kovariation

Muster und Modelle

ggplot2-Aufrufe

Mehr lernen

6Workflow: Projekte

Was ist real?

Wo ist Ihre Analyse untergebracht?

Pfade und Verzeichnisse

RStudio-Projekte

Zusammenfassung

Teil IIAufbereiten

7Tibbles mit tibble

Einführung

Tibbles erzeugen

Tibbles versus data.frame

Teilgruppen

Mit älterem Code arbeiten

8Datenimport mit readr

Einführung

Erste Schritte

Einen Vektor parsen

Eine Datei parsen

In eine Datei schreiben

Andere Datentypen

9Daten aufbereiten mit tidyr

Einführung

Aufbereitete Daten

Ausbreiten und Zusammenziehen

Aufteilen und Vereinigen

Fehlende Werte

Fallstudie

Unaufbereitete Daten

10Relationale Daten mit dplyr

Einführung

nycflights13

Schlüssel

Verändernde Verknüpfungen

Filternde Verknüpfungen

Verknüpfungsprobleme

Mengenoperationen

11Strings mit stringr

Einführung

Grundlagen von Strings

Musterübereinstimmung mit regulären Ausdrücken

Tools

Andere Mustertypen

Andere Verwendungen von regulären Ausdrücken

stringi

12Faktoren mit forcats

Einführung

Faktoren erzeugen

General Social Survey

Faktorenreihenfolge ändern

Faktorstufen modifizieren

13Datum und Uhrzeit mit lubridate

Einführung

Datums-/Zeitwerte erzeugen

Datums-/Zeitkomponenten

Zeiträume

Zeitzonen

Teil IIIProgrammieren

14Pipes mit magrittr

Einführung

Alternativen zu Pipes

Wann man Pipes nicht verwenden sollte

Andere Tools von magrittr

15Funktionen

Einführung

Wann sollte man eine Funktion schreiben?

Funktionen – nützlich für Menschen und Computer

Bedingte Ausführung

Funktionsargumente

Rückgabewerte

Umgebung

16Vektoren

Einführung

Grundlagen von Vektoren

Wichtige Typen atomarer Vektoren

Atomare Vektoren verwenden

Rekursive Vektoren (Listen)

Attribute

Erweiterte Vektoren

17Iteration mit purrr

Einführung

for-Schleifen

Varianten von for-Schleifen

Die map-Funktionen

Fehlerverarbeitung

Zuordnungen über mehrere Argumente

Walk

Andere Muster von for-Schleifen

Teil IVModellieren

18Grundlagen der Modellierung mit modelr

Einführung

Ein einfaches Modell

Modelle visualisieren

Formel und Modellfamilien

Fehlende Werte

Andere Modellfamilien

19Modelle erstellen

Einführung

Warum sind Diamanten geringer Qualität teurer als höherwertige?

Was beeinflusst die Anzahl der täglichen Flüge?

Mehr über Modelle lernen

20Viele Modelle mit purrr und broom

Einführung

Gapminder

Listenspalten

Listenspalten erzeugen

Listenspalten vereinfachen

Daten bereinigen mit broom

Teil VKommunizieren

21R Markdown

Einführung

R-Markdown-Grundlagen

Textformatierung mit Markdown

Codebereiche

Fehlerbehebung

YAML-Header

Mehr lernen

22Grafik für Kommunikation mit ggplot2

Einführung

Beschriftungen

Anmerkungen

Skalen

Zoomen

Themen

Diagramme speichern

Mehr lernen

23R-Markdown-Formate

Einführung

Ausgabeoptionen

Dokumente

Notebooks

Präsentationen

Dashboards

Interaktivität

Websites

Andere Formate

Mehr lernen

24R-Markdown-Workflow

Index

R für Data Science

Подняться наверх