Оглавление
Hadley Wickham. R für Data Science
R für Data Science
Inhalt
Vorwort
Was Sie lernen werden
Wie dieses Buch organisiert ist
Was Sie hier nicht lernen werden
Big Data
Python, Julia und Konsorten
Nicht rechteckige Daten
Hypothesenbestätigung
Voraussetzungen
R
RStudio
Das Tidyverse
Andere Pakete
R-Code ausführen
Hilfe erhalten und mehr lernen
Danksagungen
Onlineversion
Konventionen in diesem Buch
Die Codebeispiele verwenden
TEIL I. Erkunden
KAPITEL 1. Datenvisualisierung mit ggplot2. Einführung
Voraussetzungen
Erste Schritte
Der Dataframe mpg
Einen ggplot erzeugen
Eine Grafikvorlage
Übungen
Zuordnungen visueller Eigenschaften
Übungen
Häufige Probleme
Facetten
Übungen
Geometrische Objekte
Übungen
Statistische Transformationen
Übungen
Positionsanpassungen
Übungen
Koordinatensysteme
Übungen
Die »Layered Grammar of Graphics«
KAPITEL 2. Workflow: Grundlagen
Grundlagen der Codierung
Was macht einen Namen aus?
Funktionen aufrufen
Übungen
KAPITEL 3. Datentransformation mit dplyr. Einführung
Voraussetzungen
nycflights13
dplyr-Grundlagen
Zeilen mit filter() filtern
Vergleiche
Logische Operatoren
Fehlende Werte
Übungen
Zeilen mit arrange() anordnen
Übungen
Spalten mit select() auswählen
Übungen
Neue Variablen mit mutate() hinzufügen
Nützliche Erstellungsfunktionen
Übungen
Gruppierte Zusammenfassungen mit summarize()
Mehrere Operationen mit der Pipe kombinieren
Fehlende Werte
Zähler
Nützliche Zusammenfassungsfunktionen
Gruppieren nach mehreren Variablen
Gruppierung aufheben
Übungen
Gruppierte Veränderungen (und Filter)
Übungen
KAPITEL 4. Workflow: Skripte
Code ausführen
RStudio-Fehlerdiagnose
Übungen
KAPITEL 5. Explorative Datenanalyse. Einführung
Voraussetzungen
Fragen
Variation
Verteilungen visualisieren
Typische Werte
Ungewöhnliche Werte
Übungen
Fehlende Werte
Übungen
Kovariation
Eine kategoriale und eine kontinuierliche Variable
Übungen
Zwei kategoriale Variablen
Übungen
Zwei kontinuierliche Variablen
Übungen
Muster und Modelle
ggplot2-Aufrufe
Mehr lernen
KAPITEL 6. Workflow: Projekte
Was ist real?
Wo ist Ihre Analyse untergebracht?
Pfade und Verzeichnisse
RStudio-Projekte
Zusammenfassung
TEIL II. Aufbereiten
KAPITEL 7. Tibbles mit tibble. Einführung
Voraussetzungen
Tibbles erzeugen
Tibbles versus data.frame
Ausgabe
Teilgruppen
Mit älterem Code arbeiten
Übungen
KAPITEL 8. Datenimport mit readr. Einführung
Voraussetzungen
Erste Schritte
Vergleich zu Basis-R
Übungen
Einen Vektor parsen
Zahlen
Strings
Faktoren
Datum, Datums-/Zeitwerte und Zeiten
Übungen
Eine Datei parsen
Strategie
Probleme
Andere Strategien
In eine Datei schreiben
Andere Datentypen
KAPITEL 9. Daten aufbereiten mit tidyr. Einführung
Voraussetzungen
Aufbereitete Daten
Übungen
Ausbreiten und Zusammenziehen
Zusammenziehen
Ausbreiten
Übungen
Aufteilen und Vereinigen
Aufteilen
Vereinigen
Übungen
Fehlende Werte
Übungen
Fallstudie
Übungen
Unaufbereitete Daten
KAPITEL 10. Relationale Daten mit dplyr. Einführung
Voraussetzungen
nycflights13
Übungen
Schlüssel
Übungen
Verändernde Verknüpfungen
Das Wesen von Verknüpfungen
Innere Verknüpfung
Äußere Verknüpfungen
Doppelte Schlüssel
Die Schlüsselspalten definieren
Übungen
Andere Implementierungen
Filternde Verknüpfungen
Übungen
Verknüpfungsprobleme
Mengenoperationen
KAPITEL 11. Strings mit stringr. Einführung
Voraussetzungen
Grundlagen von Strings
Stringlänge
Strings zusammenfassen
Teilstrings bilden
Gebietsschemas
Übungen
Musterübereinstimmung mit regulären Ausdrücken
Einfache Übereinstimmungen
Übungen
Anker
Übungen
Zeichenklassen und Alternativen
Übungen
Wiederholungen
Übungen
Gruppierungen und Rückwärtsreferenzen
Übungen
Tools
Übereinstimmungen erkennen
Übungen
Übereinstimmungen extrahieren
Übungen
Gruppierte Übereinstimmungen
Übungen
Übereinstimmungen ersetzen
Übungen
Teilen
Übungen
Übereinstimmungen suchen
Andere Mustertypen
Übungen
Andere Verwendungen von regulären Ausdrücken
stringi
Übungen
KAPITEL 12. Faktoren mit forcats. Einführung
Voraussetzungen
Faktoren erzeugen
General Social Survey
Übungen
Faktorenreihenfolge ändern
Übungen
Faktorstufen modifizieren
Übungen
KAPITEL 13. Datum und Uhrzeit mit lubridate. Einführung
Voraussetzungen
Datums-/Zeitwerte erzeugen
Datums-/Zeitwerte aus Strings
Datums-/Zeitwerte aus einzelnen Komponenten
Datums-/Zeitdaten aus anderen Typen
Übungen
Datums-/Zeitkomponenten
Komponenten abrufen
Runden
Komponenten festlegen
Übungen
Zeiträume
Dauern
Perioden
Intervalle
Zusammenfassung
Übungen
Zeitzonen
TEIL III. Programmieren
Mehr lernen
KAPITEL 14. Pipes mit magrittr. Einführung
Voraussetzungen
Alternativen zu Pipes
Zwischenschritte
Das Original überschreiben
Funktionskomposition
Die Pipe verwenden
Wann man Pipes nicht verwenden sollte
Andere Tools von magrittr
KAPITEL 15. Funktionen. Einführung
Voraussetzungen
Wann sollte man eine Funktion schreiben?
Übungen
Funktionen – nützlich für Menschen und Computer
Übungen
Bedingte Ausführung
Bedingungen
Mehrere Bedingungen
Codierungsstil
Übungen
Funktionsargumente
Namen auswählen
Werte überprüfen
Das Dreipunkt-Argument (…)
Lazy Evaluation
Übungen
Rückgabewerte
Explizite Rückgabeanweisungen
Pipefähige Funktionen schreiben
Umgebung
KAPITEL 16. Vektoren. Einführung
Voraussetzungen
Grundlagen von Vektoren
Wichtige Typen atomarer Vektoren
Logische Vektoren
Numerische Vektoren
Zeichenvektoren
Fehlende Werte
Übungen
Atomare Vektoren verwenden
Typumwandlung
Testfunktionen
Skalare und Recycling-Regeln
Vektoren benennen
Teilgruppen
Übungen
Rekursive Vektoren (Listen)
Listen visualisieren
Teilgruppen
Listen von Gewürzen
Übungen
Attribute
Erweiterte Vektoren
Faktoren
Datumswerte und Datums-/Zeitwerte
Tibbles
Übungen
KAPITEL 17. Iteration mit purrr. Einführung
Voraussetzungen
for-Schleifen
Übungen
Varianten von for-Schleifen
Ein vorhandenes Objekt modifizieren
Schleifenmuster
Unbekannte Länge der Ausgabe
Unbekannte Sequenzlänge
Übungen
For-Schleifen versus funktionale Programmierung
Übungen
Die map-Funktionen
Shortcuts
Basis-R
Übungen
Fehlerverarbeitung
Zuordnungen über mehrere Argumente
Verschiedene Funktionen aufrufen
Walk
Andere Muster von for-Schleifen
Prädikatfunktionen
Verringern und Akkumulieren
Übungen
TEIL IV. Modellieren
Hypothesen erzeugen versus Hypothesen bestätigen
KAPITEL 18. Grundlagen der Modellierung mit modelr. Einführung
Voraussetzungen
Ein einfaches Modell
Übungen
Modelle visualisieren
Vorhersagen
Residuen
Übungen
Formel und Modellfamilien
Kategoriale Variablen
Interaktionen (kontinuierlich und kategorial)
Interaktionen (zwei kontinuierliche Variablen)
Transformationen
Übungen
Fehlende Werte
Andere Modellfamilien
KAPITEL 19. Modelle erstellen. Einführung
Voraussetzungen
Warum sind Diamanten geringer Qualität teurer als höherwertige?
Preis und Karat
Ein komplexeres Modell
Übungen
Was beeinflusst die Anzahl der täglichen Flüge?
Wochentag
Jahreszeitbedingter Samstageffekt
Berechnete Variablen
Jahreszeit: Ein alternativer Ansatz
Übungen
Mehr über Modelle lernen
KAPITEL 20. Viele Modelle mit purrr und broom. Einführung
Voraussetzungen
Gapminder
Verschachtelte Daten
Listenspalten
Verschachtelung aufheben
Modellqualität
Übungen
Listenspalten
Listenspalten erzeugen
… mit Verschachtelung
… von vektorisierten Funktionen
… von mehrwertigen Zusammenfassungsfunktionen
… aus einer benannten Liste
Übungen
Listenspalten vereinfachen
Liste zu Vektor
Verschachtelung aufheben
Übungen
Daten bereinigen mit broom
TEIL V. Kommunizieren
KAPITEL 21. R Markdown. Einführung
Voraussetzungen
R-Markdown-Grundlagen
Übungen
Textformatierung mit Markdown
Übungen
Codebereiche
Bereichsname
Bereichsoptionen
Tabellen
Zwischenspeichern
Globale Optionen
Inline-Code
Übungen
Fehlerbehebung
YAML-Header
Parameter
Bibliografien und Zitate
Mehr lernen
KAPITEL 22. Grafik für Kommunikation mit ggplot2. Einführung
Voraussetzungen
Beschriftungen
Übungen
Anmerkungen
Übungen
Skalen
Achsenteilungen und Legendenschlüssel
Legendenlayout
Eine Skala ersetzen
Übungen
Zoomen
Themen
Diagramme speichern
Größe der Abbildungen
Andere wichtige Optionen
Mehr lernen
KAPITEL 23. R-Markdown-Formate. Einführung
Ausgabeoptionen
Dokumente
Notebooks
Präsentationen
Dashboards
Interaktivität
htmlwidgets
Shiny
Websites
Andere Formate
Mehr lernen
KAPITEL 24. R-Markdown-Workflow
Index. Symbole
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
Über die Autoren
Kolophon
Fußnoten. Vorwort
Kapitel 11: Strings mit stringr
Kapitel 18: Grundlagen der Modellierung mit modelr
Kapitel 19: Modelle erstellen
Kapitel 21: R Markdown