R für Data Science

R für Data Science
Автор книги: id книги: 2187875     Оценка: 0.0     Голосов: 0     Отзывы, комментарии: 0 2214,88 руб.     (21,78$) Читать книгу Купить и скачать книгу Электронная книга Жанр: Математика Правообладатель и/или издательство: Bookwire Дата добавления в каталог КнигаЛит: ISBN: 9783960101543 Скачать фрагмент в формате   fb2   fb2.zip Возрастное ограничение: 0+ Оглавление Отрывок из книги

Реклама. ООО «ЛитРес», ИНН: 7719571260.

Описание книги

Lernen Sie, wie Sie mit R Ihre Rohdaten in Erkenntnisse und Wissen umwandeln. Dieses Buch führt Sie ein in R, RStudio und tidyverse – eine Sammlung von R-Paketen, die ineinandergreifen, um Data Science schnell, flüssig und komfortabel zu machen. R für Data Science ist geeignet für Leser ohne vorherige Programmierkenntnisse und zielt darauf ab, dass Sie Techniken der Data Science so schnell wie möglich in der Praxis umsetzen können.
Die Autoren Hadley Wickham und Garrett Grolemund zeigen, wie Sie Daten importieren, aufbereiten, untersuchen und modellieren und wie Sie die Ergebnisse kommunizieren können. So bekommen Sie einen vollständigen Überblick über den Data-Science-Zyklus und die Tools, die für die Detailarbeit erforderlich sind.

Оглавление

Hadley Wickham. R für Data Science

R für Data Science

Inhalt

Vorwort

Was Sie lernen werden

Wie dieses Buch organisiert ist

Was Sie hier nicht lernen werden

Big Data

Python, Julia und Konsorten

Nicht rechteckige Daten

Hypothesenbestätigung

Voraussetzungen

R

RStudio

Das Tidyverse

Andere Pakete

R-Code ausführen

Hilfe erhalten und mehr lernen

Danksagungen

Onlineversion

Konventionen in diesem Buch

Die Codebeispiele verwenden

TEIL I. Erkunden

KAPITEL 1. Datenvisualisierung mit ggplot2. Einführung

Voraussetzungen

Erste Schritte

Der Dataframe mpg

Einen ggplot erzeugen

Eine Grafikvorlage

Übungen

Zuordnungen visueller Eigenschaften

Übungen

Häufige Probleme

Facetten

Übungen

Geometrische Objekte

Übungen

Statistische Transformationen

Übungen

Positionsanpassungen

Übungen

Koordinatensysteme

Übungen

Die »Layered Grammar of Graphics«

KAPITEL 2. Workflow: Grundlagen

Grundlagen der Codierung

Was macht einen Namen aus?

Funktionen aufrufen

Übungen

KAPITEL 3. Datentransformation mit dplyr. Einführung

Voraussetzungen

nycflights13

dplyr-Grundlagen

Zeilen mit filter() filtern

Vergleiche

Logische Operatoren

Fehlende Werte

Übungen

Zeilen mit arrange() anordnen

Übungen

Spalten mit select() auswählen

Übungen

Neue Variablen mit mutate() hinzufügen

Nützliche Erstellungsfunktionen

Übungen

Gruppierte Zusammenfassungen mit summarize()

Mehrere Operationen mit der Pipe kombinieren

Fehlende Werte

Zähler

Nützliche Zusammenfassungsfunktionen

Gruppieren nach mehreren Variablen

Gruppierung aufheben

Übungen

Gruppierte Veränderungen (und Filter)

Übungen

KAPITEL 4. Workflow: Skripte

Code ausführen

RStudio-Fehlerdiagnose

Übungen

KAPITEL 5. Explorative Datenanalyse. Einführung

Voraussetzungen

Fragen

Variation

Verteilungen visualisieren

Typische Werte

Ungewöhnliche Werte

Übungen

Fehlende Werte

Übungen

Kovariation

Eine kategoriale und eine kontinuierliche Variable

Übungen

Zwei kategoriale Variablen

Übungen

Zwei kontinuierliche Variablen

Übungen

Muster und Modelle

ggplot2-Aufrufe

Mehr lernen

KAPITEL 6. Workflow: Projekte

Was ist real?

Wo ist Ihre Analyse untergebracht?

Pfade und Verzeichnisse

RStudio-Projekte

Zusammenfassung

TEIL II. Aufbereiten

KAPITEL 7. Tibbles mit tibble. Einführung

Voraussetzungen

Tibbles erzeugen

Tibbles versus data.frame

Ausgabe

Teilgruppen

Mit älterem Code arbeiten

Übungen

KAPITEL 8. Datenimport mit readr. Einführung

Voraussetzungen

Erste Schritte

Vergleich zu Basis-R

Übungen

Einen Vektor parsen

Zahlen

Strings

Faktoren

Datum, Datums-/Zeitwerte und Zeiten

Übungen

Eine Datei parsen

Strategie

Probleme

Andere Strategien

In eine Datei schreiben

Andere Datentypen

KAPITEL 9. Daten aufbereiten mit tidyr. Einführung

Voraussetzungen

Aufbereitete Daten

Übungen

Ausbreiten und Zusammenziehen

Zusammenziehen

Ausbreiten

Übungen

Aufteilen und Vereinigen

Aufteilen

Vereinigen

Übungen

Fehlende Werte

Übungen

Fallstudie

Übungen

Unaufbereitete Daten

KAPITEL 10. Relationale Daten mit dplyr. Einführung

Voraussetzungen

nycflights13

Übungen

Schlüssel

Übungen

Verändernde Verknüpfungen

Das Wesen von Verknüpfungen

Innere Verknüpfung

Äußere Verknüpfungen

Doppelte Schlüssel

Die Schlüsselspalten definieren

Übungen

Andere Implementierungen

Filternde Verknüpfungen

Übungen

Verknüpfungsprobleme

Mengenoperationen

KAPITEL 11. Strings mit stringr. Einführung

Voraussetzungen

Grundlagen von Strings

Stringlänge

Strings zusammenfassen

Teilstrings bilden

Gebietsschemas

Übungen

Musterübereinstimmung mit regulären Ausdrücken

Einfache Übereinstimmungen

Übungen

Anker

Übungen

Zeichenklassen und Alternativen

Übungen

Wiederholungen

Übungen

Gruppierungen und Rückwärtsreferenzen

Übungen

Tools

Übereinstimmungen erkennen

Übungen

Übereinstimmungen extrahieren

Übungen

Gruppierte Übereinstimmungen

Übungen

Übereinstimmungen ersetzen

Übungen

Teilen

Übungen

Übereinstimmungen suchen

Andere Mustertypen

Übungen

Andere Verwendungen von regulären Ausdrücken

stringi

Übungen

KAPITEL 12. Faktoren mit forcats. Einführung

Voraussetzungen

Faktoren erzeugen

General Social Survey

Übungen

Faktorenreihenfolge ändern

Übungen

Faktorstufen modifizieren

Übungen

KAPITEL 13. Datum und Uhrzeit mit lubridate. Einführung

Voraussetzungen

Datums-/Zeitwerte erzeugen

Datums-/Zeitwerte aus Strings

Datums-/Zeitwerte aus einzelnen Komponenten

Datums-/Zeitdaten aus anderen Typen

Übungen

Datums-/Zeitkomponenten

Komponenten abrufen

Runden

Komponenten festlegen

Übungen

Zeiträume

Dauern

Perioden

Intervalle

Zusammenfassung

Übungen

Zeitzonen

TEIL III. Programmieren

Mehr lernen

KAPITEL 14. Pipes mit magrittr. Einführung

Voraussetzungen

Alternativen zu Pipes

Zwischenschritte

Das Original überschreiben

Funktionskomposition

Die Pipe verwenden

Wann man Pipes nicht verwenden sollte

Andere Tools von magrittr

KAPITEL 15. Funktionen. Einführung

Voraussetzungen

Wann sollte man eine Funktion schreiben?

Übungen

Funktionen – nützlich für Menschen und Computer

Übungen

Bedingte Ausführung

Bedingungen

Mehrere Bedingungen

Codierungsstil

Übungen

Funktionsargumente

Namen auswählen

Werte überprüfen

Das Dreipunkt-Argument (…)

Lazy Evaluation

Übungen

Rückgabewerte

Explizite Rückgabeanweisungen

Pipefähige Funktionen schreiben

Umgebung

KAPITEL 16. Vektoren. Einführung

Voraussetzungen

Grundlagen von Vektoren

Wichtige Typen atomarer Vektoren

Logische Vektoren

Numerische Vektoren

Zeichenvektoren

Fehlende Werte

Übungen

Atomare Vektoren verwenden

Typumwandlung

Testfunktionen

Skalare und Recycling-Regeln

Vektoren benennen

Teilgruppen

Übungen

Rekursive Vektoren (Listen)

Listen visualisieren

Teilgruppen

Listen von Gewürzen

Übungen

Attribute

Erweiterte Vektoren

Faktoren

Datumswerte und Datums-/Zeitwerte

Tibbles

Übungen

KAPITEL 17. Iteration mit purrr. Einführung

Voraussetzungen

for-Schleifen

Übungen

Varianten von for-Schleifen

Ein vorhandenes Objekt modifizieren

Schleifenmuster

Unbekannte Länge der Ausgabe

Unbekannte Sequenzlänge

Übungen

For-Schleifen versus funktionale Programmierung

Übungen

Die map-Funktionen

Shortcuts

Basis-R

Übungen

Fehlerverarbeitung

Zuordnungen über mehrere Argumente

Verschiedene Funktionen aufrufen

Walk

Andere Muster von for-Schleifen

Prädikatfunktionen

Verringern und Akkumulieren

Übungen

TEIL IV. Modellieren

Hypothesen erzeugen versus Hypothesen bestätigen

KAPITEL 18. Grundlagen der Modellierung mit modelr. Einführung

Voraussetzungen

Ein einfaches Modell

Übungen

Modelle visualisieren

Vorhersagen

Residuen

Übungen

Formel und Modellfamilien

Kategoriale Variablen

Interaktionen (kontinuierlich und kategorial)

Interaktionen (zwei kontinuierliche Variablen)

Transformationen

Übungen

Fehlende Werte

Andere Modellfamilien

KAPITEL 19. Modelle erstellen. Einführung

Voraussetzungen

Warum sind Diamanten geringer Qualität teurer als höherwertige?

Preis und Karat

Ein komplexeres Modell

Übungen

Was beeinflusst die Anzahl der täglichen Flüge?

Wochentag

Jahreszeitbedingter Samstageffekt

Berechnete Variablen

Jahreszeit: Ein alternativer Ansatz

Übungen

Mehr über Modelle lernen

KAPITEL 20. Viele Modelle mit purrr und broom. Einführung

Voraussetzungen

Gapminder

Verschachtelte Daten

Listenspalten

Verschachtelung aufheben

Modellqualität

Übungen

Listenspalten

Listenspalten erzeugen

… mit Verschachtelung

… von vektorisierten Funktionen

… von mehrwertigen Zusammenfassungsfunktionen

… aus einer benannten Liste

Übungen

Listenspalten vereinfachen

Liste zu Vektor

Verschachtelung aufheben

Übungen

Daten bereinigen mit broom

TEIL V. Kommunizieren

KAPITEL 21. R Markdown. Einführung

Voraussetzungen

R-Markdown-Grundlagen

Übungen

Textformatierung mit Markdown

Übungen

Codebereiche

Bereichsname

Bereichsoptionen

Tabellen

Zwischenspeichern

Globale Optionen

Inline-Code

Übungen

Fehlerbehebung

YAML-Header

Parameter

Bibliografien und Zitate

Mehr lernen

KAPITEL 22. Grafik für Kommunikation mit ggplot2. Einführung

Voraussetzungen

Beschriftungen

Übungen

Anmerkungen

Übungen

Skalen

Achsenteilungen und Legendenschlüssel

Legendenlayout

Eine Skala ersetzen

Übungen

Zoomen

Themen

Diagramme speichern

Größe der Abbildungen

Andere wichtige Optionen

Mehr lernen

KAPITEL 23. R-Markdown-Formate. Einführung

Ausgabeoptionen

Dokumente

Notebooks

Präsentationen

Dashboards

Interaktivität

htmlwidgets

Shiny

Websites

Andere Formate

Mehr lernen

KAPITEL 24. R-Markdown-Workflow

Index. Symbole

A

B

C

D

E

F

G

H

I

J

K

L

M

N

O

P

Q

R

S

T

U

V

W

X

Y

Z

Über die Autoren

Kolophon

Fußnoten. Vorwort

Kapitel 11: Strings mit stringr

Kapitel 18: Grundlagen der Modellierung mit modelr

Kapitel 19: Modelle erstellen

Kapitel 21: R Markdown

Отрывок из книги

Daten importieren, bereinigen, umformen, modellieren und visualisieren

Hadley Wickham und Garrett Grolemund

.....

delays <- flights %>%

group_by(dest) %>%

.....

Добавление нового отзыва

Комментарий Поле, отмеченное звёздочкой  — обязательно к заполнению

Отзывы и комментарии читателей

Нет рецензий. Будьте первым, кто напишет рецензию на книгу R für Data Science
Подняться наверх