Читать книгу R für Data Science - Hadley Wickham - Страница 51

dplyr-Grundlagen

Оглавление

In diesem Kapitel lernen Sie fünf Schlüsselfunktionen von dplyr kennen, mit denen Sie die große Mehrheit Ihrer Datenverarbeitungsaufgaben erledigen können:

 Beobachtungen nach ihren Werten herausgreifen (filter()).

 Zeilen neu anordnen (arrange()).

 Variablen nach ihren Namen auswählen (select()).

 Neue Variablen mit Funktionen von vorhandenen Variablen erzeugen (mutate()).

 Viele Werte zu einer einzigen Kurzdarstellung zusammenfassen (summarize()).

Alle diese Funktionen lassen sich in Verbindung mit group_by() verwenden, was den Gültigkeitsbereich jeder Funktion ändert: Anstatt auf dem gesamten Datenset zu operieren, arbeiten die Funktionen dann auf Gruppenebene. Diese insgesamt sechs Funktionen liefern die Verben für eine Sprache zur Datenmanipulation.

Alle Verben arbeiten ähnlich:

1 Das erste Argument ist ein Dataframe.

2 Die darauffolgenden Argumente beschreiben, was mit dem Dataframe zu tun ist, ausgedrückt durch Variablennamen (ohne Anführungszeichen).

3 Das Ergebnis ist ein neuer Dataframe.

Gemeinsam erleichtern es diese Eigenschaften, mehrere einfache Schritte zu verketten, um ein komplexes Ergebnis zu erzielen. Tauchen wir ein und sehen wir uns an, wie diese Verben arbeiten.

R für Data Science

Подняться наверх