Читать книгу R für Data Science - Hadley Wickham - Страница 25

TEIL I Erkunden

Оглавление

Ziel des ersten Teils dieses Buchs ist es, mit den grundlegenden Tools der explorativen Datenanalyse möglichst schnell auf Touren zu kommen. Das Wesen der explorativen Datenanalyse besteht darin, Daten zu begutachten, schnelle Hypothesen zu generieren, diese ad hoc zu testen und diese Schritte immerfort zu wiederholen. Ziel der explorativen Datenanalyse ist es, viele aussichtsreiche Annahmen zu generieren, die man später in größerer Tiefe untersuchen kann.


In diesem Teil des Buchs lernen Sie einige nützliche Tools kennen, die sich unmittelbar bezahlt machen:

 Visualisierung ist ein hervorragender Ausgangspunkt in Bezug auf die R-Programmierung, weil der Nutzen klar auf der Hand liegt: Es lassen sich ansprechende und informative Diagramme erstellen, die beim Verständnis der Daten hilfreich sind. In Kapitel 1 steigen Sie ein in die Visualisierung. Dabei lernen Sie die grundlegende Struktur eines ggplot2-Diagramms und leistungsfähige Techniken kennen, um Daten in Diagramme zu überführen.

 Da Visualisierung allein in der Regel nicht genügt, macht Sie Kapitel 3 vertraut mit den Schlüsselbegriffen, mit denen Sie wichtige Variablen auswählen, Schlüsselbeobachtungen ausfiltern, neue Variablen erzeugen und Zusammenfassungen berechnen können.

 Schließlich kombinieren Sie in Kapitel 5 die Visualisierung und Transformation mit Ihrer Neugier und Skepsis, um interessante Fragen über Daten zu stellen und zu beantworten.

Modellierung ist ein wichtiger Teil des Sondierungsprozesses, doch Sie besitzen noch nicht die Fähigkeiten, um sie effektiv zu lernen oder anzuwenden. Wir kommen darauf in Teil IV zurück, nachdem Sie mit mehr Tools zur Datenaufbereitung und Programmierung ausgestattet sind.

In diese drei Kapitel, die Ihnen die Tools der Datenanalyse näherbringen, sind drei Kapitel eingeschachtelt, die sich auf Ihren R-Workflow konzentrieren. In den Kapiteln 2, 4 und 6 lernen Sie bewährte Praktiken kennen, um R-Code zu schreiben und zu organisieren. Damit werden Sie auf lange Sicht erfolgreich bleiben, weil Sie die Tools an die Hand bekommen, um organisiert zu bleiben, wenn Sie reale Projekte angehen müssen.

R für Data Science

Подняться наверх