Читать книгу Praktische Statistik für Data Scientists - Peter Bruce - Страница 61

Zusammenfassung

Оглавление

Die von John Tukey begründete explorative Datenanalyse (EDA) schuf den Grundstein für unser heutiges Verständnis der Data Science. Der Kerngedanke der EDA ist, dass der erste und wichtigste Schritt in jedem Projekt, bei dem mit Daten gearbeitet wird, darin liegt, sich die Daten anzusehen. Durch die Zusammenfassung und Visualisierung der Daten können Sie wertvolle Erkenntnisse für das Projekt gewinnen.

In diesem Kapitel wurden mehrere Konzepte vorgestellt, die von einfachen statistischen Maßzahlen, z.B. Lage- und Streuungsmaßen, bis hin zu aussagekräftigen visuellen Darstellungen reichen, die die Beziehungen zwischen mehreren Variablen, wie in Abbildung 1-12, untersuchen. Die vielfältigen Werkzeuge und Verfahren, die von der Open-Source-Gemeinschaft entwickelt wurden (und werden), haben in Verbindung mit der Ausdruckskraft der Programmiersprachen R und Python eine Fülle von Möglichkeiten zur Exploration und zur Analyse von Daten geschaffen. Die explorative Datenanalyse sollte ein Grundpfeiler jedes datenwissenschaftlichen Projekts sein.

Praktische Statistik für Data Scientists

Подняться наверх