Читать книгу Smart Data statt Big Data - Schmidt Jutta, Jutta Schmidt - Страница 5
Einführung
Was hat es denn mit Big Data auf sich?
ОглавлениеHöchstwahrscheinlich sind Sie öfter über Big Data als über Data Science gestolpert. Handelt dieses Buch von Big Data?
Das hängt davon ab, wie Sie Big Data definieren. Wenn Sie unter Big Data das Berechnen einfacher, zusammenfassender Statistiken anhand unstrukturierter Daten verstehen, die in riesigen, horizontal skalierbaren Datenbanken liegen, die nichts mit SQL zu tun haben, dann hat dieses Buch nichts mit Big Data zu tun.
Wenn Sie Big Data aber als Umwandlung geschäftlicher Daten in Entscheidungen und Erkenntnisse definieren, wobei für diese Umwandlung (ohne Rücksicht darauf, wo die Daten gespeichert sind) innovative Analysemethoden verwendet werden, dann handelt dieses Buch auch von Big Data.
Dieses Buch beschäftigt sich nicht mit Datenbanktechnologien wie MongoDB oder HBase. Dieses Buch behandelt auch keine Projekte zur Data-Science-Kodierung wie Mahout, NumPy, die verschiedenen R-Bibliotheken und so weiter. Um diese Themen kümmern sich andere Bücher.
Und das ist auch gut so. Dieses Buch ignoriert die Werkzeuge, die Speicherung und den Code. Stattdessen konzentriert es sich so weit wie möglich auf die Techniken. Dort draußen gibt es viele Menschen, die glauben, dass Big Data nichts als Datenspeicherung und Datenabfrage ist, wobei die Daten ein wenig bereinigt und zusammengefasst werden.
Sie irren. Dieses Buch bringt Sie auf eine Ebene, die über dem liegt, was Sie von den Verkäufern von Big-Data-Software und von Bloggern zu hören bekommen, und es zeigt Ihnen, was Sie wirklich aus Ihren Daten herausholen können. Und das Beste daran ist, dass der Umfang Ihrer Daten für die meisten dieser Techniken keine Rolle spielt. Sie müssen nicht erst über ein Petabyte an Daten verfügen und die entsprechenden Kosten bewältigen, bevor Sie sich mit den Interessen Ihrer Kunden auseinandersetzen dürfen. Wenn Sie einen großen Datenbestand haben, ist das prima, aber genauso gibt es Unternehmen, die so etwas nicht aufweisen, nicht benötigen und niemals haben werden. Wie das zum Beispiel bei meinem Metzger der Fall ist. Das bedeutet aber noch lange nicht, dass sein E-Mail-Marketing nicht von einem Würstchen-im-Vergleich-mit-Schinken-Cluster profitieren könnte.
Wenn Bücher über Data Science Trainingsunterlagen wären, hätten Sie es nur mit Lockerungsübungen zu tun – keine Gewichte, nichts Ergometrisches. Wenn ein Buch aber weiter geht und Sie verstanden haben, wie Sie die Techniken nur mit einem Grundstock an Werkzeugen implementieren können, sind Sie auch in der Lage, diese Implementierungen in einer Vielzahl von Technologien vorzunehmen, auf ihnen problemlos etwas aufzubauen, bei Beratern die richtigen Data-Science-Produkte zu erwerben, Ihren Entwicklern die richtige Vorgehensweise an die Hand zu geben und so weiter.