Технология хранения и обработки больших данных Hadoop

Технология хранения и обработки больших данных Hadoop
Автор книги: id книги: 2054035     Оценка: 0.0     Голосов: 0     Отзывы, комментарии: 0 490 руб.     (4,78$) Читать книгу Купить и скачать книгу Купить бумажную книгу Электронная книга Жанр: Компьютеры: прочее Правообладатель и/или издательство: ЛитРес: Самиздат Дата публикации, год издания: 2021 Дата добавления в каталог КнигаЛит: ISBN: 978-5-532-96881-3 Скачать фрагмент в формате   fb2   fb2.zip Возрастное ограничение: 12+ Оглавление Отрывок из книги

Реклама. ООО «ЛитРес», ИНН: 7719571260.

Описание книги

Apache Hadoop – это платформа для распределенной обработки больших наборов данных на кластерах компьютеров с использованием простых моделей программирования. В этой книге вы познакомитесь с общей архитектурой платформы, компонентами стека, такими как HDFS и MapReduce, приложениями Hadoop.

Оглавление

Тимур Машнин. Технология хранения и обработки больших данных Hadoop

Введение

Cloudera QuickStart VM

Компоненты стека Hadoop

HDFS

MapReduce

Apache Spark

Отрывок из книги

Для начала работы нам нужно скачать виртуальную машину Cloudera, позволяющую ознакомиться со стеком Cloudera Hadoop.

После скачивания и распаковки архива, запустим виртуальную машину.

.....

Чтобы проанализировать данные транзакций на платформе Cloudera, нам нужно ввести их в распределенную файловую систему Hadoop (HDFS).

И нам нужен инструмент, который легко переносит структурированные данные из реляционной базы данных в HDFS, сохраняя при этом структуру.

.....

Добавление нового отзыва

Комментарий Поле, отмеченное звёздочкой  — обязательно к заполнению

Отзывы и комментарии читателей

Нет рецензий. Будьте первым, кто напишет рецензию на книгу Технология хранения и обработки больших данных Hadoop
Подняться наверх