Читать книгу Укрощение больших данных. Как извлекать знания из массивов информации с помощью глубокой аналитики - Билл Фрэнкс - Страница 20
Часть I
Появление больших данных
Глава 1
Что такое «большие данные» и каково их значение?
Обзор главы
ОглавлениеСамые важные уроки этой главы.
• Большие данные часто определяются как данные, сбор, управление и обработку которых невозможно произвести с помощью наиболее часто используемых аппаратных сред и программных инструментов в течение допустимого для пользователя времени.
• Данные можно считать «большими» не только с точки зрения объема, но и с точки зрения разнообразия, скорости передачи и сложности.
• Мощь больших данных заключается не в том, что они «большие», или в том, что они «данные», а в их анализе и действиях, которые вы предпринимаете на основе его результатов.
• Большие данные часто автоматически генерируются машиной, обычно в недружественном пользователю формате. Обычно сначала собирают все, что возможно, а потом производится попытка определить, что имеет значение.
• Большие данные – это просто очередная волна новых данных, расширяющих существующие пределы. С точки зрения анализа они не отличаются от прошлых источников данных, которые тоже было сложно обрабатывать, когда они только появились.
• Большие данные изменят некоторые тактики и аналитические инструменты, которые используют профессионалы, но они коренным образом не изменят причин проведения анализа или того, как определяется ценность аналитики.
• Многие источники больших данных полуструктурированы. Хотя полуструктурированные потоки данных могут показаться не очень привлекательными, в них присутствует определенная логика. Большие данные могут быть неструктурированными, а также структурированными, как традиционные источники данных.
• Самые большие риски, касающиеся больших данных, связаны с конфиденциальностью. По мере развития сферы больших данных потребуется введение как самостоятельного, так и правового регулирования.
• Укрощение больших данных заключается не в том, чтобы контролировать все данные. Это больше напоминает попытку попить воды из шланга. Нужно отобрать только важные фрагменты.
• Самое интересное заключается в том, чем именно большие данные в сочетании с другими данными могут помочь бизнесу.
• Большие данные и традиционные данные – части общей стратегии работы с данными. Не разрабатывайте отдельную стратегию для работы с большими данными.
• Сфера больших данных будет продолжать развиваться. То, что мы считаем устрашающим сегодня, через десять лет не будет нас волновать, однако мы заинтересуемся новыми источниками данных.