Частотный анализ числовых и текстовых данных. Учебное пособие
Реклама. ООО «ЛитРес», ИНН: 7719571260.
Оглавление
Валентин Юльевич Арьков. Частотный анализ числовых и текстовых данных. Учебное пособие
Предисловие
Введение
1. Начало работы
1.1. Результаты и защита
1.2. Работа и отчет
1.3. Создание блокнота
2. Анализ числовых данных
2.1. Генерируем данные
2.2. Гистограмма
2.3. Распределение
2.4. Полигон
2.5. Кумулята
2. Анализ текстовых данных
2.1. Обработка текстов на естественном языке
2.2. Облако слов (тегов)
2.3. Маска
2.4. Облако фраз
2.5. Словарь весов (частот)
2.6. Расшифровка видео Youtube
2.6.1. Страница видеоролика
2.6.2. Субтитры DownSub
2.6.3. Студия Youtube
2.7. Предварительный анализ текста
2.8. Облако слов
2.9. Лемматизация
2.10. Стоп-слова
2.11. Персонализация стоп-слов
2.12. Гистограмма
2.13. Частотный анализ текста книги
Благодарность
Ссылки
Литература
Послесловие
Отрывок из книги
Данная работа посвящена применению современных методов и технологий больших данных в курсе бизнес-аналитике и статистики. Анализ частоты появления различных значений – один из способов первоначальной обработки данных. Чаще всего его относят к описательной статистике (Descriptive Statistics). В последнее время также говорят об описательной аналитике (Descriptive Analytics). Подсчет частот имеет отношение распределению. Поэтому его восприятия материала желательно обладать пониманием основ теории вероятностей и математической статистики.
В данной работе мы рассмотрим примеры и приемы частотного анализа числовых и текстовых данных средствами Python.
.....
Настроим размеры изображения с помощью функции plt.figure (figsize= (12, 6)). Параметр figsize получает значения ширины и высоты изображения в дюймах.
Передадим дополнительные параметры функции plt. hist:
.....