Читать книгу Глоссариум по искусственному интеллекту: 2500 терминов - Александр Николаевич Чашин, Инна Евгеньевна Скворцова, Александр Николаевич Афонин - Страница 4
Глоссариум по искусственному интеллекту
«Б»
ОглавлениеБаза данных (Database) – это упорядоченный набор структурированной информации или данных, которые обычно хранятся в электронном виде в компьютерной системе. База данных обычно управляется системой управления базами данных (СУБД). Данные вместе с СУБД, а также приложения, которые с ними связаны, называются системой баз данных, или, для краткости, просто базой данных.
База Данных ImageNet (ImageNet) – это большая визуальная база данных, предназначенная для использования в исследованиях программного обеспечения для распознавания визуальных объектов. Более 14 миллионов изображений были вручную аннотированы в рамках проекта, чтобы указать, какие объекты изображены, и, по крайней мере, в одном миллионе изображений также предусмотрены ограничивающие рамки. ImageNet содержит более 20 000 категорий, среди которых типичная категория, такая как «воздушный шар» или «клубника», состоит из нескольких сотен изображений. База данных аннотаций URL-адресов сторонних изображений находится в свободном доступе непосредственно из ImageNet, хотя фактические изображения не принадлежат ImageNet. С 2010 года в рамках проекта ImageNet проводится ежегодный конкурс программного обеспечения ImageNet Large Scale Visual Recognition Challenge (ILSVRC), в котором программы соревнуются за правильную классификацию и обнаружение объектов и сцен. В задаче используется «усеченный» список из тысячи неперекрывающихся классов. [17]
База данных MNIST (MNIST) – это база данных образцов рукописного написания цифр от 0 до 9, содержит 60 000 образцов наборов данных для обучения и тестовый набор из 10 000 образцов. Цифры были нормализованы по размеру и расположены в центре изображения фиксированного размера. Каждое изображение хранится в виде массива целых чисел 28x28, где каждое целое число представляет собой значение в оттенках серого от 0 до 255 включительно. MNIST – это канонический набор данных для машинного обучения, часто используемый для тестирования новых подходов к машинному обучению. Это часть большой базы данных рукописных форм и символов, опубликованной Национальным институтом стандартов и технологий США (NIST).
Базовый уровень (Baseline) – это модель, используемая в качестве контрольной точки для сравнения того, насколько хорошо работает другая модель (как правило, более сложная). Например, модель логистической регрессии может служить базовым уровнем для глубокой модели. Для конкретной проблемы базовый уровень помогает разработчикам моделей количественно определить минимальную ожидаемую производительность, которую новая модель должна обеспечить, чтобы быть полезной.
Байесовская оптимизация (Bayesian optimization) – это метод вероятностной регрессионной модели для оптимизации ресурсоемких целевых функций путем оптимизации суррогата с помощью байесовского метода обучения. Поскольку байесовская оптимизация сама по себе очень дорогая, ее обычно используют для оптимизации дорогостоящих задач с небольшим количеством параметров, таких как выбор гиперпараметров.
Байесовская сеть (или Байесова сеть, Байесовская сеть доверия) (Bayesian Network) – это графическая вероятностная модель, представляющая собой множество переменных и их вероятностных зависимостей. Например, байесовская сеть может быть использована для вычисления вероятности того, чем болен пациент по наличию или отсутствию ряда симптомов, основываясь на данных о зависимости между симптомами и болезнями.
Байесовский классификатор в машинном обучении (Bayesian classifier in machine learning) – это семейство простых вероятностных классификаторов, основанных на использовании теоремы Байеса и «наивном» предположении о независимости признаков классифицируемых объектов. Анализ на основе байесовской классификации активно изучался и использовался начиная с 1950-х годов в области классификации документов, где в качестве признаков использовались частоты слов. Алгоритм является масштабируемым по числу признаков, а по точности сопоставим с другими популярными методами, такими как машины опорных векторов. Как и любой классификатор, байесовский присваивает метки классов наблюдениям, представленным векторами признаков. При этом предполагается, что каждый признак независимо влияет на вероятность принадлежности наблюдения к классу. Например, объект можно считать яблоком, если он имеет округлую форму, красный цвет и диаметр около 10 см. Наивный байесовский классификатор «считает», что каждый из этих признаков независимо влияет на вероятность того, что этот объект является яблоком, независимо от любых возможных корреляций между характеристиками цвета, формы и размера. Простой байесовский классификатор строится на основе обучения с учителем. Несмотря на мало реалистичное предположение о независимости признаков, простые байесовские классификаторы хорошо зарекомендовали себя при решении многих практических задач. Дополнительным преимуществом метода является небольшое число примеров, необходимых для обучения [18].
Байесовское программирование (Bayesian programming) — это формы и методология для определения вероятностных моделей и решения проблем, когда доступно меньше необходимой информации.
Байт (Byte) – это восемь битов. Байт – это просто кусок из 8 единиц и нулей. Например: 01000001 – это байт. Компьютер часто работает с группами битов, а не с отдельными битами, и наименьшая группа битов, с которой обычно работает компьютер, – это байт. Байт равен одному столбцу в файле, записанном в символьном формате.
Башня (Tower) – это компонент глубокой нейронной сети, которая сама по себе является глубокой нейронной сетью без выходного слоя. Как правило, каждая башня считывает данные из независимого источника. Башни независимы до тех пор, пока их выходные данные не будут объединены в последнем слое.
Безопасность критической информационной инфраструктуры (Security of a critical information infrastructure) – это состояние защищенности критической информационной инфраструктуры, обеспечивающее ее устойчивое функционирование при проведении в отношении ее компьютерных атак.
Безопасность приложений (Application security) – это процесс повышения безопасности приложений путем поиска, исправления и повышения безопасности приложений. Многое из этого происходит на этапе разработки, но включает инструменты и методы для защиты приложений после их развертывания. Это становится все более важным, поскольку хакеры все чаще атакуют приложения.
Бенчмарк (Benchmark) (также benchmark program, benchmarking program, benchmark test) – это тестовая программа или пакет для оценки (измерения и/или сравнения) различных аспектов производительности процессора, отдельных устройств, компьютера, системы или конкретного приложения, программного обеспечения; эталон, который позволяет сравнивать продукты разных производителей друг с другом или с некоторым стандартом. Например, онлайн-бенчмарк – онлайн-бенчмарк; стандартный бенчмарк – стандартный бенчмарк; сравнение времени бенчмарка – сравнение времени выполнения бенчмарка
Бенчмаркинг (Benchmarking) – это набор методик, которые позволяют изучить опыт конкурентов и внедрить лучшие практики в своей компании
Беспроводная сеть (Wireless network) – это компьютерная сеть, в которой используются беспроводные соединения для передачи данных между сетевыми узлами. Беспроводная сеть – это метод, с помощью которого дома, телекоммуникационные сети и бизнес-установки избегают дорогостоящего процесса ввода кабелей в здание или в качестве соединения между различными местоположениями оборудования. Административные телекоммуникационные сети обычно реализуются и администрируются с использованием радиосвязи. Эта реализация происходит на физическом уровне (слое) сетевой структуры модели OSI.
Беспроводная широкополосная связь (WiBB Wireless broadband) – это телекоммуникационная технология, которая обеспечивает высокоскоростной беспроводной доступ в Интернет или доступ к компьютерным сетям на большой территории. Этот термин включает как фиксированную, так и мобильную широкополосную связь.
БЕТА версия (BETA) – это термин, который относится к этапу разработки онлайн-сервиса, на котором сервис объединяется с точки зрения функциональности, но требуется подлинный пользовательский опыт, прежде чем сервис можно будет завершить ориентированным на пользователя способом. При разработке онлайн-сервиса цель бета-фазы состоит в том, чтобы распознать как проблемы программирования, так и процедуры, повышающие удобство использования. Бета-фаза особенно часто используется в связи с онлайн-сервисами и может быть либо бесплатной (открытая бета-версия), либо ограниченной для определенной целевой группы (закрытая бета-версия).
Библеоклазмы – это люди паразиты, в силу своей ограниченности воспитания и мировоззрения, образования, а особенно менталитета, не способные создавать и созидать, которые стремятся уничтожить все то, что создано не ими, что задевает их самолюбие, а именно книги и результаты интеллектуальной деятельности других людей.
Библиотека Keras (Keras) – это библиотека Python, используемая для глубокого обучения и создания искусственных нейронных сетей. Выпущенный в 2015 году, Keras предназначен для быстрого экспериментирования с глубокими нейронными сетями. Keras предлагает несколько инструментов, которые упрощают работу с изображениями и текстовыми данными. Помимо стандартных нейронных сетей, Keras также поддерживает сверточные и рекуррентные нейронные сети. В качестве бэкэнда Keras обычно использует TensorFlow, Microsoft Cognitive toolkit или Theano. Он удобен для пользователя и требует минимального кода для выполнения функций и команд. Keras имеет модульную структуру и имеет несколько методов предварительной обработки данных. Keras также предлагает методы evluate () и predict_classes () для тестирования и оценки моделей. Github и Slack организуют форумы сообщества для Keras.
Библиотека Matplotlib (Matplotlib) – это комплексная, популярная библиотека Python с открытым исходным кодом для создания визуализаций «качества публикации». Визуализации могут быть статическими, анимированными или интерактивными. Он был эмулирован из MATLAB и, таким образом, содержит глобальные стили, очень похожие на MATLAB, включая иерархию объектов.
Библиотека Numpy (Numpy) – это библиотека Python, представленная в 2006 году для поддержки многомерных массивов и матриц. Библиотека также позволяет программистам выполнять высокоуровневые математические вычисления с массивами и матрицами. Можно сказать, что это объединение своих предшественников – The Numeric и Numarray. NumPy является неотъемлемой частью Python и по существу предоставляет программе математические функции типа MATLAB. По сравнению с обычными списками Python, он занимает меньше памяти, удобен в использовании и имеет более быструю обработку. При интеграции с другими библиотеками, такими как SciPy и / или Matplotlib, его можно эффективно использовать для целей анализа данных и анализа данных [19].
Библиотека Pytorch & Torch (Pytorch & Torch) – это библиотека машинного обучения, которая в основном используется для приложений обработки естественного языка и компьютерного зрения. Разработанная исследовательской лабораторией искусственного интеллекта и выпущенная в сентябре 2016 года, это библиотека с открытым исходным кодом, основанная на библиотеке Torch для научных вычислений и машинного обучения. PyTorch предоставляет операции с объектом n-мерного массива, аналогичные NumPy, однако, кроме того, он предлагает более быстрые вычисления за счет интеграции с графическим процессором. PyTorch автоматически различает построение и обучение нейронных сетей. PyTorch – это внесла свой вклад в разработку нескольких программ глубокого обучения – Tesla Autopilot, Uber’s Pyro, PyTorch Lighten и т. д.
Библиотека Scikit-learn (Scikit-learn) – это простая в освоении библиотека Python с открытым исходным кодом для машинного обучения, построенная на NumPy, SciPy и matplotlib. Его можно использовать для классификации данных, регрессии, кластеризации, уменьшения размерности, выбора модели и предварительной обработки.
Библиотека SciPy (SciPy) – это библиотека Python с открытым исходным кодом для выполнения научных и технических вычислений на Python. Она была разработана открытым сообществом разработчиков, которое также поддерживает его поддержку и спонсирует разработки. SciPy предлагает несколько пакетов алгоритмов и функций, которые поддерживают научные вычисления: константы, кластер, fft, fftpack, интегрировать и т. д. SciPy по сути является частью стека NumPy и использует многомерные массивы в качестве структур данных, предоставляемых модулем NumPy. Первоначально выпущенный в 2001 году, она распространялась по лицензии BSD с репозиторием на GitHub.
Библиотека Seaborn (Seaborn) – это библиотека визуализации данных Python для построения «привлекательных и информативных» статистических графиков. Seaborn основан на Matplotlib. Он включает в себя множество визуализаций на выбор, включая временные ряды и совместные графики.
Библиотека Theano (Theano) – это библиотека Python, используемая для компиляции, определения, оптимизации и оценки математических выражений, содержащих многомерные массивы. Она была разработана Монреальским институтом алгоритмов обучения (MILA) при Монреальском университете и выпущена в 2007 году. Это библиотека с открытым исходным кодом под лицензией BSD. Библиотека построена поверх NumPy и имеет аналогичный интерфейс. Наряду с процессором он позволяет использовать графический процессор для ускорения вычислений. Theano вносит значительный вклад в крупномасштабные научные вычисления и связанные с ними исследования и поддерживается специальной группой из 13 разработчиков.
Биграмм (Bigram) – N-грамм, в которой N=2.
Бинарное дерево (Binary tree) – это иерархическая структура данных, в которой каждый узел имеет значение (оно же является в данном случае и ключом) и ссылки на левого и правого потомка. Как правило, первый называется родительским узлом, а дети называются левым и правым наследниками. Двоичное дерево не является упорядоченным ориентированным деревом.
Биннинг (машинное зрение) (Binning) – это процесс объединения заряда от соседних пикселей в CCD матрице во время считывания. Этот процесс выполняется до оцифровки в микросхеме ПЗС (Прибор с обратной Зарядной Связью – CCD матрица) с помощью специализированного управления последовательным и параллельным регистрами. Двумя основными преимуществами биннинга являются улучшенное отношение сигнал / шум (SNR) и возможность увеличивать частоту кадров, хотя и за счет уменьшения пиксельного разрешения.
Биоконсерватизм (Bioconservatism) – это позиция нерешительности и скептицизма в отношении радикальных технологических достижений, особенно тех, которые направлены на изменение или улучшение условий жизни человека. Биоконсерватизм характеризуется верой в то, что технологические тенденции в современном обществе рискуют поставить под угрозу человеческое достоинство, а также противодействием движениям и технологиям, включая трансгуманизм, генетическую модификацию человека, «сильный» искусственный интеллект и технологическую сингулярность. Многие биоконсерваторы также выступают против использования таких технологий, как продление жизни и преимплантационный генетический скрининг.
Биометрия (Biometrics) – это система распознавания людей. по одному или более физическим или поведенческим чертам.
Блок IFU (Instruction Fetch Unit IFU) – это блок предвыборки команд, который выстраивает в единую очередь команды, считываемые из внутренней или внешней памяти системы по шине EIB в соответствии с адресом, выставляемым по шине IAB.
Блок обработки изображений (Vision Processing Unit VPU) – это новый класс специализированных микропроцессоров, являющихся разновидностью ИИ -ускорителей, предназначенных для аппаратного ускорения работы алгоритмов машинного зрения.
Блокчейн (Blockchain) – это алгоритмы и протоколы децентрализованного хранения и обработки транзакций, структурированных в виде последовательности связанных блоков без возможности их последующего изменения.
Большая языковая модель (Large language model) – это неофициальный термин, который обычно означает языковую модель с большим количеством параметров. Некоторые большие языковые модели содержат более 100 миллиардов параметров.
Большие данные (Big data) – это термин для наборов цифровых данных, большой размер, скорость увеличения или сложность которых требует значительных вычислительных мощностей для обработки и специальных программных инструментов анализа и представления в виде воспринимаемых человеком результатов.
Бритва Оккама (Occam’s razor) – это принцип принятия решения, сформулированный в XIV веке и франциским монахом Уильямом Оккаму, который. можно сформулировать так: «из двух конкурирующих теорий предпочтение следует отдавать более простому объяснению объекта». Этот принцип также выражается как «Сущности не должны умножаться сверх необходимости». Применительно к машинному обучению, в частности к теории обучения, интуитивную идею Бритвы Оккамы можно сформулировать так – Самое простое решение чаще всего является правильным!
Булевая нейронная сеть (невесомая нейронная сеть) (Boolean neural network) —это многослойная нейронная сеть, состоящая из модуля самоорганизующейся нейронной сети для извлечения признаков, за которым следует модуль нейронной сети и модуль классификации нейронной сети, который прошел самостоятельную подготовку.
Бустинг (Boosting) – это мета-алгоритм ансамбля машинного обучения, предназначенный в первую очередь для уменьшения предвзятости и дисперсии в обучении с учителем, а также семейство алгоритмов машинного обучения, которые превращают слабых учеников в сильных.
Буфер воспроизведения (Replay buffer) —это память, используемая для хранения даных в промежутке между использованием или воспроизведением.
Быстрое кодирование (One-Hot Encoding) – это процесс, с помощью которого категориальные переменные преобразуются в подходящую алгоритмам Машинного обучения (ML) форму. Большая часть предварительной обработки данных -это кодирование в понятный компьютеру язык чисел. Отсюда и название ’encode’, что буквально означает «преобразовать в компьютерный код». Существует множество различных способов кодирования, таких как Ярлычное (Label Encoding) или Быстрое кодирование. [20]
Быстрые и экономичные деревья (Fast-and-frugal trees) – это тип дерева классификации. FFTS можно использовать в качестве инструментов принятия решений, которые действуют как лексикографические классификаторы и, при необходимости, связывают действие (решение) с каждым классом или категорией.
Бытовой искусственный интеллект (Consumer artificial intelligence) – это специализированные программы искусственного интеллекта, внедрённые в бытовые устройства и процессы.
17
База Данных ImageNet [Электронный ресурс] www.wikiwand.com/en URL: https://www.wikiwand.com/en/IEEE_Computational_Intelligence_Society (дата обращения: 07.07.2022)
18
Байесовский классификатор в машинном обучении [Электронный ресурс] //wiki.loginom.ru URL: https://wiki.loginom.ru/articles/bayesian_classifier.html (дата обращения: 07.07.2022)
19
Библиотека Numpy [Электронный ресурс] //datawider.com URL: https://datawider.com/top-10-python-libraries/#_ftn1 (дата обращения: 07.07.2022)
20
Быстрое кодирование [Электронный ресурс] www.helenkapatsa.ru URL: https://www.helenkapatsa.ru/bystroie-kodirovaniie/ (дата обращения: 07.07.2022)