Читать книгу Глоссариум по искусственному интеллекту: 2500 терминов - Александр Николаевич Чашин, Инна Евгеньевна Скворцова, Александр Николаевич Афонин - Страница 5
Глоссариум по искусственному интеллекту
«В»
ОглавлениеВалидационные данные (Holdout data) или «выделенные, удержанные» данные, являющиеся частью Датасета (Dataset), предназначенного для тестирования, проверки работоспособности машинного обучения. Тестовые данные относятся к части предварительно размеченных данных, которые хранятся вне наборов данных, используемых для обучения и проверки контролируемых моделей машинного обучения. Их также можно назвать эталонными данными. Первым шагом в обучении с учителем является тестирование различных моделей на тестовых данных и оценка моделей на предмет прогнозируемой производительности. После того, как модель проверена и настроена с помощью набора проверочных данных, она тестируется с набором данных, чтобы выполнить окончательную оценку ее точности, чувствительности, специфичности и согласованности при прогнозировании правильных результатов.
Вариативность данных (Data variability) этот термин описывает, насколько далеко точки данных расположены друг от друга и от центра распределения. Наряду с мерами центральной тенденции меры изменчивости дают вам описательную статистику, которая обобщает ваши данные.
Вариационные ряды (Variation series) – это ряды абсолютных и относительных чисел, которые характеризуют распределение единиц совокупности по качественному (атрибутивному) или количественному признаку. Ряды распределения, построенные по количественному признаку, называются вариационными.
Ввод данных (Data entry) – это процесс преобразования устных или письменных ответов в электронную форму.
Векторный процессор или массивный процессор (Vector processor or array processor) – это центральный процессор (ЦП), который реализует набор инструкций, где его инструкции предназначены для эффективной и действенной работы с большими одномерными массивами данных, называемыми векторами. Это отличается от скалярных процессоров, чьи инструкции работают только с отдельными элементами данных, и от некоторых из тех же скалярных процессоров, имеющих дополнительные арифметические блоки с одной инструкцией, несколькими данными (SIMD) или SWAR. Векторные процессоры могут значительно повысить производительность при определенных рабочих нагрузках, особенно при численном моделировании и подобных задачах. Методы векторной обработки также работают в оборудовании игровых приставок и графических ускорителях.
Вероятностное программирование (Probabilistic programming) – это парадигма программирования, в которой задаются вероятностные модели, а вывод для этих моделей выполняется автоматически. Он представляет собой попытку объединить вероятностное моделирование и традиционное программирование общего назначения, чтобы упростить первое и сделать его более широко применимым. Его можно использовать для создания систем, помогающих принимать решения в условиях неопределенности. Языки программирования, используемые для вероятностного программирования, называются «вероятностными языками программирования» (PPL).
Вес (Weight) в обзорных исследованиях – это число, связанное со случаем или единицей анализа; вес используется как мера относительного вклада переменных этого случая при оценке всей совокупности. При использовании вероятностной выборки часто существует вероятность того, что некоторые элементы генеральной совокупности будут недостаточно или чрезмерно представлены в выборке. Чтобы обеспечить более точные оценки всей совокупности, каждому случаю присваиваются «веса», которые используются для корректировки общих результатов, чтобы они более точно соответствовали общей совокупности.
Взрыв интеллекта (Intelligence explosion) – это термин, придуманный для описания конечных результатов работы над общим искусственным интеллектом, который предполагает, что эта работа приведет к сингулярности в искусственном интеллекте, где «искусственный сверхинтеллект» превзойдет возможности человеческого познания. В интеллектуальном взрыве подразумевается, что самовоспроизводящиеся аспекты искусственного интеллекта каким-то образом возьмут на себя принятие решений людьми. В 1965 году И. Дж. Гуд впервые описал понятие «взрыв интеллекта» применительно к искусственному интеллекту (ИИ): пусть сверхразумная машина будет определена как машина, которая может намного превзойти все интеллектуальные действия любого человека, каким бы умным он ни был. Поскольку проектирование машин является одним из таких видов интеллектуальной деятельности, сверхразумная машина могла бы создавать еще более совершенные машины; тогда, несомненно, произошел бы «взрыв интеллекта», и разум человека остался бы далеко позади. Таким образом, первая сверхразумная машина – это последнее изобретение, которое когда-либо понадобится человеку, при условии, что машина достаточно послушна, чтобы подсказать нам, как держать ее под контролем. Спустя десятилетия в сообществе ИИ утвердилась концепция «взрыва интеллекта», что приведет к внезапному росту «сверхразума» и случайному концу человечества. Известные бизнес-лидеры считают это серьезным риском, большим, чем ядерная война или изменение климата.
Видео аналитика (Video analytics) – это технология, использующая методы компьютерного зрения для автоматизированного использования различных данных, на основании анализа отслеживающих изображений, поступающих с видеокамер в режиме реального времени или из архивных записей.
Виртуализация (Virtualization) – это предоставление набора вычислительных ресурсов или их логическое объединение, абстрагированное от аппаратной реализации, и обеспечивающее при этом логическую изоляцию друг от друга вычислительных процессов, выполняемых на одном физическом ресурсе.
Виртуальная реальность (VR) (Virtual reality VR) – это смоделированный опыт, который может быть похож на реальный мир или полностью отличаться от него. Приложения виртуальной реальности включают развлечения (например, видеоигры), образование (например, медицинскую или военную подготовку) и бизнес (например, виртуальные встречи). Другие различные типы технологий в стиле VR включают дополненную реальность и смешанную реальность, иногда называемую расширенной реальностью или XR. Также, под Виртуальной реальностью понимают искусственную среду, созданную с помощью программного обеспечения и представленную пользователю таким образом, что пользователь принимает ее как реальную среду. На компьютере виртуальная реальность в основном воспринимается двумя из пяти органов чувств: зрением и слухом. Простейшая форма виртуальной реальности – это трехмерное изображение, которое можно просматривать в интерактивном режиме на персональном компьютере, обычно манипулируя клавишами или мышью, чтобы содержимое изображения перемещалось в каком-либо направлении или увеличивалось или уменьшалось. Более изощренные усилия включают такие подходы, как круглые экраны, настоящие комнаты, дополненные носимыми компьютерами, и тактильные устройства, которые позволяют вам чувствовать отображаемые изображения. Виртуальную реальность можно разделить на: Моделирование реальной среды для обучения и воспитания. Разработка воображаемой среды для игры или интерактивной истории. Язык моделирования виртуальной реальности (VRML) позволяет создателю задавать изображения и правила их отображения и взаимодействия с помощью текстовых операторов языка.
Виртуальный помощник (Virtual assistant) – это программный агент, который может выполнять задачи для пользователя на основе информации, введенной пользователем.
Внутренняя мотивация (Intrinsic motivation) в изучении искусственного интеллекта – это мотивация к действию, при том, что информационное содержание, опыт, полученный в результате действия, является мотивирующим фактором. Информационное содержание в этом контексте измеряется в смысле теории информации как количественная оценка неопределенности. Типичной внутренней мотивацией является поиск необычных (удивительных) ситуаций, в отличие от типичной внешней мотивации, такой как поиск пищи. Искусственные агенты с внутренней мотивацией демонстрируют поведение, похожее на исследование и любопытство. Психологи считают, что внутренняя мотивация у людей – это стремление выполнять деятельность для внутреннего удовлетворения – просто для развлечения или вызова.
Внутригрупповая предвзятость (In-group bias) – это предвзятость, при которой люди склонны отдавать предпочтение людям, которые существуют в тех же группах, что и они. Эти группы могут быть сформированы по признаку пола, расы, этнической принадлежности или любимой спортивной команды. Если кто-то входит в нашу «внутреннюю группу», мы с большей вероятностью будем ему доверять. Проблема предвзятости ИИ – одна из самых острых в современном мире, и решения ей пока нет. Системы распознавания лиц плохо работают на лицах афроамериканцев, а ИИ для приема на работу предпочитает нанимать мужчин, нежели женщин [21].
Возврат (Return) – это сумма всех вознаграждений, которые агент ожидает получить при следовании политике от начала до конца эпизода. Агент учитывает отсроченный характер ожидаемых вознаграждений, дисконтируя вознаграждения в соответствии с переходами состояний, необходимыми для получения вознаграждения.
Вознаграждение (Reward) в обучении с подкреплением – это числовой результат выполнения действия в состоянии, определяемом окружающей средой.
Воплощённая когнитивная наука (Embodied cognitive science) – это междисциплинарная область исследований, целью которых является объяснение механизмов, лежащих в основе разумного поведения. Она включает в себя три основных методики: моделирование психологических и биологических систем, которая рассматривает разум и тело как единое целое; формирование основного набора общих принципов разумного поведения; экспериментальное использование роботов в контролируемых условиях.
Восприятие речи (Speech perception) – это процесс, посредством которого звуки языка слышатся, интерпретируются и понимаются. Изучение восприятия речи тесно связано с областями фонологии и фонетики в лингвистике и когнитивной психологии и восприятием в психологии. Исследования в области восприятия речи направлены на то, чтобы понять, как люди-слушатели распознают звуки речи и используют эту информацию для понимания разговорной речи. Исследования восприятия речи находят применение в создании компьютерных систем, способных распознавать речь, в улучшении распознавания речи для слушателей с нарушениями слуха и языка, а также в обучении иностранному языку.
Врата забвения (Forget gate) – это часть ячейки долговременно-кратковременной памяти, которая регулирует поток информации, проходящий через ячейку. Врата забвения поддерживают контекст, решая, какую информацию следует отбросить из ячейки.
Вращательная инвариантность (Rotational invariance) в задаче классификации изображений – это способность алгоритма успешно классифицировать изображения даже при изменении ориентации изображения. Например, алгоритм все еще может идентифицировать теннисную ракетку, направлена ли она вверх, вбок или вниз.
Временная сложность (Time complexity) – это вычислительная сложность, описывающая время, необходимое для выполнения алгоритма. Временная сложность обычно оценивается путем подсчета количества элементарных операций, выполняемых алгоритмом, при условии, что выполнение каждой элементарной операции занимает фиксированное количество времени. Таким образом, время и количество элементарных операций, выполняемых алгоритмом, различаются не более чем на постоянный множитель.
Временной ряд (Time Series) – это последовательность точек данных, записанных в определенное время и проиндексированных в соответствии с порядком их появления.
Временные данные (Temporal data) – это зафиксированные данные, показывающие состояние во времени.
Временные ряды (Time series) – это наблюдения за переменной, сделанные во времени. Многие экономические исследования, такие как Международная финансовая статистика МВФ, представляют собой файлы данных временных рядов. Своего рода временные ряды также могут быть построены на основе перекрестного исследования, если одни и те же вопросы задаются более одного раза в течение времени.
Вспомогательный интеллект (Assistive intelligence) – это системы на основе ИИ, которые помогают принимать решения или выполнять действия.
Встраивание (внедрение слов) (Embedding (Word Embedding)) – это один экземпляр некоторой математической структуры, содержащийся в другом экземпляре, например, группа, являющаяся подгруппой.
Встраивание пространства (Embedding space) – это D-мерное векторное пространство, в которое сопоставляются признаки из векторного пространства более высокой размерности. В идеале пространство вложения содержит структуру, дающую значимые математические результаты; например, в идеальном пространстве вложений сложение и вычитание вложений могут решать задачи аналогии слов. Скалярный продукт двух вложений является мерой их сходства.
Встраивание слов (Word embedding, Vector representation of words) – это термин (в обработке естественного языка – natural language processing), используемый для представления слов для анализа текста, обычно в форме вектора с действительным знаком, который кодирует значение слова таким образом, что слова, которые находятся ближе в векторном пространстве, становятся ближе по смыслу. Вложения слов можно получить с помощью набора методов языкового моделирования и изучения признаков, в которых слова или фразы из словаря сопоставляются с векторами действительных чисел.
Вторичный анализ (Secondary analysis) – это процесс пересмотра существующих данных для решения новых вопросов или использования ранее не использовавшихся методов.
Входной слой (Input layer) — это первый слой в нейронной сети, который принимает входящие сигналы и передает их на последующие уровни. [22]
Выбор действия (Action selection) – это процесс, включающий алгоритм, как разработанная интеллектуальная система будет реагировать на данную проблему. Обычно это область, изучаемая в психологии, робототехнике и искусственном интеллекте. Выбор действий является синонимом принятия решений и поведенческого выбора. Собранные данные исследуются и разбиваются для того, чтобы можно было адаптировать их к искусственным системам, таким как робототехника, видеоигры и программирование искусственного интеллекта.
Выбор переменных (Feature selection) – это выбор признаков, также известный как выбор переменных, выбор атрибутов или выбор подмножества переменных, представляет собой процесс выбора подмножества соответствующих признаков (переменных, предикторов) для использования в построении модели.
Выборка (Sampling) – это использование при анализе информации не всего объема данных, а только их части, которая отбирается по определенным правилам (выборка может быть случайной, стратифицированной, кластерной и квотной).
Выборка кандидатов (Candidate sampling) — это оптимизация времени обучения, при которой вероятность рассчитывается для всех положительных меток, но только для случайной выборки отрицательных меток. Например, если нам нужно определить, является ли входное изображение биглем или ищейкой, нам не нужно указывать вероятности для каждого примера, не связанного с собакой.
Выбросы (Outliers) – это точки данных, которые значительно отличаются от других, присутствующих в данном наборе данных. Наиболее распространенные причины выбросов в наборе данных: Ошибки ввода данных, Ошибка измерения, Ошибки эксперимента, Преднамеренные ошибки, Ошибки обработки данных, Ошибки выборки, Естественный выброс.
Вывод (Inference) в искусственном интеллекте и машинном обучении – это составление прогнозов путем применения обученной модели к немаркированным примерам.
Выделение признаков (Feature extraction) – это разновидность абстрагирования, процесс снижения размерности, в котором исходный набор исходных переменных сокращается до более управляемых групп признаков для дальнейшей обработки, оставаясь при этом достаточным набором для точного и полного описания исходного набора данных. Выделение признаков используется в машинном обучении, распознавании образов и при обработке изображений. Выделение признаков начинает с исходного набора данных, выводит вторичные значения (признаки), для которых предполагается, что они должны быть информативными и не должны быть избыточными, что способствует последующему процессу обучения машины и обобщению шагов, а в некоторых случаях ведёт и к лучшей человеческой интерпретацией данных.
Выполнение графа (Graph execution) – это среда программирования TensorFlow, в которой программа сначала строит граф, а затем выполняет весь или часть этого графа. Выполнение графа – это режим выполнения по умолчанию в TensorFlow 1.x.
Выполнимость (Satisfiability). В математической логике – это элементарные понятия семантики. Формула выполнима, если можно найти интерпретацию (модель), которая делает формулу истинной. Формула действительна, если все интерпретации делают ее истинной. Противоположностями этих понятий являются невыполнимость и недействительность, то есть формула невыполнима, если ни одна из интерпретаций не делает формулу истинной, и недействительна, если какая-либо такая интерпретация делает формулу ложной.
Выпрямленный линейный блок (Rectified Linear Unit) – это блок, использующий функцию выпрямителя в качестве функции активации.
Выпуклая оптимизация (Convex optimization) – это процесс использования математических методов, таких как градиентный спуск, для нахождения минимума выпуклой функции. Многие исследования в области машинного обучения были сосредоточены на формулировании различных задач выпуклой оптимизации и более эффективном решении этих проблем.
Выпуклая функция (Convex function) – это функция, в которой область над графиком функции представляет собой выпуклое множество. Прототип выпуклой функции имеет форму буквы U. Строго выпуклая функция имеет ровно одну точку локального минимума. Классические U-образные функции являются строго выпуклыми функциями. Однако некоторые выпуклые функции (например, прямые) не имеют U-образной формы. Многие распространенные функции потерь, являются выпуклыми функциями: L2 loss, Log Loss, L1 regularization, L2 regularization. Многие варианты градиентного спуска гарантированно находят точку, близкую к минимуму строго выпуклой функции. Точно так же многие варианты стохастического градиентного спуска имеют высокую вероятность (хотя и не гарантию) нахождения точки, близкой к минимуму строго выпуклой функции. Сумма двух выпуклых функций (например, L2 loss + L1 regularization) является выпуклой функцией. Глубокие модели никогда не бывают выпуклыми функциями. Примечательно, что алгоритмы, разработанные для выпуклой оптимизации, в любом случае имеют тенденцию находить достаточно хорошие решения в глубоких сетях, даже если эти решения не гарантируют глобальный минимум.
Выпуклое множество (Convex set) – это подмножество евклидова пространства, при этом, линия, проведенная между любыми двумя точками в подмножестве, остается полностью внутри подмножества.
Выходной слой (Output layer) – это последний слой нейронов в искусственной нейронной сети, который производит заданные выходные данные для программы.
Вычисление (Computation) – это любой тип арифметического или неарифметического вычисления, которое следует четко определенной модели (например, алгоритму).
Вычисления GPU (GPU computing) – это использование графического процессора в качестве сопроцессора для ускорения центральных процессоров для научных и инженерных вычислений общего назначения.
Графический процессор ускоряет приложения, работающие на ЦП, разгружая некоторые ресурсоемкие и трудоемкие части кода. Остальная часть приложения по-прежнему работает на процессоре. С точки зрения пользователя, приложение работает быстрее, потомучто оно использует вычислительную мощность графического процессора с массовым параллелизмом для повышения производительности. Это явление известно как «гетерогенные» или «гибридные» вычисления.
Вычислительная задача (Computational problem) – это одна из трех типов математических задач, решение которых необходимо получить численно. Вычислительная задача называется хорошо обусловленной, если малым погрешностям входных данных соответствуют малые погрешности решения и плохо обусловленной, если малым погрешностям входных данных могут соответствовать сильные изменения в решении.
Вычислительная кибернетика (Computational cybernetics) – это интеграция кибернетики и методов вычислительного интеллекта.
Вычислительная математика (Computational mathematics) – это раздел математики, включающий круг вопросов, связанных с производством разнообразных вычислений. В более узком понимании вычислительная математика – теория численных методов решения типовых математических задач. Современная вычислительная математика включает в круг своих проблем изучение особенностей вычисления с применением компьютеров.
Вычислительная математика обладает широким кругом прикладных применений для проведения научных и инженерных расчётов. На её основе в последнее десятилетие образовались такие новые области естественных наук, как вычислительная химия, вычислительная биология и так далее.
Вычислительная нейробиология (Computational neuroscience) – это междисциплинарная наука, целью которой является объяснение в терминах вычислительного процесса того, как биологические системы, составляющие нервную систему, продуцируют поведение. Она связывает нейробиологию, когнитивистику и психологию с электротехникой, информатикой, вычислительной техникой, математикой и физикой.
Вычислительная система (Computing system) – это предназначенные для решения задач и обработки данных (в том числе вычислений) программно-аппаратный комплекс или несколько взаимосвязанных комплексов, образующих единую инфраструктуру.
Вычислительная статистика (Computational statistics) – это применение принципов информатики и разработки программного обеспечения для решения научных задач. Она включает в себя использование вычислительного оборудования, сетей, алгоритмов, программирования, баз данных и других предметно-ориентированных знаний для разработки симуляций физических явлений для запуска на компьютерах. Вычислительная статистика пересекает дисциплины и может даже включать гуманитарные науки.
Вычислительная теория чисел, также известная как алгоритмическая теория чисел (Computational number theory) – это изучение вычислительных методов для исследования и решения проблем в теории чисел и арифметической геометрии, включая алгоритмы проверки простоты и численной факторизации, поиска решений диофантовых уравнений и явных методов в арифметической геометрии. Теория вычислительных чисел имеет приложения к криптографии, включая RSA, криптографию на эллиптических кривых и постквантовую криптографию, и используется для исследования гипотезы и открытой проблемы теории чисел, включая гипотезу Римана, гипотезу Берча и Суиннертона-Дайера, гипотезу ABC, гипотезу модульности, гипотезу Сато-Тейта и явные аспекты программы Ленглендса.
Вычислительная химия (Computational chemistry) – это раздел химии, в котором математические методы используются для расчёта молекулярных свойств, моделирования поведения молекул, планирования синтеза, поиска в базах данных и обработки комбинаторных библиотек.
Вычислительная эффективность агента или обученной модели (Computational efficiency of an agent or a trained model) – это количество вычислительных ресурсов, необходимых агенту для решения задачи на стадии инференса.
Вычислительная эффективность интеллектуальной системы (Computational efficiency of an intelligent system) – это количество вычислительных ресурсов, необходимых для обучения интеллектуальной системы с определенным уровнем производительности на том или ином объеме задач.
Вычислительные блоки (Computing Units) – это блоки, которые работают как фильтр, который преобразовывает пакеты по определенным правилам. Набор команд вычислителя может быть ограничен, что гарантирует простую внутреннюю структуру и достаточно большую скорость работы.
Вычислительные модули (Computing modules) – это подключаемые специализированные вычислители, предназначенные для решения узконаправленных задач, таких, как ускорение работы алгоритмов искусственных нейронных сетей, компьютерное зрение, распознавание по голосу, машинное обучение и другие методы искусственного интеллекта, построены на базе нейронного процессора – специализированного класса микропроцессоров и сопроцессоров (процессор, память, передача данных).
Вычислительный интеллект (Computational intelligence) – это ответвление искусственного интеллекта. Как альтернатива классическому искусственному интеллекту, основанному на строгом логическом выводе, он опирается на эвристические алгоритмы, используемые, например, в нечёткой логике, искусственных нейронных сетях и эволюционном моделировании.
Вычислительный интеллект (Computational intelligence) – это ответвление искусственного интеллекта. Как альтернатива классическому искусственному интеллекту, основанному на строгом логическом выводе, он опирается на эвристические алгоритмы, используемые, например, в нечёткой логике, искусственных нейронных сетях и эволюционном моделировании.
Вычислительный юмор (Computational humor) – это раздел компьютерной лингвистики и искусственного интеллекта, использующий компьютеры для исследования юмора.
Выявление аномалий (также обнаружение выбросов) (Anomaly detection) – это опознавание во время интеллектуального анализа данных редких данных, событий или наблюдений, которые вызывают подозрения ввиду существенного отличия от большей части данных. Обычно аномальные данные характеризуют некоторый вид проблемы, такой как мошенничество в банке, структурный дефект, медицинские проблемы или ошибки в тексте. Аномалии также упоминаются как выбросы, необычности, шум, отклонения или исключения.
21
Внутригрупповая предвзятость [Электронный ресурс] //naukatehnika.com URL: https://naukatehnika.com/predvzyatost-iskusstvennogo-intellekta.html (дата обращения: 07.07.2022)
22
Входной слой [Электронный ресурс] //mcs.mail.ru URL: https://naukatehnika.com/predvzyatost-iskusstvennogo-intellekta.html (дата обращения: 07.07.2022)