Читать книгу Глоссариум по искусственному интеллекту: 2500 терминов - Александр Николаевич Чашин, Инна Евгеньевна Скворцова, Александр Николаевич Афонин - Страница 7
Глоссариум по искусственному интеллекту
«Д»
ОглавлениеДанные (Data) – это информация собранная и трансформированная для определенных целей, обычно анализа. Это может быть любой символ, текст, цифры, картинки, звук или видео.
Данные ограниченного использования (Restricted-use data) – это данные, которые содержат конфиденциальную информацию (обычно о людях), которая может позволить идентифицировать людей. Наличие конфиденциальной информации в депонированном цифровом контенте представляет собой проблему управления для долгосрочного хранения, чтобы гарантировать, что требования к архивному хранилищу для достижения распределенной избыточности учитывают, например, требования конфиденциальности.
Данные тестирования – это подмножество доступных данных, выбранных специалистом по данным для этапа тестирования разработки модели.
Дартмутский семинар (Dartmouth workshop) – Дартмутский летний исследовательский проект по искусственному интеллекту – так назывался летний семинар 1956 года, который многие считают основополагающим событием в области искусственного интеллекта.
Датамайнинг (Datamining) – это процесс обнаружения и интерпретации значимых закономерностей и структур в исходных данных, которые могут быть использованы для решения сложных бизнес-вопросов и высокоинтеллектуального прогнозирования.
Датасатанисты – определение, придуманное авторами, но отражающее современную действительность (на ровне с термином «инфоцыганщина»), которая сложилась в период популяризации идей искусственного интеллекта в современном информационном обществе. Датасатанисты – это люди (по своей сути мошенники и преступники), которые очень умело маскируются под ученых и специалистов в области ИИ и МО, но при этом пользующиеся чужими заслугами, знаниями и опытом, в своих корыстных целях и целях незаконного обогащения. Их действия можно трактовать по Статье 159 УК РФ Мошенничество, Статье 174 УК РФ Легализация (отмывание) денежных средств или иного имущества, приобретенных другими лицами преступным путем, Статье 285 УК РФ Злоупотребление должностными полномочиями, Статье 286 УК РФ Превышение должностных полномочий и др.
Даунсэмплинг (downsampling) — это уменьшение количества информации в функции для более эффективного обучения модели. Например, перед обучением модели распознавания изображений, субдискретизация изображений с высоким разрешением до формата с более низким разрешением; Обучение на непропорционально низком проценте чрезмерно представленных примеров классов, чтобы улучшить модель обучения на недопредставленных классах.
Движок искусственного интеллекта (Artificial intelligence engine) (также AI engine, AIE) – это движок искусственного интеллекта, аппаратно-программное решение для повышения скорости и эффективности работы средств системы искусственного интеллекта.
Двоичная, бинарная или дихотомическая классификация (Binary classification) – это задача классификации элементов заданного множества в две группы (определение, какой из групп принадлежит каждый элемент множества) на основе правила классификации.
Двоичное число (Binary number) – это число, записанное в двоичной системе счисления, в которой используются только нули и единицы. Пример: Десятичное число 7 в двоичной системе счисления: 111.
Двоичный формат (Binary format) – это любой формат файла, в котором информация закодирована в каком-либо формате, отличном от стандартной схемы кодирования символов. Файл, записанный в двоичном формате, содержит информацию, которая не отображается в виде символов. Программное обеспечение, способное понимать конкретный метод кодирования информации в двоичном формате, должно использоваться для интерпретации информации в файле в двоичном формате. Двоичные форматы часто используются для хранения большего количества информации в меньшем объеме, чем это возможно в файле символьного формата. Их также можно быстрее искать и анализировать с помощью соответствующего программного обеспечения. Файл, записанный в двоичном формате, может хранить число «7» как двоичное число (а не как символ) всего в 3 битах (т. е. 111), но чаще используется 4 бита (т. е. 0111). Однако двоичные форматы обычно не переносимы. Файлы программного обеспечения записываются в двоичном формате. Примеры файлов с числовыми данными, распространяемых в двоичном формате, включают двоичные версии IBM файлов Центра исследований цен на ценные бумаги и Национального банка торговых данных Министерства торговли США на компакт-диске. Международный валютный фонд распространяет международную финансовую статистику в смешанном формате и двоичном (упакованно-десятичном) формате. SAS и SPSS хранят свои системные файлы в двоичном формате.
Двунаправленная языковая модель (Bidirectional language model) – это языковая модель, которая определяет вероятность того, что данный маркер присутствует в заданном месте в отрывке текста на основе предыдущего и последующего текста.
Двунаправленность (Bidirectional) – это термин, используемый для описания системы оценки текста, которая одновременно исследует предшествующий и последующий разделы текста от целевого раздела.
Двусмыссленная фраза (Crash blossom) – это предложение или фраза с двусмысленным значением. Crash blossom представляет серьезную проблему для понимания естественного языка. Например, заголовок «бить баклуши» является Crash blossom, потому что нейронная сеть с пониманием естественного языка может интерпретировать заголовок буквально или образно.
Дедуктивный классификатор (Deductive classifier) – это тип механизма вывода искусственного интеллекта. Он принимает в качестве входных данных набор деклараций на языке кадра об области, такой как медицинские исследования или молекулярная биология. Классификатор определяет, являются ли различные описания логически непротиворечивыми, и если нет, то выделяет конкретные описания и несоответствия между ними.
Дедукция (Deductive Reasoning) – это способ рассуждения и доказательства на основе перехода от более общих положений к частным, один из способов прогнозирования развития и изложения материала; эффективен, когда у исследователя уже накоплен определенный опыт и знания в изучаемой области.
Действие (Action) (в обучении с подкреплением) – это механизм, с помощью которого агент переходит между состояниями среды. Агент выбирает действие с помощью политики.
Декларативное программирование (Declarative programming) – это парадигма программирования, в которой задаётся спецификация решения задачи, то есть описывается ожидаемый результат, а не способ его получения. Противоположностью декларативного является императивное программирование, при котором на том или ином уровне детализации требуется описание последовательности шагов для решения задачи.
Декомпрессия (Decompression) – это функция, которая используется для восстановления данных в несжатую форму после сжатия.
Демографический паритет (Demographic parity) – это метрика справедливости, которая удовлетворяется, если результаты классификации модели не зависят от данного конфиденциального атрибута.
Дерево поведения (Behavior tree) – это ориентированный ациклический граф, узлами которого являются возможные варианты поведения робота. «Ширина» дерева указывает на количество доступных действий, а «длина» его ветвей характеризует их сложность. Деревья поведения имеют некоторое сходство с иерархическими конечными автоматами с тем ключевым отличием, что основным строительным блоком поведения является задача, а не состояние. Простота понимания человеком делает деревья поведения менее подверженными ошибкам и очень популярными в сообществе разработчиков игр.
Дерево проблем (решений) или логическое дерево (Issue tree) – это денотативное (отражающее ситуацию) представление процесса принятия решений, представленное в виде графической разбивки задачи, разделенное на отдельные компоненты по вертикали и горизонтали. Деревья решений в искусственном интеллекте используются для того, чтобы делать выводы на основе данных, доступных из решений, принятых в прошлом. Деревья решений – это статистические алгоритмические модели машинного обучения, которые интерпретируют и изучают ответы на различные проблемы и их возможные последствия. В результате деревья решений знают правила принятия решений в конкретных контекстах на основе доступных данных.
Дерево решений (Decision Tree) – это метод представления решающих правил в иерархической структуре, состоящей из элементов двух типов – узлов (node) и листьев (leaf). В узлах находятся решающие правила и производится проверка соответствия примеров этому правилу по какому-либо атрибуту обучающего множества.
Децентрализованное управление (Decentralized control) – это процесс, при котором существенное количество управляющих воздействий, относящихся к данному объекту, вырабатываются самим объектом на основе самоуправления.
Децентрализованные приложения (dApps, Decentralized applications) – это цифровые приложения или программы, которые существуют и работают в блокчейне или одноранговой (P2P) сети компьютеров, а не на одном компьютере. DApps (также называемые «dapps») находятся вне компетенции и контроля одного органа. DApps, которые часто создаются на платформе Ethereum, можно разрабатывать для различных целей, включая игры, финансы и социальные сети.
Дешифратор (декодер) (Decoder) – это комбинационное устройство с несколькими входами и выходами, у которого определенным комбинациям входных сигналов соответствует активное состояние одного из выходов. Дешифраторы преобразуют двоичный или двоично-десятичный код в унитарный код.
Диагностика (Diagnosis) – это термин, связаный с разработкой алгоритмов и методов, способных определить правильность поведения системы. Если система работает неправильно, алгоритм должен быть в состоянии определить с максимально возможной точностью, какая часть системы дает сбой и с какой неисправностью она сталкивается. Расчет основан на наблюдениях, которые предоставляют информацию о текущем поведении.
Диалоговые системы (Dialogue system) – это компьютерные системы, предназначенные для общения с человеком. Они имитируют поведение человека и обеспечивают естественный способ получения информации, что позволяет значительно упростить руководство пользователя и тем самым повысить удобство взаимодействия с такими системами. Диалоговую систему также называют разговорным искусственным интеллектом или просто ботом. Диалоговая система может в разной степени являться целеориентированной системой (англ. goal/task-oriented) или чат-ориентированной (англ. chat-oriented).
Дизайн-центр (Design Center) – это организационная единица (вся организация или ее подразделение), выполняющая полный спектр или часть работ по созданию продукции до этапа ее серийного производства, а также обладающая необходимыми для этого кадрами, оборудованием и технологиями.
Дикий код (Wild code) – это коды, которые не разрешены для конкретного вопроса. Например, если вопрос, в котором указывается пол респондента, имеет задокументированные коды «1» для женского пола и «2» для мужского пола и «9» для «отсутствующих данных», код «3» будет «диким». код, который иногда называют «недокументированным кодом».
Диктовка (Dictation) – это речевой (голосовой) ввод текста.
Динамическая модель (Dynamic model) – это теоретическая конструкция (модель), описывающая изменение состояний объекта. Она может включать в себя описание этапов или фаз или диаграмму состояний подсистем. Часто имеет математическое выражение и используется главным образом в общественных науках (например, в социологии), имеющих дело с динамическими системами, однако современная парадигма науки способствует тому, что данная модель также имеет широкое распространение во всех без исключения науках, в том числе в естественных и технических. Динамическая модель обучается онлайн в постоянно обновляемой форме. То есть данные непрерывно поступают в модель.
Динамическая эпистемическая логика (Dynamic epistemic logic, DEL) – это логическая структура, связанная с изменением знаний и информации. Как правило, DEL фокусируется на ситуациях с участием нескольких агентов и изучает, как меняются их знания при возникновении событий.
Дискретная система (Discrete system) – это кибернетическая система, все элементы которой, а также связи между ними (т.е. обращающаяся в системе информация) имеют дискретный характер. Содержит в себе понятие дискретного сигнала. Т. е., это любая система в замкнутом контуре управления в которой используются дискретные сигналы.
Дискретные признаки (Discrete feature) – это количественные признаки, принимающие отдельные, иногда только целочисленные значения. Например, число жителей города, заболевших гриппом за год.
Дискриминатор (Discriminator) – это функциональная группа, выполняющая сравнение двух одноименных входных величин (мгновенных значений или амплитуд, частот, фаз, задержек электрических сигналов; дальностей, направлений, скоростей объектов и т.п.), выходной сигнал которой пропорционален разности значений этих величин. В контуре управления служит датчиком рассогласования своих входных величин, формирующим сигнал ошибки. Это система, которая определяет, являются ли примеры реальными или поддельными.
Дискриминационная модель (Discriminative model) – это модель, предсказывающая метки на основе набора из одного или нескольких признаков. Более формально, дискриминационные модели определяют условную вероятность выхода с учетом характеристик и весов.
Дистанционное медицинское обслуживание (Remote Medical Care) – это телемедицинский сервис, позволяющий осуществлять постоянный мониторинг состояния пациента и проведение профилактических и контрольных осмотров вне медицинских учреждений. Эта форма ухода стала возможной благодаря использованию мобильных устройств, которые измеряют основные показатели жизнедеятельности. Результаты передаются в Центр дистанционного медицинского обслуживания, где они автоматически анализируются. При обнаружении каких-либо отклонений медицинский персонал связывается с пациентом и вызывает скорую помощь в случае возникновения экстренной ситуации.
Длинный Хвост (Long Tail) означает разнообразную, но малообъемную часть ассортимента продукции. Интернет сделал возможным получение прибыли от продажи продуктов с длинным хвостом. Концепция была представлена Крисом Андерсоном в 2004 году.
Документация (Documentation) как правило, – это любая информация о структуре, содержимом и макете файла данных. Иногда называется «технической документацией» или «кодовой книгой». Документацию можно рассматривать как специализированную форму метаданных.
Документированная информация (Documented information) – это зафиксированная на материальном носителе путем документирования информация с реквизитами, позволяющими определить такую информацию, или в установленных законодательством Российской Федерации случаях ее материальный носитель.
Долгая краткосрочная память (Long short-term memory (LSTM)) – это разновидность архитектуры рекуррентных нейронных сетей, предложенная в 1997 году Зеппом Хохрайтером и Юргеном Шмидхубером. Как и большинство рекуррентных нейронных сетей, LSTM-сеть является универсальной в том смысле, что при достаточном числе элементов сети она может выполнить любое вычисление, на которое способен обычный компьютер, для чего необходима соответствующая матрица весов, которая может рассматриваться как программа. В отличие от традиционных рекуррентных нейронных сетей, LSTM-сеть хорошо приспособлена к обучению на задачах классификации, обработки и прогнозирования временных рядов в случаях, когда важные события разделены временными лагами с неопределённой продолжительностью и границами. Относительная невосприимчивость к длительности временных разрывов даёт LSTM преимущество по отношению к альтернативным рекуррентным нейронным сетям, скрытым марковским моделям и другим методам обучения для последовательностей в различных сферах применения [24]. Также, – это тип ячейки рекуррентной нейронной сети, используемой для обработки последовательностей данных в таких приложениях, как распознавание рукописного ввода, машинный перевод и субтитры к изображениям. LSTM решают проблему исчезающего градиента, которая возникает при обучении RNN из-за длинных последовательностей данных, сохраняя историю во внутренней памяти на основе новых входных данных и контекста из предыдущих ячеек в RNN.
Дополненная реальность (Augmented reality) – это среда, в реальном времени дополняющая физический мир, каким мы его видим, цифровыми данными с помощью различных устройств (планшетов, смартфонов и др.) и определенного программного обеспечения.
Отличие дополненной реальности от виртуальной реальности (virtual reality) в том, что дополненная реальность лишь добавляет отдельные элементы в уже существующий мир.
Дополненный (расширенный) интеллект (Augmented Intelligence) – это шаблон проектирования ориентированной на человека модели партнерства, в которой люди и искусственный интеллект работают вместе для улучшения когнитивных функций, включая обучение, принятие решений и новый опыт. Дополненный интеллект представляет собой совокупность средств и методов, обеспечивающих максимально возможную производительность интеллекта человека.
Дополнительный интеллект (Auxiliary intelligence) – это системы на основе искусственного интеллекта, дополняющие принимаемые человеком решения, и способные обучаться в процессе взаимодействия с людьми и окружающей средой.
Допустимая эвристика (Admissible heuristic) – это эвристическая функция считается допустимой, если она никогда не завышает стоимость достижения цели, т. е. стоимость, которую она оценивает для достижения цели, не превышает наименьшую возможную стоимость. от текущей точки пути.
Достоверность данных (Data veracity) – это степень точности или правдивости набора данных. В контексте больших данных важно не только качество данных, но и то, насколько надежными являются источник, тип и обработка данных.
Достоверность распознавания (Recognition accuracy) – это точность (правильность, достоверность) распознавания. Язык разметки для синтеза речи.
Доступ к информации (Access to information) – это возможность получения информации и ее использования.
Доступ к информации, составляющей коммерческую тайну (Access to information constituting a commercial secret) – это ознакомление определенных лиц с информацией, составляющей коммерческую тайну, с согласия ее обладателя или на ином законном основании при условии сохранения конфиденциальности этой информации.
Драйвер (Driver) – это компьютерное программное обеспечение, с помощью которого другое программное обеспечение (операционная система) получает доступ к аппаратному обеспечению отдельного устройства.
Древо решений (Decision tree) – это модель на основе дерева и ветвей, используемая для отображения решений и их возможных последствий, аналогична блок-схеме.
Дрейф концепций (Concept drift) в предиктивной аналитике и машинном обучении – это статистические свойства целевой переменной, которую модель пытается предсказать, со временем меняются непредвиденным образом. Это вызывает проблемы, потому что прогнозы становятся менее точными с течением времени.
Дрон (Drone) – это беспилотный летательный аппарат.
Дружественный искусственный интеллект (ДИИ) (Friendly artificial intelligence) – это искусственный интеллект (ИИ), который обладает скорее позитивным, чем негативным влиянием на человечество. ДИИ также относится к области исследований, целью которых является создание такого ИИ. Этот термин в первую очередь относится к тем ИИ-программам, которые обладают способностью значительно воздействовать на человечество, таким, например, чей интеллект сравним или превосходит человеческий.
24
Долгая краткосрочная память [Электронный ресурс] //ru.wikipedia.org URL: https://ru.wikipedia.org/wiki/ (дата обращения: 07.07.2022)