Читать книгу Искусственный интеллект - - Страница 9
История ИИ
2020-е: Эпоха генеративного ИИ
ОглавлениеГенеративный ИИ (GenAI) – это популярная в 2020-х годах область исследований, которая занимается автоматизированным созданием нового контента, такого как тексты, изображения, видео и аудио, на основе открытых данных и запросов пользователей. Эта технология позволяет автоматизировать задачи по созданию контента на основе компиляции и смешения определенных пользователем аспектов накопленных знаний, и создавать реалистичные изображения, музыкальные композиции и, в отдельных случаях, научные открытия.
Развитие генеративного ИИ началось в конце 1990-х годов, активизировалось в 2010-х годах, но 2020-е годы стали настоящим прорывом. Это произошло в связи с развитием генеративно-состязательных сетей (GAN – Generative Adversarial Network) и появлением больших языковых моделей, таких как ChatGPT, в 2023 году. Эти модели позволяют генерировать тексты такого высокого качества, что часто его довольно сложно отличить от текста, написанного журналистом.
Одним из ключевых людей, стоящих за развитием генеративного ИИ, был Ян Гудфеллоу, канадский исследователь, известный своими работами в области глубокого обучения и генеративных моделей. Ян Гудфеллоу работал в различных организациях и компаниях, включая Google Brain, OpenAI и Microsoft Research. Он внёс значительный вклад в развитие генеративного ИИ, особенно в области генеративных состязательных сетей (GANs) и трансформеров.
Основные свойства генеративного ИИ:
Генерация. Это способность создавать новые данные, такие как изображения, текст или аудио, на основе смешения отдельных аспектов в существующих данных.
Анализ. Это способность анализировать и интерпретировать большие объёмы данных, находить закономерности и делать выводы.
Обучение. Это способность обучаться на основе малого количества примеров, улучшать свои результаты и адаптироваться к новым условиям.
Автоматизация. Это способность автоматизировать рутинные задачи, такие как обработка данных, суммаризация текстов и др.
Удобство получения информации. Это способность отвечать на текстовые вопросы пользователя по всему корпусу накопленных в процессе обучения ИИ знаний.
Основные сценарии использования генеративного ИИ на текущий момент:
Создание контента. Это генерация изображений, видео, музыки и текстов для маркетинга, развлечений и искусства.
Распознавание образов. Это анализ и классификация изображений, видео и аудио для медицинской диагностики, безопасности и распознавания лиц.
Машинный перевод. Это перевод текстов на разные языки с высокой точностью и качеством перевода.
Персонализация. Это адаптация продуктов и услуг под индивидуальные потребности и предпочтения пользователей – конкретных физических лиц.
Негативной стороной достигнутого прогресса в области создания реалистичного, но при этом искусственно сгенерированного контента стали так называемые «deep fake». Слово Deepfake – комбинация термина Deep learning (глубокое обучение) и слова Fake (фейк). Как следует из комбинации, дипфейки создаются с использованием технологии ИИ на основе методов машинного обучения. Выделяют три основных категории дипфейков: видео и изображения, голос, тексты. Обычный неподготовленный человек с высокой степенью вероятности не сможет отличить их от оригиналов. Это явилось серьезным вызовом для новой дисциплины – киберкриминалистики.
Хотя, по сути, дипфейки являются «фальшивкой» (часто в литературе используется более мягкий термин – синтетические медиа или синтетический контент), последствия от их применения и их влияние на общество, граждан и бизнес могут быть вполне реальными. Необходимо понимать, что далеко не все авторы дипфейков используют их со злым умыслом. Но в случае такого умысла они должны сталкиваться с неотвратимыми юридическими последствиями.
Эпоха генеративного ИИ открывает широкие возможности для творчества, исследований, образования и бизнеса. Однако, эта технология также вызывает опасения общественности относительно этических аспектов и возможного негативного воздействия не только на рынок труда, но и на вектор развития человечества.
Нейросети внедряются во всех отраслях экономики беспрецедентными темпами, Различных отраслевых приложений на базе нейросетей насчитывается уже десятки тысяч.
В области медицины и биологии GenAI может ускорить разработку лекарств, проверяя и создавая молекулы для новых лекарственных форм, а также реализовать концепции персонализированного медицинского обслуживания. В области создания контента GenAI может автоматизировать задачи, сэкономить время и деньги, а также создавать индивидуальные маркетинговые материалы. GenAI можно использовать для разработки чат-ботов для обслуживания клиентов, извлечения знаний из баз данных для сотрудников. Для промышленности на основе GenAI ведется разработка дизайна продуктов, проектирование изделий, создание цифровых двойников.
В сфере транспорта GenAI играет решающую роль при реализации технологий автономного и беспилотного вождения, а также создания интеллектуальных транспортных систем. На основе GenAI строятся поисковые системы, системы рекомендаций, таргетированная реклама, виртуальные помощники, автоматический перевод с одного языка на другой, системы распознавания лиц и многое другое.
Благодаря моделям на основе ИИ начинает быстрее развиваться наука. В 2023-2024 гг. были разработаны сотни приложений, например Synbot – модель в сфере химии для автоматического синтеза органических молекул, модель AlphaDev, которая делает алгоритмическую сортировку более эффективной, модель GNoME (Graph Networks for Materials Exploration) от Google DeepMind позволяет проводить моделирование свойств материалов, например искать стабильные формы кристаллических соединений для отрасли микроэлектроники и провела анализ более 2.2 млн новых кристаллов.