Читать книгу GPT педагогам. 350 промптов повышающих производительность в 1000 раз - - Страница 5
1. ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ, ЧТО УЖЕ ДОСТУПНО…
1.3. Обзор отечественных ИИ-сервисов и приложений
ОглавлениеМы уже отмечали, что зарубежные сервисы ИИ имеют сильную маркетинговую поддержку, гораздо хуже обстоят дела с отечественными разработками.
ЯндексGPT (Generative Pre-trained Transformer) – это модель искусственного интеллекта, разработанная компанией Яндекс. Она основана на архитектуре Transformer и активно обучается на большом количестве текстовых данных, что позволит генерировать тексты на заданную тему или продолжать заданный текст.
Учитывая, что ChatGPT недоступен для россиян, YandexGPT – очень своевременный продукт, который в принципе может делать примерно то же самое, но пока находится в стадии обучения. YandexGPT и Алиса могут писать стихи, мгновенно переводить, писать деловые письма, писать код, причем все это достаточно качественно, рис. 2.
Компания «Яндекс» предупреждает, что на данный момент модель еще находится в стадии тестирования и может давать неверные ответы.
Рисунок 2 – ЯндексGPT – Нейросеть с Алисой
Генератор пьес «НейроСтаниславский» был разработан студентами Национального исследовательского технологического университета «МИСиС» с использованием нейросети ruGPT-3. Эта нейросеть была дополнительно обучена на произведениях русских классиков, включая работы Островского, Чехова и Горького. Молодые инженеры разработали алгоритм, который изучил десятки пьес и выделил из них 14 тысяч диалогов. Полученная база данных послужила основой для создания «НейроСтаниславского». Авторы проекта уверены, что искусственный интеллект будет иметь огромное значение для развития театрального искусства в будущем, и они сделали значительный шаг в этом направлении.
Голосовой помощник «Алиса» был разработан компанией «Яндекс» в 2017 году как отечественная альтернатива виртуальным ассистентам Apple Siri, Google Assistant и Amazon Alexa. За время своего развития «Алиса» приобрела множество навыков и умений. Она отлично владеет русским языком, может давать быстрые ответы на вопросы, прокладывать маршруты, рассказывать детям сказки, вызывать такси, делать покупки в интернет-магазинах, играть в игры, распознавать фотографии, рисовать картины, управлять «умным» домом и выполнять множество других действий. Отличительными особенностями «Алисы» являются ее способность вести разговоры на различные темы и возможность интеграции в различные системы. Более того, сервис может запоминать голоса пользователей и автоматически адаптироваться к интересам каждого собеседника.
Голосовой помощник «Маруся» – интеллектуальная голосовая система, разработанная интернет-холдингом VK, ранее известным как Mail.ru Group. Этот сервис имеет широкий спектр функций: от выполнения голосовых команд и ответов на вопросы до перевода фраз с русского на иностранные языки, управления устройствами «умного» дома и др. Особое внимание в разработке было уделено поддержке детских навыков, которые помогают родителям заниматься своими детьми. Голосовой помощник может развлечь маленьких пользователей различными развивающими играми, загадками, викторинами, сказками (включая использование дополненной аудиореальности), стихами и музыкой из специальных плейлистов. «Маруся» способна распознать голос ребенка и автоматически активировать детский режим. Доступ к сервису можно получить через одноименное приложение для iOS и Android, почту Mail.ru, браузер «Атом», социальную сеть «ВКонтакте», фирменные колонки «Капсула» и российскую версию Mi Smart Speaker от Xiaomi.
Голосовой помощник «Салют», разработанный компанией «Сбер», является частью экосистемы продуктов этой компании и способен вести диалог с пользователем от лица трех виртуальных персонажей с разными голосами, характерами и стилем общения. «Салют» доступен в мобильном клиенте с тем же названием, в банковском приложении «Сбербанк Онлайн», на смарт-устройствах Sber и на телевизорах, поддерживающих «Салют ТВ». Помимо базовых функций, таких как предоставление информации о погоде, установка будильника, ответы на вопросы и воспроизведение музыки, этот голосовой помощник способен управлять умным домом, осуществлять перевод денег, оплачивать мобильную связь, делать заказы в интернет-магазинах, записывать пользователей к врачу или в салон красоты и выполнять другие повседневные задачи. Голосовой помощник поддерживает детский режим с возрастными ограничениями и может быть использован в качестве продвинутого автоответчика на смартфонах.
Colorize – инновационный инструмент, разработанный Александром Кожевиным, который использует передовые технологии искусственного интеллекта для раскрашивания чёрно-белых фотографий и видеороликов. Он также предлагает возможность реставрации старых снимков, улучшения изображений и масштабирования без потери качества. Работа с Colorize осуществляется весьма просто: пользователь загружает файл, требующий обработки, и спустя некоторое время получает результат. Бесплатная версия сервиса имеет некоторые ограничения и существенно урезанные возможности AI-движка. Однако разработчик предлагает три тарифных плана, включая самый доступный, который позволяет обрабатывать до 50 снимков. Обработка видео оплачивается отдельно и стоит значительно дороже.
Бесплатный AI-сервис, разработанный компанией VK, который позволяет восстановить старые монохромные фотографии и придать им новую жизнь, добавив яркие краски, рис. 3.
Рисунок 3 – Бесплатный AI-сервис, разработанный компанией VK
Этот сервис основан на технологиях компьютерного зрения Vision от VK Cloud, которые не только раскрашивают черно-белые снимки, но и проводят их реставрацию, удаляя мелкие царапины, исправляя дефекты и повышая качество изображения. AI-разработка компании VK позволяет пользователям преобразовывать свои старые фотографии с минимальными усилиями и получать великолепные результаты. С помощью этого инструмента можно быстро и легко оживить прошлое и сохранить воспоминания в ярких цветах.
КонтрПлагиат, сервис, известный в академических кругах как академическая нейросеть перефразирования текстов, содержащих плагиат и очеловечивания текстов, сгенерированных ИИ, например GPT, рис. 4.
Рисунок 4 – КонтрПлагиат, академическая нейросеть перефразирования текстов
Сервис, появился за несколько лет до GPT, а с 2023 г. предоставляет целый ряд дополнительных услуг:
Услуги перефразирования и очеловечивания текстов:
– для адаптации к разным аудиториям;
– для уменьшения плагиата, любой объем;
– написанных с помощью GPT;
– для улучшения SEO-оптимизации;
– для улучшения читабельности;
– новостного контента;
– создания очеловеченного контента для социальных медиа, согласно Федеральных законов от 14 июля 2022 г. №270-ФЗ, статьи 10 Федерального закона «Об обеспечении доступа к информации о деятельности судов в Российской Федерации», Распоряжения Правительства РФ в сентябре 2022 года, №2523-р.
Создание уникальных текстов по образцу, с последующим очеловечиванием:
– для статей блогов;
– описаний товаров для интернет-магазинов;
– для рекламных баннеров и объявлений;
– для описания услуг и продуктов компании;
– для презентаций и бизнес-планов;
– для описания мест и достопримечательностей;
– для отзывов на продукты и услуги;
– для описания проектов и исследований;
– для описания культурных событий и фестивалей;
– для описания технических характеристик продуктов и товаров;
– для описания музыкальных произведений и альбомов;
– для описания исторических событий и персонажей;
– для описания кулинарных рецептов;
– для описания спортивных событий и команд;
«Балабоба» – это нейросетевой сервис генерации текстов, разработанный «Яндексом». Он способен создавать связные тексты на любую тему и в разных стилях на основе фраз, введенных пользователем. В основе «Балабобы» лежит облегченная версия нейросети YaLM 100B, которая обрабатывает и генерирует тексты на русском и английском языках. Разработчики «Яндекса» отмечают, что сервис не обладает собственным мнением или знаниями. Он только подражает и составляет фразы, максимально похожие на реальные тексты из интернета. Поэтому иногда «Балабоба» может создавать странные тексты и применяется в основном для развлечения.
Нейросеть «Шедеврум», разработанная компанией «Яндекс», представляет собой прототип системы, способной генерировать изображения на основе текстовых запросов пользователей.
Рисунок 5 – Нейросеть «Шедеврум», разработанная компанией «Яндекс»
Эта нейросеть обладает умением понимать русский и английский языки, а также проявляет предпочтение к конкретным и точным описаниям. Она способна имитировать стиль известных художников и создавать произведения искусства в заданных художественных стилях. Для использования этой системы необходимо скачать мобильное приложение, доступное в Google Play и App Store.
Нейронная сеть «Шедеврума» использует метод каскадной диффузии для создания иллюстраций. Сначала она генерирует изображения в соответствии с текстовым запросом, а затем постепенно увеличивает разрешение, добавляя детали. Первая версия этой генеративной модели была обучена на 240 миллионах примеров изображений с текстовыми описаниями. В настоящее время разработчики работают над следующим обновлением системы, которое будет основано на наборе данных из 500 миллионов примеров. Ожидается, что это обновление значительно улучшит качество генерируемых искусственным интеллектом изображений.
Нейросеть Kandinsky 2.1, разработанная компанией «Сбер», представляет собой новую генеративную модель, способную создавать высококачественные изображения на основе их текстового описания на естественном языке. Именно эту нейросеть мы использовали для создания обложки нашего пособия. Эта модель также может комбинировать несколько изображений, изменять их в соответствии с текстовым описанием, генерировать иллюстрации, которые похожи на заданное изображение, дорисовывать недостающие части и формировать изображения в режиме бесконечного полотна. Сервис понимает запросы на 101 языке, включая русский и английский, и способен рисовать в различных стилях, таких как 3D-рендеринг, картина маслом, рисунок карандашом, студийное фото, хохлома, ренессанс, классицизм, аниме, мозаика и другие.
Kandinsky 2.1 является развитием предыдущей версии AI-системы, которая была обучена на одном миллиарде пар «текст – изображение». Обновленная модель также была обучена на 170 миллионах иллюстраций высокого разрешения с текстовыми описаниями, а также на датасете из двух миллионов примеров, содержащих тексты, лица людей и другие сложные графические элементы. В основе сервиса также лежит новая модель автоэнкодера, которая используется в качестве декодера векторных представлений изображений. Представители компании «Сбер» отмечают, что эти улучшения значительно повышают качество генерируемых иллюстраций в высоком разрешении.
Система закадрового перевода видео, разработанная компанией «Яндекс», представляет собой инновационное решение, которое позволяет пользователям просматривать видео с русской озвучкой на различных иностранных языках, таких как английский, немецкий, французский, испанский и китайский. Этот уникальный сервис доступен в «Яндекс. Браузере» для операционных систем Windows, macOS, Linux и Android, а также в официальном приложении «Яндекс» для устройств на базе iOS и Android. Для того чтобы воспользоваться переводом, пользователю необходимо всего лишь нажать на специальную кнопку с логотипом «Яндекс. Переводчика». Кроме того, система поддерживает перевод видео, размещенных на таких популярных платформах, как YouTube, Vimeo, Twitch и другие. Главное условие – видео должно быть доступно для общего просмотра, а его продолжительность не должна превышать 4 часа.
Основой функционирования сервиса закадрового перевода «Яндекса» является использование нескольких передовых технологий, разработанных этой компанией. Среди них можно выделить технологии распознавания и синтеза речи, биометрии и машинного перевода, основанные на сложных нейросетевых моделях. Сначала система распознавания речи преобразует произнесенные слова в кадре в текст, автоматически расставляет знаки препинания и разделяет слова на смысловые сегменты. Затем технология машинного перевода переводит полученный текст на русский язык, а модуль синтеза речи озвучивает результат. Этот переводный текст затем накладывается на видео таким образом, чтобы фразы в оригинале и переводе имели одинаковую длину. Для распознавания голосов разных дикторов на видео применяется еще одна нейросеть, которая анализирует спектрограмму звуковой дорожки и определяет фрагменты, произнесенные разными говорящими. Благодаря этой технологии становится возможным определить, кто из спикеров что сказал, это значительно облегчает восприятие перевода в случае, когда на видео присутствует большое количество действующих лиц.
SteosVoice: разработанная компанией Mind Simulation, система синтеза речи SteosVoice представляет собой AI-платформу, способную преобразовывать текстовую информацию в аудиофайлы. Это многофункциональное решение может быть использовано для озвучивания YouTube-роликов, создания голосовых систем, персонажей в игровых приложениях и подкастов. Библиотека SteosVoice включает в себя более полусотни уникальных голосов на русском и английском языках. Кроме того, пользователи имеют возможность загружать собственные голоса и настраивать ритмоинтонационные характеристики синтезируемой речи. Чтобы оценить функциональные возможности сервиса, разработчики предлагают использовать бесплатного Telegram-бота. Полный набор инструментов системы синтеза речи доступен по подписке.
Умная камера «Яндекса». Приложение «Яндекс» предлагает уникальную возможность использования интеллектуальной камеры на мобильных устройствах. Эта камера в режиме реального времени распознает предметы, описывает то, что видит, и предлагает рекомендации. Кроме того, она способна сканировать документы, переводить надписи и решать математические уравнения.
Основой работы камеры являются передовые технологии искусственного интеллекта и компьютерного зрения. Специально обученные нейронные сети, основанные на множестве примеров, позволяют идентифицировать широкий спектр объектов, попадающих в объектив камеры. Благодаря умной камере «Яндекса», пользователи могут мгновенно переводить вывески, меню и этикетки на иностранных языках, определять породу животных, виды растений и названия достопримечательностей, а также находить магазины, где можно приобрести товары, аналогичные тем, которые видятся на фотографиях. Более того, камера способна раскрывать прекрасное в самых обычных вещах, будь то цветок на подоконнике или скамейка в парке: достаточно направить камеру на объект, и «Яндекс» предложит поэтические строки, связанные с ним.
Как видно, рынок программных решений на базе искусственного интеллекта продолжает активно развиваться как на мировом, Приложение2, так и на российском уровне. Если раньше «умные» сервисы считались чем-то экзотическим, то сегодня они уже не вызывают удивления: электронная техника способна понять пользователя с полуслова, отвечать на вопросы и легко справляться с повседневными задачами. Однако это только малая часть возможностей, которые предлагают AI-технологии.
Прогресс в этой области неумолимо продвигается вперед. Безусловно, в ближайшие десятилетия мы ожидаем качественный скачок в развитии систем искусственного интеллекта, особенно с учетом развития квантовых и фотонных вычислений, интернета вещей и робототехники. Эти технологии имеют потенциал кардинально изменить жизнь человека.