Читать книгу Гений кода. Истории самых впечатляющих ИИ-проектов, которые уже меняют жизнь - Ар'лан ис'Дрекхэм - Страница 15

Часть 3: Генеративная революция. Творцы, а не просто классификаторы
Глава 14. GPT-2: Испуг в OpenAI – почему модель боялись выложить в открытый доступ

Оглавление

Крючок: Новость, которая взбудоражила мир

Февраль 2019 года. Сайт OpenAI, некоммерческой организации, созданной Илоном Маском и Сэмом Альтманом (тогда ещё некоммерческой), публикует сообщение.

Они создали новую языковую модель под названием GPT-2. И она умеет… всё.

Генерировать связные тексты на любые темы. Отвечать на вопросы. Писать статьи. Сочинять рассказы. Переводить. Суммировать. И всё это без специального обучения – просто ей даёшь задание на естественном языке, и она его выполняет.

Звучит знакомо, правда? Это было за три года до ChatGPT.

Но самое шокирующее было не в этом. OpenAI заявила: «Мы не будем выкладывать полную модель в открытый доступ».

Они сказали, что модель слишком опасна. Что её могут использовать для создания фейковых новостей, спама, пропаганды, манипуляций. Что они боятся «злоумышленников».

Сообщество ИИ взорвалось. Одни кричали: «Цензура! Вы предаёте идеалы открытости!». Другие: «Молодцы, безопасность прежде всего!». Третьи: «Они просто хотят заработать, прикрываясь этикой».

Что же на самом деле произошло?

Герои: Команда, которая увидела будущее

За GPT-2 стояла команда исследователей OpenAI, включая Алека Рэдфорда (того самого, кто позже станет ключевой фигурой в создании GPT-3 и GPT-4).

Они не изобрели ничего принципиально нового в архитектуре. Они взяли трансформер (глава 13) и просто… сделали его больше.

– GPT-1 (2018) была маленькой моделью, которая неплохо справлялась с конкретными задачами после дообучения.

– GPT-2 была в 10 раз больше: 1,5 миллиарда параметров.

– Её обучили на огромном датасете WebText – 8 миллионов веб-страниц (45 терабайт текста), отобранных по ссылкам с Reddit.

И вдруг обнаружился эффект, который никто не ожидал.

Инсайт: Рождение «zero-shot» обучения

Раньше считалось, что языковые модели нужно специально обучать для каждой задачи. Хочешь перевод – учи на переводах. Хочешь ответы на вопросы – учи на парах вопрос-ответ.

GPT-2 показала, что это необязательно.

Если модель достаточно большая и обучена на достаточно разнообразных данных, она начинает сама обобщать. Ей не нужно показывать примеры перевода – она уже видела переводы в интернете и поняла, как это работает. Ей не нужно учиться отвечать на вопросы – она просто знает, что после вопроса обычно идёт ответ.

Это называлось zero-shot learning (обучение без примеров) или few-shot learning (обучение на нескольких примерах прямо в запросе).

Ты просто пишешь:

Переведи на французский: «Как дела?»

Comment ça va?

И модель понимает: ага, сейчас мне нужно перевести следующую фразу.

Это было открытие. Оно означало, что большие модели – это не просто инструменты для конкретных задач, а зачатки общего интеллекта.

Конфликт: Чем же она так опасна?

OpenAI опубликовала список страшилок. Звучало убедительно.

1. Фейковые новости (масштабируемый обман).

Представь, что ты можешь генерировать тысячи статей, неотличимых от человеческих, за минуты. Можно заполнить интернет пропагандой, дезинформацией, фейками. Люди перестанут понимать, где правда.

2. Социальные боты.

Тысячи аккаунтов в соцсетях, которые ведут осмысленные беседы, продвигают нужные мнения, манипулируют общественным дискурсом. И всё это автоматически.

3. Спам следующего уровня.

Не просто «Купи виагру», а персонализированные письма, написанные так, что их не отличить от человеческих. Идеальные фишинговые атаки.

4. Радикализация.

Модель может генерировать экстремистский контент, если её подтолкнуть. А злоумышленники могут её использовать для создания пропаганды.

В демо-примерах они показали, как GPT-2 продолжает текст про «фейковые новости» и пишет абсолютно убедительную чушь про то, что «учёные обнаружили, что айфоны излучают радиацию, вызывающую рак» (все детали выдуманы, но звучат научно).

Решение: Частичная публикация

OpenAI пошла на компромисс, который разозлил всех.

Они опубликовали:

– Статью с подробным описанием архитектуры.

– Меньшую версию модели (124 миллиона параметров) в открытом доступе.

– Но полную модель (1,5 млрд) оставили себе, пообещав выдать доступ «проверенным исследователям по запросу».

Сообщество взвыло. Критики говорили: «Если архитектура известна, любая крупная компания или государство воспроизведут модель за пару месяцев. А мелким разработчикам вы закрываете доступ. Это элитизм!».

Другие возражали: «Лучше перебдеть, чем недобдеть. Посмотрим, что будет через полгода».

Что было дальше: Проверка страхов

Прошло полгода. OpenAI постепенно выкладывала всё большие версии. К концу 2019 года полная модель стала доступна.

И что? Мир рухнул? Началась эпидемия фейков?

Не совсем.

Что сбылось:

– Модель действительно использовали для создания контента. Появились генераторы статей, постов, рекламных текстов.

– Некоторые спамеры начали экспериментировать, но массового злоупотребления не случилось.

Что НЕ сбылось:

– Армагеддона с фейковыми новостями не произошло. Оказалось, что для убедительной лжи нужно не только уметь генерировать текст, но и распространять его, встраивать в медийную повестку, обходить модерацию. Это всё ещё делают люди, а не алгоритмы.

– Модель была не настолько умной, чтобы полностью заменить человека в сложных манипуляциях. Она часто «галлюцинировала» (выдумывала факты) и писала бессвязно, если не контролировать.

Многие исследователи сказали: «OpenAI переоценила опасность. Они просто испугались собственной тени».

Но был и другой взгляд.

Инсайт: Почему испуг был важен

Несмотря на то, что апокалипсис не случился, решение OpenAI сыграло огромную роль.

1. Оно запустило глобальную дискуссию об этике ИИ.

Впервые в истории создатели модели публично заявили: «Наше творение может быть опасным, и мы несём за него ответственность». Это изменило тон разговоров об ИИ. Появились этические комитеты, правила публикации, исследования по безопасности.

2. Оно показало, что большие модели – это не просто игрушки.

Испуг OpenAI привлёк к GPT-2 огромное внимание. Если бы они просто выложили модель, это была бы ещё одна научная статья. А так это стало мировой новостью. Все захотели узнать, что же там такого страшного.

3. Оно заложило основу для будущей политики OpenAI.

Когда через три года выйдет GPT-4, OpenAI снова будет вводить ограничения, но уже более системно: доступ через API, фильтры контента, модерация. Испуг 2019 года стал репетицией.

Критика: А не пиар ли это?

Конечно, были и циники. Они говорили:

– «OpenAI просто сделала гениальный пиар-ход. Все обсуждают их модель, хотя она не самая лучшая (у Google были модели и побольше)».

– «Они хотят монополизировать технологию, прикрываясь этикой».

– «Если бы они действительно боялись, они бы не публиковали статью с архитектурой. Они хотели и славу получить, и контроль сохранить».

Доля правды в этом есть. Но даже если это был пиар, он сработал. GPT-2 стала самой обсуждаемой моделью 2019 года.

Наследие: Что осталось после GPT-2

GPT-2 изменила ландшафт ИИ навсегда.

1. Zero-shot и few-shot стали мейнстримом.

После GPT-2 все бросились исследовать, как большие модели обобщают знания. Это привело к GPT-3, а потом и к ChatGPT.

2. Открытость vs безопасность.

Дилемма, которую OpenAI поставила в 2019 году, до сих пор не решена. Каждая новая мощная модель вызывает споры: публиковать или не публиковать? Meta опубликовала Llama (и её слили в открытый доступ). Google держит Gemini под замком. Единого ответа нет.

3. Галлюцинации стали проблемой.

Именно GPT-2 показала, что большие языковые модели склонны уверенно врать. Они не говорят «я не знаю». Они придумывают правдоподобную чушь. Эта проблема не решена до сих пор.

Твой ход: Четыре урока от GPT-2

– Ответственность создателя. Ты отвечаешь за то, что создаёшь, даже если последствия неочевидны. Иногда лучше подождать и подумать, чем выложить и пожалеть.

– Страх может быть преувеличен. OpenAI боялась апокалипсиса, а получила дискуссию. Не позволяй страху парализовать действие, но и не игнорируй риски совсем.

– Контекст решает всё. Модель опасна не сама по себе, а в сочетании с человеческим намерением. Инструмент нейтрален – важно, в чьих он руках.

– Учись на чужих страхах. История GPT-2 – хороший пример того, как можно балансировать между открытостью и безопасностью. Используй этот опыт в своих проектах.

P.S.

Знаешь, что сказал Сэм Альтман через несколько лет?

«Оглядываясь назад, мы, возможно, переоценили риски GPT-2. Но это был важный опыт. Мы учились, и лучше перебдеть, чем недобдеть. Без этого опыта мы бы не справились с GPT-3 и GPT-4».

Гений кода. Истории самых впечатляющих ИИ-проектов, которые уже меняют жизнь

Подняться наверх