Читать книгу Гений кода. Истории самых впечатляющих ИИ-проектов, которые уже меняют жизнь - Ар'лан ис'Дрекхэм - Страница 16
Часть 3: Генеративная революция. Творцы, а не просто классификаторы
Глава 15. ChatGPT: Момент, когда ИИ заговорил как человек
ОглавлениеКрючок: 5 дней, которые потрясли мир
30 ноября 2022 года. Обычный осенний день. В мире происходит тысяча событий: война, кризис в экономике, чемпионат мира по футболу в Катаре.
Маленькая компания OpenAI, о которой знают в основном специалисты, тихо запускает «исследовательский превью» – бесплатный чат-бот под названием ChatGPT.
Никакой рекламы. Никаких пресс-релизов. Просто ссылка в твиттере Сэма Альтмана.
Через 5 дней у ChatGPT миллион пользователей.
Через 2 месяца – 100 миллионов пользователей. Это самый быстрый рост в истории человечества. Ни одно приложение, ни одна соцсеть, ни один сервис не росли так быстро. Соц. Сеть добиралась до 100 миллионов 9 месяцев. ChatGPT – 2 месяца.
Что произошло? Почему именно эта версия, именно этого чат-бота, именно в этот момент взорвала мир?
Герои: Команда, которая сделала ставку на разговор
За ChatGPT стояла всё та же команда OpenAI, которую мы уже знаем по GPT-2 и GPT-3.
Сэм Альтман – генеральный директор, визионер и главный публичный спикер.
Грег Брокман – президент и технический гений, который собирал команду.
Илья Суцкевер – главный научный сотрудник, тот самый ученик Хинтона из AlexNet, который верил в масштабирование.
И сотни инженеров, исследователей, дизайнеров.
Но ключевой момент был не в создании самой модели. GPT-3 существовала с 2020 года. Она была огромной (175 миллиардов параметров) и умной, но… с ней было тяжело разговаривать.
Она могла выдать гениальный текст, а могла понести чушь. Она могла оскорбить собеседника. Она могла выдать расистские высказывания. Она не слушалась.
Нужно было научить её вести себя.
Конфликт: Умная, но невоспитанная
Представь, что у тебя есть друг-гений. Он знает всё на свете, может решить любую задачу, написать любой текст. Но он совершенно не умеет общаться. Может нахамить, может уйти в бессвязный монолог, может обидеться на ровном месте. Ты будешь с ним дружить? Нет.
GPT-3 была таким гением. Её нужно было «приручить».
OpenAI сделала две ключевые вещи.
Шаг 1: Обучение с учителем (Supervised Fine-Tuning).
Они наняли десятки тысяч людей (в основном через Кению и другие страны с дешёвой рабочей силой), которые сидели и писали «правильные» ответы на вопросы.
Людям показывали запросы и просили написать идеальный ответ. Как должен отвечать вежливый, полезный, безопасный ассистент? Миллионы таких примеров загружали в модель, чтобы она училась подражать человеческому стилю общения.
Шаг 2: Обучение с подкреплением на основе обратной связи (RLHF – Reinforcement Learning from Human Feedback).
Это был гениальный трюк.
Сначала модель генерировала несколько вариантов ответа на один вопрос. Люди оценивали: этот ответ хороший, этот плохой, этот средний. Потом на этих оценках обучали отдельную модель-«критика», которая предсказывала, понравится ли ответ человеку.
А потом основную модель учили так, чтобы она нравилась этому «критику». Это как GAN (глава 10), только вместо критика, который ловит подделки, – критик, который ловит грубость и бесполезность.
В результате получилась модель, которая не только знает, но и умеет себя вести.
Развязка: Диалог, который изменил всё
30 ноября 2022 года пользователи зашли на сайт и начали печатать.
– «Напиши стих про программиста, который влюбился в баги.»
– «Объясни квантовую физику так, чтобы понял пятилетний.»
– «Придумай тост на свадьбу друга.»
– «Помоги мне написать письмо начальнику.»
– «Я грустный, подбодри меня.»
И ChatGPT отвечал. Быстро, связно, полезно, вежливо. Он шутил (иногда смешно), он сочувствовал (иногда трогательно), он объяснял (иногда гениально просто).
Люди не могли поверить. Казалось, что по ту сторону экрана сидит живой человек. Умный, терпеливый, готовый помочь 24/7, бесплатно, без осуждения.
Соцсети взорвались скриншотами диалогов. Люди показывали, как ИИ пишет за них код, как помогает с домашним заданием, как утешает в трудную минуту.
Это был момент, который историк технологий Бенедикт Эванс назвал «моментом Айзека Азимова» – когда фантастика стала реальностью.
Инсайт: Почему сработало именно это
Чем ChatGPT отличался от всех предыдущих чат-ботов?
1. Бесплатно и доступно.
Любой человек с интернетом мог зайти и попробовать. Не нужно было платить, не нужно было разбираться в API, не нужно было читать инструкции.
2. Естественный язык.
Не нужно учить команды. Не нужно писать запросы особым образом. Просто говоришь по-человечески – и получаешь ответ.
3. Универсальность.
Одна модель делала всё: писала код, сочиняла стихи, отвечала на вопросы, переводила, объясняла, советовала. Раньше для каждой задачи был свой инструмент. Теперь один инструмент закрывал 90% потребностей.
4. Персонализация.
ChatGPT помнил контекст разговора. Вы могли обсуждать тему, уточнять детали, возвращаться к предыдущим вопросам. Это создавало иллюзию настоящего диалога.
5. Эмоциональный интеллект.
Модель научилась не просто отвечать, а реагировать на эмоциональное состояние пользователя. Если ты писал грустное сообщение, она отвечала с сочувствием. Если злое – спокойно. Если весёлое – поддерживала игру.
Триумф: Мир после ChatGPT
После 30 ноября 2022 года мир разделился на «до» и «после».
Для обычных людей:
Появился помощник, который всегда под рукой. Школьники перестали писать сочинения сами (к ужасу учителей). Программисты получили шпаргалку по любому языку. Домохозяйки – генератор рецептов. Пенсионеры – собеседника, который не устаёт.
Для бизнеса:
Microsoft вложила в OpenAI миллиарды и встроила ChatGPT в Bing, Office, Windows. Началась гонка вооружений: Google спешно запускала Bard (позже Gemini), Anthropic выпускала Claude, Meta – Llama.
Для образования:
Учителя запаниковали. Как проверять домашние задания, если их может написать робот? Школы начали запрещать ChatGPT, а потом поняли, что запретить нельзя, и начали учить работать с ним.
Для журналистики:
Появились статьи, полностью написанные ИИ. Новостные порталы начали эксперименты с генерацией контента. Качество упало, но количество выросло.
Для творчества:
Писатели испугались за свою работу. Сценаристы в Голливуде бастовали, требуя ограничений на использование ИИ. Художники уже пережили шок от Midjourney, теперь пришла очередь текста.
Темная сторона: Проблемы, которые остались
Успех ChatGPT не отменил проблем.
1. Галлюцинации.
Модель до сих пор уверенно врёт. Она не знает границ своего незнания. Если её спросить о том, чего нет в данных, она придумает правдоподобную чушь. В юридической практике уже были случаи, когда адвокаты ссылались на несуществующие дела, придуманные ChatGPT.
2. Предвзятость.
Модель впитала все предрассудки интернета. Она может выдавать стереотипные ответы, дискриминировать группы, повторять опасные идеи. OpenAI ставит фильтры, но идеально отфильтровать невозможно.
3. Безопасность.
Люди пытаются взломать модель, заставить её говорить запрещённое (jailbreak). Иногда получается. Инструкции по изготовлению бомб, способы взлома, оскорбления – всё это можно вытянуть, если знать как.
4. Зависимость.
Люди перестают думать сами. Зачем запоминать, если можно спросить? Зачем анализировать, если можно получить готовый ответ? Это меняет когнитивные привычки целого поколения.
Наследие: Что останется в истории
ChatGPT войдёт в историю как точка бифуркации – момент, когда ИИ стал массовым.
Как изобретение книгопечатания изменило доступ к знаниям, как интернет изменил доступ к информации, так ChatGPT изменил доступ к интеллектуальному труду.
Впервые в истории у каждого человека появился личный ассистент с энциклопедическими знаниями. Бесплатно. Круглосуточно. На любом языке.
И это только начало.
Твой ход: Четыре урока от ChatGPT
– Важны не только знания, но и подача. GPT-3 была умной, но невоспитанной. ChatGPT победил потому, что его научили общаться. В любой сфере навыки коммуникации важнее чистой экспертизы.
– Бесплатность меняет правила игры. OpenAI сделала ставку на доступность, и это сработало. Иногда лучшая бизнес-стратегия – отдать продукт бесплатно и захватить рынок.
– Люди хотят общения. Даже когда мы знаем, что говорим с машиной, нам важно, чтобы она была вежливой, полезной, эмоциональной. Мы ищем человеческого даже в коде.
– Технология нейтральна, но применение – нет. ChatGPT можно использовать для учёбы и для списывания, для творчества и для обмана. Выбор за тобой.
P.S.
Знаешь, что написал один пользователь в твиттере через неделю после запуска?
«Я сегодня разговаривал с ChatGPT три часа. О чём угодно. Он умнее большинства моих знакомых. И он никогда не устаёт от меня. Это одновременно прекрасно и пугающе».