Читать книгу Mick Prod — Cognitive OS. Книга о памяти, длительности и рождении личных ИИ-систем - Ар'лан ис'Дрекхэм - Страница 10

Пролог. Долгая искра Глава 7. Почему рынок полюбил дорогие иллюзии

Почти каждое новое технологическое направление проходит одинаковую рыночную фазу. Сначала все влюбляются не в сущность, а в самый зрелищный симптом сущности. С ИИ-агентами произошло именно это. Как только модель научилась вызывать инструменты, работать шагами и внешне вести себя самостоятельнее обычного чата, слово «агент» мгновенно стало магнитом для ожиданий.

Это не было чистым самообманом. Инженерный сдвиг действительно случился. Работы вроде ReAct и Toolformer показали, что модель может не только отвечать, но и действовать. Платформы начали строить наборы разработки, оркестраторы и более длинные рабочие циклы. Со стороны это выглядело как быстрое приближение к следующему классу систем.

Но в этой волне с самого начала сидел один дефект: демонстрация плохо показывает длительность. На сцене видно, как агент делает шаг, вызывает браузер, пишет в таблицу, перебирает варианты. Не видно другого: что с ним происходит на десятой неделе, как он стареет между циклами, что остаётся от его удачных различений после паузы и как быстро человек начинает платить за его забывание собственной внутренней энергией.

Демо-сцена вообще не обязана врать. Ей достаточно не доживать до десятой недели.

Ранний рынок любил именно такие системы, потому что они были выгодны сразу в двух отношениях. Во-первых, их легко было показывать. Во-вторых, они почти не выдавали скрытый человеческий труд, на котором держались. За многими ранними «автономными» контурами стояли часы ручной подстройки, отбора хороших примеров, мягкого перезапуска циклов, подчищенного контекста и человеческой коррекции там, где система ещё не умела нести себя сама. Пока агент жил на сцене, этот труд почти не бросался в глаза. В реальной эксплуатации он быстро превращался в скрытый счёт.

Отсюда и выросли дорогие иллюзии. Рынок принял хорошо организованный внешний эффект за зрелую агентность. На короткой дистанции такая ошибка почти неизбежна. Легче всего монетизируется то, что быстро производит впечатление: вызов инструмента, цепочка действий, ансамбль ролей, локальная автономия, красивый след рассуждения. Намного труднее продавать свойство, которое раскрывается только через недели: более дешёвое возвращение к важному, аккуратное старение памяти, перенос значимости, право на паузу без распада.

Взросление индустрии началось именно в тот момент, когда этого эффекта стало недостаточно. Прикладные команды столкнулись с вещами, которые плохо помещаются в раннюю демонстрацию: длинный горизонт, накопление ошибок, деградация после сотен циклов, дорогой возврат, скрытая цена ручного сопровождения. Отсюда и новый язык среды. Anthropic стала жёстче говорить о проверках длинных задач и о том, как локально разумные шаги расходятся с реальностью на дистанции. OpenAI, со своей стороны, стала нормализовать язык сессий, состояния, уплотнения истории, трассировки и human in the loop. Это не означает, что проблема уже решена. Но это означает, что сама индустрия перестала верить в волшебство одного запроса.

Здесь важно не перепутать признание проблемы с её решением. Длинная сессия ещё не равна длительности. Журнал действий ещё не равен биографии значимости. Вызов инструмента ещё не равен внутренней линии. Можно иметь хороший оркестратор и всё равно жить в цикле дорогостоящего забывания. По этой причине ранняя агентность оказалась сильнее как сценическое искусство, чем как длительная инженерия.

Полезно различать две зрелости. Первая, сценическая, отвечает на вопрос, может ли система быстро произвести впечатление собранного агента. Вторая, жизненная, отвечает на другой вопрос: можно ли рядом с ней долго жить, не превращая собственную работу в обслуживание её слабостей. Между ними нет автоматического перехода. Ранние системы часто выглядели умнее ещё и потому, что большую часть непрерывности за них молча нес сам пользователь. Он помнил, где агент уже ошибался, что пришлось править вручную и какую ветку нельзя поднимать заново.

Именно здесь рынок и начал любить дорогие иллюзии. Не потому, что он был глуп, а потому, что зрелищное почти всегда легче измерять раньше, чем устойчивое. Можно посчитать точность ответа, число вызовов, длину цикла, цену шага. Намного труднее честно измерить цену возвращения, судьбу ослабленных гипотез, право на паузу, способность пережить неделю молчания и не превратиться в капризную нагрузку на внимание.

Отсюда следует неприятный, но полезный вывод. Первая волна агентности была необходимой. Она вывела индустрию за пределы простого чата, научила модели действовать и породила языки координации. Но именно поэтому теперь уже видно её историческое ограничение: она слишком часто мыслила систему как серию действий, а не как длительность. Как только это различие становится видимым, память перестаёт быть удобной надстройкой, а состояние и переносимость перестают казаться техническими мелочами.

Вот почему на новом фоне YAR и затем Mick Prod начинают выглядеть не экзотикой, а ранней разведкой следующего уровня зрелости. Они не выигрывают первый раунд зрелищности. Зато они первыми начинают спрашивать о том, что позже оказывается главным: кто владеет памятью, как система переживает паузу, как переносит исправление, как отличает факт от гипотезы и может ли вообще не рождаться заново при каждом обращении.

Mick Prod — Cognitive OS. Книга о памяти, длительности и рождении личных ИИ-систем

Подняться наверх