Читать книгу Гений кода. Истории самых впечатляющих ИИ-проектов, которые уже меняют жизнь - Ар'лан ис'Дрекхэм - Страница 8

Часть 2: Рождение титанов. Истории прорывов, изменивших правила игры
Глава 7. AlphaGo и матч с Ли Седолем: «Божественный ход», который потряс человечество

Оглавление

Крючок: 15 секунд, изменивших всё

9 марта 2016 года, Сеул. В конференц-зале отеля «Фор Сизонс» тишина, которую нарушает только стук камней о деревянную доску. За столом сидит Ли Седоль – легенда, 18-кратный чемпион мира по игре Го, живое национальное достояние Кореи. Напротив него – пустота. Только камера, направленная на доску, и динамик, через который транслируются ходы соперника.

Соперник – программа AlphaGo, созданная британской компанией DeepMind, которую недавно купил Google.

Идёт вторая партия. Счёт 0:1 в пользу AlphaGo – Ли Седоль уже проиграл первую партию, что само по себе было шоком. Но сейчас, на 37-м ходу второй партии, происходит нечто странное.

AlphaGo делает ход. Камень ложится в точку, которую комментаторы называют «невозможной». Один из профессиональных игроков, комментирующий матч в прямом эфире, говорит: «Это ошибка. Программа сломалась. Так не ходят люди».

Ли Седоль на мгновение замирает. Ему нужно принять решение. Он не знает, что этот ход войдёт в историю под именем «Божественный ход». Он не знает, что этот момент изменит всё.

Он выходит из зала покурить. Ему нужно подумать.

А в это время по всему миру трансляцию смотрят миллионы людей, и никто ещё не понимает: они стали свидетелями момента, когда машина сделала то, что не мог сделать ни один человек за тысячелетия игры.

Герой: Последний бастион человеческого разума

Чтобы понять драму, нужно понять, что такое игра Го.

Го – это древняя китайская игра, которой больше 2500 лет. Правила просты: два игрока ставят чёрные и белые камни на пересечения линий, пытаясь окружить территорию. Но сложность этой игры – космическая.

В шахматах после каждого хода есть около 35 вариантов. В Го – 250 вариантов. Количество возможных позиций в Го больше, чем количество атомов во Вселенной. Тысячелетиями считалось, что машина никогда не сможет обыграть человека в Го, потому что здесь нужна не просто сила перебора, а интуиция. Чувство красоты. Понимание формы.

Ли Седоль был воплощением этой интуиции. Он стал профессионалом в 12 лет. Он выигрывал всё, что можно. В Корее его боготворили. Когда стало известно о матче с программой, он был уверен в победе. «Я выиграю 5:0 или 4:1», – сказал он перед началом. «Люди интуитивно чувствуют игру, а машина – нет».

Он не знал, что через несколько дней будет плакать.

Конфликт: Две философии интеллекта

AlphaGo, созданная командой Демиса Хассабиса (того самого, что играл в Atari), была принципиально новой машиной. Она не была «запрограммирована» на игру в Го. Её учили по-другому.

Как учили AlphaGo:

– Сначала она смотрела на людей. Ей скормили 30 миллионов ходов, сделанных профессиональными игроками. Она училась предсказывать: «Если позиция такая, то человек скорее всего сходит сюда». Это называется обучение с учителем. Она впитала всю мудрость человечества за 2500 лет.

– Потом она начала играть сама с собой. Миллионы партий, днём и ночью, без остановки. Она играла с копией себя, училась на своих ошибках, находила новые стратегии, которые никогда не приходили в голову людям. Это называется обучение с подкреплением.

– У неё были две нейросети внутри. Одна – «Политика» – предлагала, куда сходить. Вторая – «Ценность» – оценивала, насколько хороша позиция в долгосрочной перспективе. Они спорили друг с другом, и рождалась истина.

К марту 2016 года AlphaGo сыграла сама с собой столько партий, сколько человек не сыграет за миллион лет.

Развязка: Пять партий, потрясших мир

Матч из пяти партий транслировался на видеохостинге. Комментаторами были профессиональные игроки Го. Зрителями – весь мир.

Партия 1: Шок

AlphaGo выиграла. Ли Седоль ошибался? Нет, он играл сильно. Но программа играла сильнее. Мир ахнул, но решил: «Первая партия, разведка. Дальше будет легче».

Партия 2: Божественный ход (37-й ход)

И вот он, тот самый момент. 37-й ход чёрными. AlphaGo поставила камень в точку, которая считалась не просто плохой, а немыслимой для профессионалов. Комментаторы в студии сказали: «Это ошибка программы». Они даже попытались найти объяснение: «Может, там баг?».

Но по мере развития партии стало понятно: это был не баг. Это был гений. Этот камень оказался ключевым. Он создавал невидимые глазу человека угрозы на 50 ходов вперёд. Комментаторы замолчали, потом начали говорить: «Мы никогда не видели такого хода за 1000 лет игры».

Ли Седоль проиграл вторую партию. Счёт 0:2.

Партия 3: Унижение

Третья партия. Ли Седоль играет изо всех сил, но AlphaGo снова побеждает. Счёт 0:3. Матч проигран досрочно. В зале тишина. Ли Седоль выглядит потерянным. Он извиняется перед зрителями. Он говорит: «Я чувствую себя бессильным».

Партия 4: Слёзы и триумф человека

И тут происходит то, чего не ждал никто. Ли Седоль собирается. Он делает ход, который потом назовут «Ход Бога» (или «Ход Ли Седоля»). На 78-м ходу четвёртой партии он ставит камень в сложнейшую позицию.

AlphaGo сбивается. Программа, которая никогда не ошибается, начинает делать странные ходы. Алгоритм подсчёта вероятности победы резко падает. Впервые за матч AlphaGo проигрывает.

Ли Седоль выигрывает. Он плачет. Зал аплодирует стоя. Комментаторы рыдают в эфире. Человек победил машину.

Партия 5: Финал

Пятая партия была напряжённой, но AlphaGo восстановилась и выиграла. Итог матча: 4:1 в пользу машины.

Инсайт: Что случилось с AlphaGo в четвёртой партии?

Почему машина, которая обыграла чемпиона, вдруг проиграла? Ответ прост и сложен одновременно.

Ход Ли Седоля был настолько нестандартным, настолько человечным, что вывел AlphaGo из зоны комфорта. Программа не видела такого хода в миллионах партий, которые она сыграла сама с собой. Она просто не знала, как на него реагировать. Это был творческий акт, который сломал алгоритм.

Демис Хассабис потом скажет: «Это был гениальный ход. Ли Седоль нашёл единственную слабость в нашей системе. Он играл как человек, а не как машина».

Божественный ход (37-й) – взгляд изнутри

А что насчёт того самого 37-го хода? Почему его назвали божественным?

Профессиональные игроки Го объясняют это так: человек мыслит «паттернами». Мы видим привычные формы, стандартные построения. Мы знаем, что «так не ходят», потому что так не учили.

AlphaGo не знала слова «нельзя». Она просто посчитала вероятности. И вероятность победы при этом ходе оказалась выше, чем при «правильных» ходах. Она нашла решение, которое лежало за пределами человеческого опыта.

Это был момент, когда машина показала человеку: «Ваша мудрость, накопленная веками, – это лишь частный случай. Есть другие миры, о которых вы даже не догадываетесь».

Наследие: После матча

Что стало с героями?

AlphaGo больше никогда не играла с людьми. DeepMind объявила о «выходе на пенсию» программы в 2017 году. Но перед этим она сыграла с собой 50 партий, которые были опубликованы как «шедевры». Сегодня любой игрок может изучать эти партии, как шахматисты изучают партии Каспарова. AlphaGo изменила игру Го навсегда. Появились новые дебюты, новые стратегии. Люди стали играть лучше, глядя на машину.

Ли Седоль ушёл из профессионального спорта в 2019 году. Он сказал: «С появлением ИИ понял, что я больше не на вершине. Есть существо, которое невозможно победить». Но в 2023 году он объявил о возвращении, чтобы сыграть с… другими людьми. С машинами он больше никогда не играл. В интервью он говорит, что гордится той одной победой, потому что это была победа человеческого духа.

Человечество получило важнейший урок. Мы поняли, что интуиция – это не магия. Это тоже результат обработки данных, просто очень быстрой и неосознаваемой. И что машины могут создавать новое, то, чего не было в обучающей выборке.

Твой ход: Четыре урока от Ли Седоля и AlphaGo

– Не бойся выходить за рамки. 37-й ход AlphaGo был невозможен с точки зрения традиции. Но он сработал. В твоей работе, творчестве, жизни – ищи «невозможные ходы».

– Цени человеческое. Ход Ли Седоля в четвёртой партии был гениален именно потому, что был человеческим. Нестандартным, интуитивным, отчаянным. Машины учатся на данных. Люди умеют делать то, чему их не учили.

– Учись у машин. Сегодня профессиональные игроки в Го изучают партии AlphaGo. Ты тоже можешь смотреть, как ИИ пишет код, рисует или пишет тексты, и находить там новые приёмы.

– Принимай поражение с достоинством. Ли Седоль проиграл, но не сломался. Он выиграл одну партию, и этого хватило, чтобы войти в историю. Иногда одна победа важнее десяти титулов.

P.S.

Когда Ли Седоля спросили, что он чувствовал после 37-го хода во второй партии, он ответил:

«Сначала я подумал, что это ошибка. Потом я подумал, что надо покурить. А потом я понял, что смотрю на доску и не понимаю, что происходит. Я играл в Го 30 лет, но никогда не видел такой красоты».

Это и есть момент встречи человека и сверхинтеллекта – когда ты перестаёшь бояться и начинаешь восхищаться.

Гений кода. Истории самых впечатляющих ИИ-проектов, которые уже меняют жизнь

Подняться наверх