Читать книгу Гений кода. Истории самых впечатляющих ИИ-проектов, которые уже меняют жизнь - Ар'лан ис'Дрекхэм - Страница 11

Часть 2: Рождение титанов. Истории прорывов, изменивших правила игры
Глава 10. GANs (Состязательные сети): История про художника и критика, которые создают идеальные подделки

Оглавление

Крючок: Лицо, которого нет

Зайди на сайт ThisPersonDoesNotExist.com. Нажми F5. Ты увидишь лицо человека. Красивого, живого, с морщинками, родинками, эмоциями. Нажми ещё раз – новое лицо. Ещё раз – новое.

Ни одного из этих людей не существует в реальности. Никогда не существовало. Это чистая генерация нейросети. Они не родились, не ходили в школу, не любили, не страдали. Их просто нарисовала машина.

А теперь самое страшное: ты не можешь отличить их от реальных фотографий. Твой мозг обманут. И это сделала технология под названием GAN.

Герой: Канадец, которого достала скука

История GAN началась в 2014 году в Монреале. Молодой исследователь по имени Ян Гудфеллоу (Ian Goodfellow) работал в лаборатории знаменитого Йошуа Бенжио (одного из «трёх китов» глубокого обучения).

По легенде (а Гудфеллоу подтверждает её в интервью), идея пришла к нему в баре.

Они сидели с друзьями после защиты диссертации одного из коллег. Разговор зашёл о нейросетях, и кто-то сказал: «Всё, что мы умеем – это классифицировать и предсказывать. Мы не умеем создавать новое. Машины не творческие».

Ян задумался. А что, если заставить две нейросети соревноваться? Что, если одна будет пытаться обмануть другую? Он достал ноутбук, прямо в баре начал писать код и к утру у него была работающая версия.

Это был момент истинной гениальности – не в лаборатории, не на суперкомпьютере, а в баре за кружкой пива.

Конфликт: Почему машины не умели творить

До GAN всё, что умели нейросети – это распознавать и классифицировать. Они смотрели на картинку и говорили: «Это кот», «Это не кот». Они были как искусствоведы, которые могут отличить Пикассо от Матисса, но сами нарисовать не могут.

Задача генерации (создания нового) казалась неразрешимой. Потому что «правильного ответа» нет. Как проверить, хорошую картинку нарисовала нейросеть или плохую? Кто судья?

Можно было попробовать обучить сеть срисовывать с примеров. Но тогда она просто запоминала картинки и выдавала их копии с шумом. Это не творчество, это плагиат.

Нужен был принципиально новый подход.

Развязка: Гениальная дуэль

Ян Гудфеллоу придумал гениально простую конструкцию. Он взял две нейросети и поставил их играть в игру с нулевой суммой (кто выиграл, тот и съел).

Игрок 1: Генератор (Художник-фальшивомонетчик).

Это нейросеть, которая учится создавать подделки. На входе она получает случайный шум (набор случайных чисел). На выходе выдаёт картинку. Сначала это просто цветной мусор, абстракция, похожая на телевизионные помехи.

Игрок 2: Дискриминатор (Критик-искусствовед).

Это нейросеть, которая учится отличать подлинники от подделок. Ей показывают и настоящие фотографии из базы данных, и творения Генератора. Она должна сказать: «Настоящее» или «Подделка».

Правила игры:

– Генератор создаёт подделку.

– Дискриминатор оценивает: «Фу, ерунда, видно же, что подделка».

– Генератор получает по носу (штраф) и подкручивает свои настройки, чтобы в следующий раз обмануть критика лучше.

– Дискриминатор тоже учится: если его обманули, он подкручивает свои настройки, чтобы стать более придирчивым.

– И так миллион раз.

Эволюция:

– Раунд 1: Генератор рисует серое месиво. Дискриминатор смеётся: «Это подделка, 100%».

– Раунд 1000: Генератор рисует что-то, отдалённо похожее на размытое лицо. Дискриминатор говорит: «Сомнительно, но похоже на подделку».

– Раунд 1 000 000: Генератор рисует идеальное фото человека. Дискриминатор в панике: «Я не знаю… может, настоящее?».

Когда игра доходит до конца, наступает равновесие Нэша (то самое, из «Игр разума» про Джона Нэша): Дискриминатор уже не может отличить подделку от оригинала, потому что Генератор научился создавать идеальные копии.

Инсайт: Почему это гениально

Гениальность GAN в том, что критик обучается вместе с художником.

В обычной нейросети ты фиксируешь «правильные ответы» и учишь сеть под них подстраиваться. В GAN нет фиксированных ответов. Есть только вечная гонка вооружений. Дискриминатор становится всё более требовательным, и Генератор вынужден становиться всё более искусным, чтобы его обмануть.

Это как если бы ты учился рисовать, а твоим учителем был самый придирчивый искусствовед в мире, который с каждым твоим успехом становился бы ещё придирчивее.

Эволюция: От размытых лиц к фотореализму

Первые GAN в 2014 году выдавали ужасное качество. Лица были размытыми, с плавающими глазами, с тремя ушами. Но сообщество исследователей подхватило идею, и началась эволюция.

DCGAN (2015): Добавили свёрточные слои (те, что из AlexNet). Картинки стали чётче, появилась структура.

CycleGAN (2017): Научилась превращать лошадей в зебр, лето в зиму, эскизы в фото. Без парных примеров! Просто берёт два набора картинок (сотни фото лошадей и сотни фото зебр) и учится переводить одно в другое.

StyleGAN (2018) от NVIDIA: Прорыв года. StyleGAN научилась генерировать лица в супер-высоком разрешении, с контролем стиля. Хочешь, чтобы у человека были веснушки? Пожалуйста. Хочешь изменить возраст? Легко. Хочешь повернуть голову? Без проблем. Именно StyleGAN лежит в основе сайта ThisPersonDoesNotExist.com.

BigGAN (2019): Научилась генерировать не только лица, а вообще всё: собак, цветы, еду, пейзажи. Качество стало почти фотографическим.

Темная сторона: Империя фейков

Как только GAN научились создавать неотличимые от реальности изображения, начался кошмар.

1. Deepfakes (дипфейки).

Самое известное (и страшное) применение. Люди начали накладывать лица знаменитостей на порно-ролики. Потом – лица политиков на видео, где они говорят то, чего никогда не говорили. Потом – лица обычных людей. Теперь любой человек с видеокартой может «заставить» любого другого человека сказать что угодно.

2. Фейковые новости.

Представь фотографию, на которой президенты пожимают руки врагам. Или солдаты совершают военные преступления. Фотошоп раньше был заметен. StyleGAN создаёт фото, которые не отличить от настоящих. Доказательств больше не существует.

3. Кража личности.

Мошенники создают фейковые профили в соцсетях с лицами несуществующих людей. Они выглядят привлекательно, ведут переписку, втираются в доверие и выманивают деньги. Жертва даже не подозревает, что человека, с которым она общалась месяц, не существует в природе.

4. Порноместь.

Самый страшный пункт. Люди начали генерировать порнографические изображения с лицами своих бывших партнёров или одноклассников, а потом распространять их в интернете. Жертва не может доказать, что это не она, потому что фото выглядит идеально реалистично.

Борьба: Охотники за фейками

Парадокс GAN в том, что те же самые технологии используются для борьбы с фейками.

– Создаются детекторы дипфейков, которые ищут микро-артефакты: как бьётся пульс на видео (дипфейки не умеют имитировать кровоток), как отражается свет в глазах, как двигаются ресницы.

– Компании вроде Microsoft вкладывают миллионы в создание «водяных знаков» для настоящих видео.

– Учёные разрабатывают методы, которые позволяют определить, какой именно GAN создал картинку (у каждой архитектуры есть свой «почерк»).

Но это гонка без финиша. Как только детекторы учатся ловить один тип фейков, GAN учатся их обходить.

Наследие: Эра пост-правды

Что оставили нам GAN?

Для творчества:

Теперь любой человек может создать иллюстрацию, дизайн, концепт-арт. Достаточно набросать эскиз, а GAN дорисует в любом стиле. Дизайнеры используют GAN для генерации текстур, узоров, вариаций. Это инструмент, как фотошоп, только в тысячу раз мощнее.

Для науки:

GAN используют для создания новых молекул (лекарств), для улучшения снимков МРТ (делают чётче без дополнительного облучения), для восстановления старых фотографий.

Для общества:

Мы вступили в эру, где видеть – больше не значит верить. Фотография перестала быть доказательством. Любое изображение может быть подделкой. Это требует от нас нового уровня критического мышления.

Твой ход: Четыре урока от GAN

– Конкуренция рождает качество. Генератор и Дискриминатор стали гениями только потому, что соревновались. В жизни тоже: здоровый конфликт, обратная связь от «критика» делает тебя лучше.

– Творчество – это комбинация. GAN не создают из ничего. Они комбинируют элементы из миллионов примеров. Твоё творчество – тоже переработка опыта. Не бойся заимствовать и смешивать.

– Инструмент нейтрален. Молотком можно забить гвоздь, а можно разбить голову. GAN можно использовать для лечения рака и для разрушения репутаций. Выбор за тобой.

– Проверяй реальность. Если увидел скандальное фото или видео в интернете – не верь сразу. Ищи источник, смотри на детали, включай критическое мышление. Мир стал сложнее.

P.S.

Знаешь, что сказал Ян Гудфеллоу, когда его спросили про дипфейки и фейковые новости?

«Я создавал технологию, чтобы машины могли творить. Я не думал о злоумышленниках. Но науку не остановить. Мы должны учить людей думать, а не запрещать технологии».

Генератор и Критик продолжают свою вечную дуэль. Художник становится лучше, критик – придирчивее. И кто знает, может быть, через несколько лет мы уже не сможем отличить реальность от вымысла никогда.

Гений кода. Истории самых впечатляющих ИИ-проектов, которые уже меняют жизнь

Подняться наверх