Читать книгу Гений кода. Истории самых впечатляющих ИИ-проектов, которые уже меняют жизнь - Ар'лан ис'Дрекхэм - Страница 5
Часть 1: Введение. Как читать эту книгу, чтобы изменить мышление
Глава 4. Краткий ликбез: Что такое нейросеть на пальцах (Объяснение 5-летнему ребенку)
ОглавлениеЕсли ты откроешь учебник по машинному обучению, ты утонешь в математике. Градиентный спуск, функции активации, обратное распространение ошибки… Глаза закатываются, мозг плавится.
Но давай честно: чтобы понимать, как работают гениальные проекты, и чтобы применять их в жизни, тебе не нужно защищать диссертацию по высшей математике. Тебе нужно понять суть.
Поэтому выключи режим «ученика», который должен всё запомнить. Включи режим «любопытного человека». И представь, что мы сидим на кухне с чашкой чая.
Метафора первая: Ребёнок и котик
Представь маленького ребёнка. Он никогда в жизни не видел кота. Ты показываешь ему картинку с рыжим пушистым котом и говоришь: «Это кот».
Потом ты показываешь другую картинку – с чёрным гладкошерстным котом. Ребёнок думает: «Хм, цвет другой, шерсть короче, но уши похожи, и нос мокрый. Наверное, тоже кот».
Потом ты показываешь ему собаку. Ребёнок говорит: «Уши висят, язык высунут, хвост виляет. Непохоже на тех двух. Наверное, это не кот».
Позже ты показываешь тигра в книжке. Ребёнок в ужасе: «Полосатый, большой, но морда знакомая! Это огромный опасный кот!».
Вот ровно так же учится нейросеть.
– Ты показываешь ей тысячи фотографий котов (это данные).
– Ты говоришь: «Вот это – кот, а это – не кот» (это разметка).
– Нейросеть пытается угадать. Сначала она ошибается 100 раз подряд, думая, что кот – это всё подряд (колёса от машины, тарелки, люди). Но с каждой ошибкой она чуть-чуть подкручивает свои внутренние настройки, чтобы в следующий раз ошибиться меньше.
– И через тысячи попыток она вдруг начинает угадывать правильно.
Суть: Нейросеть – это не программа, которой написали правила «как выглядит кот». Это программа, которая сама вывела правила, глядя на миллион примеров.
Метафора вторая: Овощной рынок и торговка
Теперь давай заглянем внутрь нейросети. Что там?
Представь старую торговку на рынке, бабу Машу. У неё феноменальное чутьё на качество помидоров. Ты подносишь помидор, она сжимает его, нюхает, смотрит на свет и выдаёт вердикт: «Бери, сладкий» или «Не бери, кислый, пластмассовый».
Как у неё это получается? У неё внутри есть огромный опыт (те же миллионы примеров). И есть набор простых вопросов, которые она задаёт себе мгновенно:
– Вопрос первый: Цвет? (Если зелёный – сразу «нет», если красный – идём дальше).
– Вопрос второй: Упругость? (Если твёрдый как камень – «нет», если мягкий – идём дальше).
– Вопрос третий: Запах? (Если пахнет землёй – «да», если ничем не пахнет – «нет»).
Этот список вопросов называется слои нейросети. Каждый вопрос – это нейрон. Ответы на вопросы передаются дальше по цепочке.
Вот так и нейросеть. Она не думает абстрактно. Она просто проводит объект (картинку, текст, звук) через множество простых фильтров-вопросов и на выходе выдаёт ответ.
Метафора третья: Слепой скульптор (Как нейросеть обучается)
Самый сложный для понимания момент – как именно нейросеть «подкручивает настройки»? Тут поможет метафора слепого скульптора.
Представь, что тебе завязали глаза и дали кусок глины. Рядом стоит скульптура идеального кота (это идеал), но тебе её не дают трогать. Ты должен вылепить свою копию, но проверять результат будешь только на ощупь.
– Ты лепишь что-то. Подходит эксперт (это функция потерь) и трогает твою поделку. Он говорит: «Плохо. Ухо должно быть здесь, на 2 сантиметра левее». (Это ошибка).
– Ты сдвигаешь ухо. Эксперт снова трогает: «Лучше, но хвост коротковат, добавь длины».
– Ты добавляешь. Эксперт: «Хорошо, но нос слишком курносый, сделай чуть прямее».
Ты делаешь так тысячи раз, пока эксперт не скажет: «Всё, отпускай повязку, смотри – получилось!».
В мире нейросетей роль «эксперта с завязанными глазами» выполняет математический алгоритм. Он не знает, как выглядит идеал, но он знает, как посчитать разницу между тем, что получилось, и тем, что должно было получиться. И он даёт команду: «нейрон №5, увеличь свою чувствительность на 0,001%, а нейрон №6, наоборот, уменьшь». Это называется обратное распространение ошибки.
Метафора четвёртая (и самая простая): Шеф-повар и суп
Самое понятное объяснение того, чем ИИ отличается от обычной программы.
Обычная программа (как повар по книге):
Ты даёшь повару книгу рецептов. Там написано: «Возьми 2 яйца, 100 грамм муки, 50 грамм сахара, взбей, пеки 30 минут». Повар чётко выполняет. Если яйца будут мелкими, пирог может не получиться, но повар сделает всё как написано. Это программирование: ты даёшь правила, компьютер даёт результат.
Нейросеть (как повар, который учится готовить сам):
Ты приводишь повара на кухню и говоришь: «Вот продукты. Я хочу получить вот такой пирог (показываешь картинку идеального торта). Пробуй. Если получится невкусно – я скажу». Повар мешает как попало, печёт, ты пробуешь: «Фу, гадость». Повар меняет пропорции, печёт снова. Ты: «Лучше, но всё сырое внутри». И так 1000 раз. В итоге повар находит идеальную комбинацию, сам, без рецепта. Это обучение: ты даёшь примеры результата, компьютер сам находит правила.
Разрушаем главный миф
После этих метафор ты уже понял главное, но я скажу это прямо:
Нейросеть НЕ думает. Нейросеть НЕ понимает смысла. Нейросеть просто УГАДЫВАЕТ на основе прошлого опыта.
Когда ChatGPT пишет тебе стихи, он не чувствует вдохновения. Он просто перебирает миллиарды комбинаций слов, которые люди уже использовали в похожих ситуациях, и выдаёт самую вероятную.
Это как умный попугай, который слышал столько разговоров, что научился вставлять слова к месту, но понятия не имеет, что они значат.
Итог главы: Словарик для смелых
Теперь, когда мы прошли через метафоры, ты готов к трём терминам, которые будешь встречать в книге. Не пугайся их, за каждым стоит простая картинка из нашей главы.
– Нейросеть (НС) – это просто программа, которая учится на примерах, как ребёнок, а не действует по инструкции.
– Обучение – это процесс «подкручивания настроек» тысячи раз, пока ошибка не станет маленькой (как слепой скульптор).
– Данные – это те самые примеры (фотографии котов, тексты книг, голоса людей), на которых нейросеть учится. Чем больше и качественнее данные – тем умнее сеть.
Вот и всё. Теперь ты знаешь о нейросетях достаточно, чтобы понимать 90% новостей и проектов. Остальное – это просто масштаб (больше слоёв, больше данных, быстрее компьютеры).
А теперь, когда страха нет (мы поняли, что это просто сумасшедший угадайщик), инструменты есть (метод трёх проекций), память готова (мы знаем про истории), и база заложена (нейросеть – это просто сложный калькулятор)…
Мы готовы к настоящим героям!
Следующая глава будет про проект, с которого всё началось. Про студентов, которые перевернули мир компьютерного зрения с двумя видеокартами.