Читать книгу Футурология: Краткий курс - Алексей Андреев - Страница 7

Часть 1. Предсказывающий мозг
Профилирование

Оглавление

Однажды в провинциальной электричке ко мне пристала цыганка. Я отказался позолотить ей ручку, и тогда она начала вещать о том, какие гадости ждут меня в будущем. Но я не остался в долгу и сказал, что у неё какая-то нехорошая родинка на губе, возможен рак, надо бы провериться у онколога… Это сразу охладило провидческий пыл цыганки, и наш разговор о будущем закончился.

В предисловии к этой книге прозвучало формальное определение прогноза как некого отдельного процесса, в котором вырабатываются представления «о возможных состояниях объекта в будущем». Но многие приведённые здесь примеры – это состязание предсказательных систем: мухоловка и муха, теннисист и его соперник, неандертальцы и сапиенсы, и наконец, мы с цыганкой. И хотя футурология обычно подразумевает исследование будущего социумов, мы не можем пройти мимо такой волнующей темы, как моделирование личности.

По-английски это называется “theory of mind”, поэтому в русскоязычных публикациях, созданных с помощью машинного переводчика и мясного редактора, вы можете встретить выражение «теория разума». Однако слово «теория» у нас обычно ассоциируется с наукой, в то время как “theory of mind” – это набор внутренних представлений о другом человеке, и эти представления не обязаны быть научными. Столь же неудачно использование слова «разум», поскольку адекватное моделирование психики человека должно включать не только его рациональное мышление, но и его чувства, страхи, неявные желания и т.д.

Считается, что для развития этой способности требуется многолетний опыт общения, поэтому у детей до 3 лет таких моделей ещё нет. Вопрос про животных остаётся открытым, но судя по некоторых экспериментам, шимпанзе такое могут [16].

Есть разные гипотезы о том, как развивается такое умение. Наиболее популярна сейчас теория подражания, согласно которой дети обучаются предсказывать убеждения других, мысленно имитируя их (представляя себя на их месте). Это напоминает палеопсихологию Поршнева, который считал, что перволюди манипулировали своими жертвами благодаря супер-способности к имитации, а дальнейшее противоборство предсказательных моделей привело к появлению языка, абстрактного мышления и самосознания (модели самого себя).

Целенаправленное моделирование психики человека для прогнозирования его поведения также называют «профилированием» или «профайлингом». Криминалистам это помогает ловить преступников или даже выявлять будущих преступников, которые ещё ничего не совершили. А спецслужбы используют такое персональное прогнозирование, чтобы вербовать агентов, используя их личные слабости. Как это работает, наглядно показано в сериалах «Обмани меня» и «Бюро легенд».

Преступники тоже используют такие методы. На смену уличным цыганкам пришли инфоцыгане с различными схемами разводок через Интернет. Вот забавный пример: любитель играть на бирже спортивных ставок получает письмо от человека, который утверждает, что умеет предсказывать исход соревнований. Предсказатель делает это за деньги, но для демонстрации своих способностей он предлагает вам два бесплатных прогноза: в футбольном матче между командами A и Б победит А, а в поединке боксёров С и Д выиграет Д.

Любитель ставок дожидается указанных соревнований – и видит, что оба прогноза сбылись (А и Д выиграли). Пожалуй, стоит заплатить такому хорошему предсказателю, ведь его советы помогут делать выгодные ставки!

На самом деле, никакого предсказания здесь не было. Мошенник просто разослал множество писем со всеми вариантами исходов: одна группа адресатов получила вариант АД, другая – АС, третья – БД, четвертая – БС. Для трёх групп прогнозы не сбылись, и они просто проигнорировали эти письма счастья. Но наш любитель ставок оказался в первой группе «счастливчиков». И мошенник знает особенность людей этой группы: с их точки зрения, предсказания сбылись, а значит, у них можно выманить деньги.

У хакеров есть понятие «социальная инженерия», это почти же самое: знание человеческой психологии и некоторых персональных данных для выманивания денег или ценной информации. Наиболее популярный метод – прицельный фишинг (spear phishing), когда человеку присылают поддельное письмо от имени сервиса, которым он пользуется, или от имени партнёра по бизнесу. Поддавшись на такой обман, человек либо открывает приложенный файл с вирусом, либо переводит деньги на указанный в письме неправильный счёт (то есть мошеннику, а не партнёру), либо идёт по ссылке на фальшивый сайт и вводит там логин и пароль, которые опять-таки попадают к хакерам.

Мне, например, присылали предложение срочно оплатить мой домен fuga.ru, причём именно в тот день, когда действительно закончился оплаченный период. Это значит, что мошенники выкачали базу доменного регистратора со всеми данными о владельцах сайтов, а после прицельно атаковали этих людей именно в те дни, когда нужно внести оплату за следующий год.

Однако самый массовый вид сетевого профилирования не считается у нас преступлением: это персонально заточенные рекламные атаки. Наиболее впечатляющее переобувание в этой сфере проделали поисковые системы. В конце 90-х Google и «Яндекс» представляли собой программы, которые находят для пользователя веб-страницы по заданным ключевым словам. Но вскоре этим сервисам понадобилось как-то зарабатывать, и они развернули всю мощь своих поисковых алгоритмов в обратную сторону: теперь они стали выслеживать пользователей для рекламных агентств, желающих показать рекламу по ключевым словам пользователя, то есть по его интересам.

Затем аналогичным бизнесом занялись социальные сети, а также компании, добывающие персональные данные из социальных сетей. Основанное бывшими британскими шпионами консалтинговое агентство Cambridge Analytica «профилировало» более 50 миллионов пользователей сервиса F***book, чтобы затем показывать им таргетированную политическую рекламу в преддверии президентских выборов в США в 2016 году. Сегодня любой бесплатный интернет-сервис можно заподозрить в том, что его основной доход построен на сборе персональных данных для моделирования личности и последующих скрытых манипуляций.

Впрочем, бывают проекты, куда люди сами приходят за услугами персональных прогнозов. Астрологов мы пропустим (хотя Луна безусловно влияет на психику), перейдём сразу к современным примерам.

В 2006 году я участвовал в разработке сервиса MamaSMS для будущих мам. Работал он так: вы посылаете на короткий номер дату своей последней овуляции, после чего каждый день получаете советы по ведению беременности в виде шуточных SMS-сообщений от растущего малыша. Многие удивлялись, насколько точно сбываются эти прогнозы: стоило девушке получить сообщение «Мама, извини, на этой неделе я начну пинаться!» – и правда, спустя день-два в животе начиналась движуха. А всё потому, что все процессы при беременности очень чётко разложены по известному календарю.

Другую предсказательную технологию – коллаборативную фильтрацию – реализовал в 2007 году предприниматель Александр Долгин в рекомендательном сервисе «Имхонет». Для получения рекомендаций пользователь ставит оценки интересующим его объектам (фильмам, книгам, музыке), и на основе этих оценок составляется личный вкусовой профиль. Затем сервис выявляет пользователей с похожими профилями, и находит объекты с высокой оценкой этой группы, которые наш пользователь ещё не видел. Это и будет рекомендованный ему фильм, книга или песня. В 2017 году сервис закрылся, поскольку не приносил ожидаемых доходов, однако разработчики продолжили дело на сайте Kinonavigator.ru.

Насколько эффективны персональные прогнозы? Криминалисты и спецслужбы по понятным причинам не расскажут вам, окупается ли профилирование в их работе. Да и влияние компании Cambridge Analytica на выборы президента США скорее всего было сильно преувеличено.

Оценить эффективность инфоцыган и хакерской «социальной инженерии» легче, поскольку тут есть статистика потерь – и они огромны. В отчёте ФБР о кибер-преступности за 2018 год на первом месте по потерям находится Business Email Compromise ($1,297,803,489), на втором месте – Confidence Fraud/Romance ($362,500,761). В обоих случаях речь идёт о персонально-заточенных атаках: деньги выманивают либо через фишинговые письма от фальшивых бизнес-партнёров, либо через романтическую переписку с немолодыми одинокими женщинами [17].

Что касается эффективности рекомендательных технологий, она зависит от многих параметров. В 2009 году сервис проката фильмов Netflix наградил призом в миллион долларов разработчика, чей алгоритм улучшил точность рекомендаций компании на 10%. Однако они не стали внедрять этот алгоритм, потому что перешли на другую бизнес-модель: вместо почтовой рассылки DVD занялись интернет-стримингом, а там победивший алгоритм был невыгоден.

С другой стороны, история «Имхонета» показывает, что создание подробных вкусовых профилей – процесс долгий, затратный, требующий активного участия пользователя и не гарантирующий практического результата (человек может смотреть совсем другие фильмы просто «за компанию»). Можно предположить, что для массового сервиса выгоднее создавать некие групповые прогнозы вместо персональных.

И действительно, Netflix с 2016 года использует гибридный подход к рекомендациям. На основе коллаборативной фильтрации выделено около 2.000 кластеров – сообществ людей со сходными вкусами. А фильмы в каталоге Netflix размечены на 27.000 микро-жанров (одних только страшилок про зомби – более ста видов). Сопоставляя кластеры и микро-жанры, система создаёт новые рекомендации для целых групп. Более того, Netflix начал выпускать собственные фильмы, используя всю собранную «вкусовую аналитику», чтобы предсказывать наиболее востребованные жанры для съёмки.

Футурология: Краткий курс

Подняться наверх