Читать книгу Хеш-сумма Вселенной. Научные парадоксы. Том 1 - Группа авторов - Страница 3

ЧАСТЬ I. Проверка не пройдена
Глава 2. Отбор делает заговор

Оглавление

1) Сцена

Вечером Андрей сидел в своей машине на парковке возле дома Киры – не потому, что хотел за ней следить, а потому, что ему нужно было пространство, где можно думать без отражений в офисных окнах.

Сиденье пахло пылью и холодным пластиком. На панели мигал индикатор: дверь не закрыта до конца, хотя дверь была закрыта. Андрей нажал сильнее. Индикатор погас. Через секунду загорелся снова.

Две версии реальности. Миллисекунда. Параллельные ответы.

Он достал телефон и открыл фото с идентификатором «комплимента». Префикс совпадал с их системой: "evt:" – дальше 64 символа. Он переслал фото на свой личный почтовый ящик, потом – на резервный, потом – себе в мессенджер. Тройная фиксация. Детская защита от взрослого страха.

В кармане завибрировал телефон. Номер – скрыт.

– Левицкий, – сказал Андрей.

– Ты быстро учишься, – произнёс голос Наблюдателя. Без шумов, без задержек – слишком чистый, как запись. – Но всё ещё задаёшь не те вопросы.

– Вы были в ресторане?

– Я был в твоей голове достаточно, чтобы знать, что ты решишь: «это знак». И достаточно, чтобы дать тебе знак.

– Зачем?

Пауза. Андрей услышал, как где-то вдали хлопнула дверь подъезда.

– Потому что Кира – не случайный персонаж, – сказал Наблюдатель. – Её трагедия – твой вход в статистику, которая убивает.

– Какая ещё статистика?

– Та, где люди ищут связи, а находят только следы отбора.

– Вы хотите сказать, что её подозрения – иллюзия?

– Я хочу сказать, что иллюзия и правда иногда имеют одинаковый интерфейс. Различие в том, что правда выдерживает проверку, а иллюзия выдерживает только повторение истории.

Связь оборвалась. Как будто кто-то поставил точку.

Андрей посмотрел на подъезд. В окне третьего этажа горел свет – Кира не спала. Он почти видел её: сидит на кухне, раскладывает бумаги, как раскладывала сегодня, как раскладывала вчера, и каждое раскладывание – попытка вернуть контроль. Человек без контроля становится суеверным даже против воли: суеверие – протез причинности.

На следующий день Андрей встретился с Кирой снова – в её квартире, где всё было слишком чисто для дома, пережившего смерть. Чистота как доказательство: я ещё могу держать порядок.

Кира поставила на стол ноутбук мужа.

– Вот, – сказала она. – В его истории навигатора – тот самый «объезд». И ещё кое-что.

– Что?

– Он в тот вечер искал в интернете: «как понять, что за тобой следят».

Андрей поднял взгляд.

– Серьёзно?

– Да. – Кира говорила тихо, но в её тишине был металл. – За неделю до смерти он стал странным. Проверял двери. Смотрел в зеркало заднего вида. Смеялся невпопад. Я думала – стресс. А теперь думаю: он что-то видел.

Андрей почувствовал, как его собственная память попыталась подложить готовую историю: вот оно, заговор. История была удобна: она собирала хаос в один узел.

И именно поэтому Андрей ей не доверял.

Он попросил доступ к данным: геолокация, история браузера, звонки, мессенджеры. Кира дала – слишком быстро. Люди, пережившие смерть, иногда отдают конфиденциальность так же легко, как одежду в морг: «всё равно уже поздно».

Андрей сидел над выгрузкой и видел множество «связей»: Сергей искал про слежку – значит, его действительно могли преследовать. Навигатор вёл по странному маршруту – значит, система могла подталкивать. Магазин закрылся раньше – значит, кто-то мог сообщить. И всё вместе выглядело как сеть, натянутая вокруг человека.

Андрей уже почти поверил, когда заметил деталь: в истории браузера было много запросов про тревожность, бессонницу, симптомы паники. Они шли пачками, с интервалами – как у человека, который просыпается ночью и пытается убедить себя, что он не сходит с ума.

Если это заговор – он мог быть очень умным. А если это психика – она могла быть ещё умнее, потому что умеет делать врага из воздуха.

Кира стояла рядом и смотрела на экран так, будто это видеозапись преступления.

– Ну? – спросила она. – Видите связь?

– Я вижу историю, – сказал Андрей. – Но история – это не причинность.

Кира сжала губы.

– Вы опять про «совпадения»?

– Я про отбор, – ответил Андрей. – Про то, как данные становятся ложными, когда мы смотрим не на весь мир, а только на тех, кто попал в нашу папку.

Он повернул ноутбук к ней.

– Смотрите. Здесь есть одна статистическая ловушка, которая делает «заговор» почти неизбежным, даже если его нет. Она называется парадокс Берксона.

Кира устало опустилась на стул.

– Тогда объясняйте, – сказала она. – Только человеческим языком.

2) Формулировка парадокса

Парадокс Берксона (Berkson’s paradox), он же смещение отбора:

Если мы отбираем данные по условию, зависящему от двух признаков, то внутри отобранной группы эти признаки могут казаться связанными (или даже отрицательно коррелированными), хотя в общей популяции связи нет.

Проще:

– В мире признаки A и B могут быть независимыми.

– Но если мы смотрим только на тех, у кого A или B достаточно велики, чтобы попасть в выборку, то внутри выборки появится ложная зависимость: «если мало A, то должно быть много B, чтобы пройти фильтр».

Классический бытовой пример: «в престижном вузе красивые студенты глупее». Звучит как шутка. Но это может быть чистая статистика: если отбор идёт по суммарному «таланту», то у прошедших фильтр может возникать отрицательная корреляция между двумя независимыми качествами.

3) Эксперимент (на пальцах + мини‑модель)

Андрей взял лист бумаги и нарисовал прямоугольник – «все люди».

– Представьте, – сказал он, – что у каждого человека есть два независимых качества. Например:

A – внимательность (или аккуратность в правилах),

B – смелость (или решительность).

В общей популяции они независимы: внимательные бывают смелыми и трусливыми, невнимательные тоже.

Кира кивнула:

– Допустим.

– А теперь представьте, что мы отбираем только тех, кто попал в ДТП со смертельным исходом. Страшно, но это тоже фильтр: он пропускает тех, у кого комбинация факторов стала фатальной.

Кира побледнела, но не перебила.

– Пусть риск попасть в смертельное ДТП растёт, когда либо внимание низкое, либо смелость слишком высокая (например, человек склонен переходить дорогу «на авось»). То есть фильтр звучит так: «пропустить, если A мало или B много».

– И что?

– И то, что среди погибших вы можете увидеть ложную связь: «если человек был внимательным, значит, он был слишком смелым; если был осторожным, значит, был невнимательным». Хотя в целом по миру эта связь отсутствует.

Андрей нарисовал координатную плоскость: по оси X – A, по оси Y – B.

– Теперь фильтр «попал в выборку» может выглядеть как граница, отделяющая область «не попали» от области «попали». И вот внутри области «попали» точки будут располагаться так, что создадут видимость зависимости. Это и есть парадокс.

Кира нахмурилась:

– Но при чём здесь мой муж?

Андрей развернул к ней ноутбук.

– Смотрите. Вы сейчас отбираете факты по условию: «всё, что относится к смерти Сергея». Это очень сильный фильтр. И теперь любые два фактора, которые помогли приблизить его к перекрёстку в 20:07, будут внутри вашей выборки выглядеть связанными.

Он перечислил:

1) магазин закрылся раньше;

2) навигатор дал объезд;

3) Сергей вышел позже обычного;

4) водитель выбрал именно этот маршрут;

5) сигнал светофора совпал по фазе;

6) машина оказалась именно в этой полосе;

7) у Сергея был именно этот шаг, именно эта скорость.

– Все эти вещи в общем мире происходят постоянно, – сказал Андрей. – Магазины закрываются раньше. Навигаторы ошибаются. Люди гуглят тревожные запросы. Водители сворачивают. Светофоры переключаются.

Он сделал паузу.

– Но вы смотрите на них через фильтр «это привело к смерти». И фильтр заставляет их выглядеть как сговор.

Кира резко поднялась.

– Вы хотите сказать, что я должна принять это как «просто набор случайностей»?

– Нет. Я хочу сказать, что ощущение заговора – ожидаемый продукт отбора, даже без заговора. Поэтому, если мы хотим доказать, что заговор был, нам нужно сравнить: насколько «цепочка» уникальна относительно обычных дней.

Кира скрестила руки:

– Как это сделать?

Андрей почувствовал знакомую тяжесть: вот она, грань между математикой и этикой. Чтобы помочь Кире, ему нужно превратить чужую смерть в задачу о данных.

– Нам нужна контрольная группа, – сказал он. – Дни, когда Сергей ходил по этому району и не погибал. Маршруты, которые навигатор предлагал и ничего не случилось. Случаи, когда магазин закрывался раньше – и люди просто шли домой.

Кира смотрела на него, как на предателя. Потом тихо сказала:

– Вы хотите доказать, что смерть моего мужа статистически «нормальна»?

– Я хочу доказать, была ли она ненормально сконцентрирована по редким факторам, – ответил Андрей. – Это разные вещи.

Он помолчал и добавил:

– И ещё. Если Сергей действительно чувствовал слежку, нам нужно отделить: была ли это реальная слежка или продукт тревоги. В обоих случаях он страдал. Но механизмы разные – и ответы тоже.

Кира медленно села. Её голос стал ровным, как у человека, который надел форму.

– Хорошо, – сказала она. – Что вам нужно?

– Доступ к его телефону за последние полгода. Полная история геолокации. И, если возможно, данные навигатора и банка.

– Банк?

– Да. Траты помогают восстановить маршруты и привычки.

– Это… – Кира закрыла глаза на секунду. – Это грязно.

– Да, – сказал Андрей. – Но грязь – это то, где скрывается правда. Чистота – где скрывается миф.

В этот момент в коридоре квартиры щёлкнул выключатель, хотя они были одни. Свет в прихожей включился. Потом выключился. Потом включился снова – с паузой, как двойной пакет.

Кира подняла голову, губы дрогнули.

– Вы это видели?

Андрей не ответил сразу. Он встал, прошёл в коридор, проверил выключатель. Он был сухой, исправный, без люфта. Электрика не должна так работать.

Вернувшись, Андрей заметил на кухонном столе мокрый след – как от пальца, проведённого по пыли. След упирался в его блокнот.

Андрей открыл блокнот. На странице, где он рисовал координатную плоскость, появилась новая запись – тонкими буквами, будто продавили ногтем:

Отбор – это тоже алгоритм.

Алгоритм может быть враждебным.

Кира уставилась на запись.

– Вы это написали?

– Нет, – сказал Андрей.

И впервые он произнёс это вслух так, будто признавался в преступлении:

– Кажется, кто-то участвует в нашем эксперименте.

4) Современное состояние (где работает, где люди ошибаются)

4.1. Берксон – стандартная ловушка в медицине и расследованиях

Парадокс Берксона особенно часто встречается там, где выборка – это:

– пациенты больницы (попали по причине болезни);

– арестованные (попали по причине поимки);

– «успешные» компании (попали по причине выживания);

– «нашумевшие» происшествия (попали по причине попадания в новости);

– «случаи, которые мы исследуем» (попали по причине нашего внимания).

Внутри такой выборки легко обнаружить «корреляции», которых нет в общей популяции.

4.2. Почему мозг так охотно верит ложным связям

Потому что для выживания полезнее ошибочно увидеть «хищника» в кустах, чем пропустить реального. Мы биологически заточены под ложноположительные связи. Это спасало в саванне, но ломает в мире больших данных.

4.3. Как отличить ложную связь от настоящей

Принципиально:

– введите контрольную группу или сравнение с базовой частотой;

– определите критерии до просмотра данных (предрегистрация);

– проверьте, не обусловлена ли связь самим фактом попадания в выборку.

В прикладном смысле для дела Киры:

– «Навигатор дал объезд» – частое событие?

– «Магазин закрылся раньше» – насколько частое?

– «Сергей искал про слежку» – часто ли он вообще гуглил тревожные темы раньше?

– «Водитель поехал не тем маршрутом» – как часто навигатор перекидывает людей на этот перекрёсток?

Если это обычные частоты – «цепочка» перестаёт быть уникальной. Если частоты редкие и сконцентрированы в короткое окно – тогда появляется повод подозревать внешнее вмешательство.

4.4. Тонкость: смещение отбора не «опровергает заговор»

Главная ошибка новичков: «Если есть смещение отбора, значит, всё случайно». Нет. Смещение отбора говорит лишь: ваши интуитивные выводы ненадёжны.

Заговор может существовать – и именно поэтому у него есть идеальная маскировка: он может прятаться в тех местах, где статистика сама порождает видимость заговора.

Наблюдатель в этом смысле опасен: он может быть и «объяснением», и «приманкой». Он может создавать шум, чтобы вы не различили сигнал.

Андрей впервые допустил мысль, которая ему не нравилась: возможно, Наблюдатель не враг и не союзник. Возможно, он – условие эксперимента, которое нельзя выключить.

5) Крючок + головоломки

Крючок к Главе 3 (намёк)

Андрей собрал копии данных, которые Кира согласилась предоставить, и пообещал: через два дня вернётся с первыми результатами.

Когда он вышел из квартиры, в лифте пахло влажным металлом. На зеркале лифта кто-то пальцем написал цифры:

23

Андрей провёл по ним рукой – и цифры размазались водой.

Он смотрел на своё отражение и вдруг понял: Наблюдатель не просто вмешивается. Он обучает. Как будто тестирует, насколько Андрей способен отличать истинные зависимости от нарисованных.

И если это обучение – то у него будет экзамен.

Экзамен, где ставка – не «правильный ответ», а право оставаться собой.

Следующая глава будет про то, как даже честные данные начинают врать, когда мы задаём вопрос уже после того, как увидели ответ. Это будет история про подгонку и про то, почему в больших массивах данных всегда найдётся «значимая» закономерность – даже если мир шумит.

Название уже вертелось у Андрея на языке, как неприятное признание:

«Если долго искать – найдёшь всё».

Головоломки к Главе 2

1) Набор в клуб (Берксон на пальцах)

В клуб берут людей, если они очень богаты или очень известны. В общей популяции богатство и известность независимы.

Вопрос: какую корреляцию между богатством и известностью вы ожидаете увидеть внутри клуба и почему?

2) Больничная ловушка

В больнице исследуют связь между курением и заболеванием X, но выборка – только пациенты больницы.

Назовите два механизма, как попадание в больницу может исказить оценку связи курения и заболевания X.

3) «Цепочка событий»

Вы анализируете ДТП и видите 6 факторов, которые «сложились» в трагедию.

Как сформулировать проверяемую гипотезу (в духе статистики), которая отличит «необычную концентрацию редких факторов» от «обычной комбинации частых факторов»?

4) Личный фильтр

Опишите ситуацию из своей жизни, где вы могли видеть ложную связь из‑за отбора: вы общаетесь только с определённым кругом людей, читаете только определённые источники, видите только «выживших». Какой именно фильтр действует?

Хеш-сумма Вселенной. Научные парадоксы. Том 1

Подняться наверх