Читать книгу Хеш-сумма Вселенной. Научные парадоксы. Том 1 - Группа авторов - Страница 4
ЧАСТЬ I. Проверка не пройдена
Глава 3. Симпсон: когда правда есть, но вывода – нет
Оглавление1) Сцена
На второй день Андрей приехал к Кире с флешкой и усталостью, которая не лечится сном. Она открыла дверь сразу – будто стояла по ту сторону и ждала не звонка, а результата.
Квартира по‑прежнему держала порядок так, словно порядок мог служить алиби. На кухонном столе всё ещё лежали бумаги: протокол, схема, выписки. Но теперь рядом появилась новая стопка – распечатки из навигатора и банковские транзакции. Кира выложила их так, чтобы Андрей не мог «не заметить».
– Я выгрузила всё, что смогла, – сказала она. – Геолокацию – за четыре месяца. Банк – за полгода. Навигатор – историю маршрутов, насколько это возможно.
– Спасибо, – ответил Андрей и поймал себя на том, что «спасибо» звучит как «поздравляю» – неуместно.
Он сел. Кира осталась стоять, как обвинитель. Она хотела не анализа, а окончательного приговора миру.
– У вас есть что-то? – спросила она.
– Есть странность, – сказал Андрей. – Но она не про «подстроили» и не про «не подстроили». Она про то, как мы смотрим.
Он вставил флешку в ноутбук. Открыл таблицу: несколько десятков строк – дни, время выхода Сергея, маршруты, остановки, «точки интереса», небольшие отклонения. Рядом – агрегированные показатели: среднее время в пути, доля маршрутов через «тот» перекрёсток, частота «объездов».
Кира наклонилась ближе.
– Смотрите, – сказал Андрей. – За четыре месяца Сергей пересекал район аварии не так уж редко. В среднем – один‑два раза в неделю.
– Но он не ходил там, – отрезала Кира.
– Это «там» меняется, если менять масштаб, – тихо ответил Андрей. – Вот в чём проблема.
Он приблизил карту: на уровне района действительно казалось, что Сергей избегал этого перекрёстка. Но на уровне кварталов выходило, что он бывал рядом, заходил в аптеку в двухстах метрах, покупал кофе в киоске на параллельной улице. Он жил не в «сценариях», а в географии.
Кира нахмурилась.
– И что? Это доказывает, что его смерть случайна?
– Ничего это не доказывает, – сказал Андрей. – Это лишь снижает уникальность маршрута. Но есть другое: в вашей истории появился «навигатор‑обманщик». Вы сказали, что пробки не было, а навигатор предложил объезд. Я проверил данные пробок у стороннего поставщика по тому времени: да, крупных пробок не было. Но были мелкие замедления на участке, которые навигатор мог интерпретировать как «неоптимальный».
– Значит, навигатор не врёт.
– Подождите. Он может не врать – и это разные вещи.
Кира села напротив и наконец взяла кружку с холодным чаем. Руки дрожали совсем немного – так дрожит человек, который слишком долго держит себя.
– Тогда где «странность»? – спросила она.
Андрей открыл другую вкладку. Таблица была проще: два столбца и несколько строк.
– Вот. Я сравнил вероятность «объезда» у Сергея в зависимости от времени суток. И отдельно – вероятность «объезда» в зависимости от того, насколько он торопился.
– Откуда вы знаете, торопился ли он?
– Косвенно: по времени выхода и по тому, сколько времени он проводил в магазине и на остановках. Это не идеально, но даёт признаки.
Он повернул экран к Кире.
– В общем виде выходит так: если смотреть на все поездки вместе, кажется, что «объезд» увеличивает риск прохода через опасные перекрёстки. Но если разбить поездки на подгруппы – по времени суток или по «торопился/не торопился» – то внутри каждой подгруппы «объезд» наоборот снижает риск.
Кира молчала, потом сказала:
– Вы сейчас говорите, как мои коллеги‑юристы: «с одной стороны, с другой стороны».
– Я говорю, как статистика, – ответил Андрей. – У неё часто не две стороны. У неё бывает две правды, и обе приводят к неправильному выводу, если их смешать.
Он сделал паузу. В голове снова прозвучал голос Наблюдателя – не как внешний человек, а как внутренний комментатор, который появляется, когда Андрей устал и ему нужно, чтобы кто-то формулировал мысль вместо него.
Ты хочешь найти след руки – а находишь след агрегирования. Но разве это не рука? Разве не так и работает современная власть: через смешение групп, через статистическую пыль?
Андрей сжал пальцы на ручке.
– Есть парадокс, – сказал он Кире, – который идеально описывает то, что вы чувствуете: «всё верно по частям, но ложь в целом». Он называется парадокс Симпсона.
2) Формулировка парадокса
Парадокс Симпсона:
Тренд, который наблюдается в каждой подгруппе данных, может перевернуться, если объединить подгруппы в одну общую выборку.
То есть может случиться так, что:
– в группе A лечение кажется лучше, чем лечение B;
– в группе B новое лечение тоже кажется лучше, чем старое;
– но если объединить группы A и B, то внезапно выходит, что новое лечение хуже.
Это не «ошибка вычислений». Это особенность того, как устроены средние и доли, когда группы имеют разный размер и разные базовые риски.
3) История: медицинское исследование (как на самом деле рождается ложный вывод)
Андрей рассказал историю так, как рассказывал бы студентам, если бы когда-то преподавал.
Есть два лечения – новое и старое. Есть два типа пациентов:
– лёгкие случаи (низкий риск осложнений),
– тяжёлые случаи (высокий риск осложнений).
Врачам кажется, что новое лечение работает лучше. Но в общей статистике, опубликованной в отчёте, выходит, что новое лечение хуже.
– Это происходит, – сказал Андрей, – когда новое лечение чаще дают тяжёлым пациентам. Оно может быть лучше в каждой категории тяжести, но общая доля успеха у него будет ниже, потому что ему достаются более сложные случаи.
Кира задумалась, потом спросила:
– Вы хотите сказать, что если я вижу «навигатор привёл на смерть», это может быть результатом того, что в «объезды» попали люди, которые уже были в плохих условиях?
– Именно, – сказал Андрей. – Только вместо «тяжести болезни» у нас будут «условия поездки»: время, спешка, погода, усталость, освещённость, поток машин. И если «объезд» чаще происходит в плохих условиях, он будет выглядеть виновником, даже если он помогает.
4) Эксперимент: таблицы, которые переворачивают вывод
Андрей открыл блокнот и нарисовал две маленькие таблицы. Он говорил медленно, чтобы Кира могла следить глазами, а не верить на слово.
4.1. Подгруппа 1: лёгкие пациенты
Допустим, в лёгких случаях:
– новое лечение: 90 успехов из 100 (90%)
– старое лечение: 80 успехов из 100 (80%)
Новое лучше.
4.2. Подгруппа 2: тяжёлые пациенты
В тяжёлых случаях:
– новое лечение: 30 успехов из 100 (30%)
– старое лечение: 20 успехов из 100 (20%)
Новое опять лучше.
4.3. Теперь «подстава»: разный состав групп
А теперь предположим, что новое лечение чаще дают тяжёлым пациентам. Например:
– новое лечение: 100 лёгких + 900 тяжёлых
– старое лечение: 900 лёгких + 100 тяжёлых
Считаем общий успех.
Новое:
– лёгкие: 90/100 успехов (90%)
– тяжёлые: 270/900 успехов (30%)
Итого: 90 + 270 = 360 успехов из 1000 = 36%
Старое:
– лёгкие: 720/900 успехов (80%)
– тяжёлые: 20/100 успехов (20%)
Итого: 720 + 20 = 740 успехов из 1000 = 74%
Получается абсурдная на вид картина:
– в каждой подгруппе новое лучше,
– в целом новое хуже.
Кира долго смотрела в блокнот.
– То есть общая статистика может просто… врать?
– Она не врёт, – сказал Андрей. – Она отвечает на другой вопрос. Она отвечает: «Каков успех лечения среди тех, кому его дали?»
Но вам часто нужен другой вопрос: «Каков успех лечения, если бы мы давали его всем одинаково?» Это уже про причинность, а не про подсчёт.
Кира медленно кивнула.
– И как это связано с Сергеем? – спросила она.
Андрей переключил вкладку: он сделал простую таблицу поездок Сергея, где «успех» заменялся на «проехал без опасного перекрёстка», а «лёгкие/тяжёлые пациенты» – на «не торопился/торопился».
Он не утверждал, что эта модель точна. Он показывал структуру.
4.4. Мини‑версия на данных Сергея (структурно)
– Подгруппа «не торопился»: объезд снижает вероятность попасть на сложные перекрёстки.
– Подгруппа «торопился»: объезд тоже снижает риск.
– Но «объезд» чаще случается именно когда Сергей торопится (плохие условия, больше стресс, хуже внимание).
Если смотреть «в целом», получается иллюзия: объезд связан с риском, хотя внутри подгрупп он помогает.
– Тогда выходит, – тихо сказала Кира, – что я могу обвинять навигатор просто потому, что он включался чаще тогда, когда Сергей был в плохом состоянии?
– Да, – сказал Андрей. – И это не отменяет того, что кто-то мог вмешаться. Но это говорит: наш глаз не различает вмешательство от статистической тени.
Кира наклонилась ближе:
– А если вмешательство – это и есть выбор того, в какие подгруппы он попадёт?
– Это уже интереснее, – сказал Андрей.
Внутри Андрея снова поднялся голос – более спокойный, почти заботливый:
Спроси её, что она считает «плохим состоянием». Спроси о лекарствах. Спроси о сне. Ты ищешь алгоритм в телефоне, а алгоритм мог быть в теле.
Андрей спросил:
– Кира, Сергей пил какие-то препараты? Снотворное, успокоительное, что угодно?
Кира напряглась.
– Он говорил, что «иногда» пьёт таблетки от тревоги. Я не вникала. Думала, он сам справится. – Она отвернулась, будто извинялась перед стеной. – После смерти я нашла упаковку. Я могу показать.
Она принесла блистер. Название Андрею ничего не сказало, но он сфотографировал и отметил.
– Это важно? – спросила Кира.
– Может быть. Потому что «состояние» – это подгруппа, которая обычно скрыта. Если мы её не видим, мы смешиваем всё в кучу и получаем перевёрнутые выводы.
Кира сжала блистер в ладони:
– Вы говорите о нём как о данных.
– Я говорю о нём как о человеке, которого пытаюсь вернуть в мир причинности, – ответил Андрей. – Потому что смерть без причинности – это издевательство.
На секунду в комнате стало очень тихо. Потом Кира сказала:
– Но что с Наблюдателем? Он тоже «парадокс»?
Андрей усмехнулся без радости.
– Возможно. Возможно, он – голос, который появляется, когда мозгу нужно ускорить вывод. Когда я слишком устал, чтобы держать неопределённость.
Кира смотрела настороженно, но без страха.
– То есть вы допускаете, что вы… – она подбирала слово, – конструируете его?
– Я допускаю, что конструирую удобную фигуру, чтобы разговаривать с собственной тревогой, – сказал Андрей. – Но это не делает фигуру бессмысленной. Иногда воображаемое – форма, которую принимает реальный конфликт.
Он закрыл ноутбук. Встал. Подошёл к окну. На улице было серо, мелкий снег стоял в воздухе, как задержанное дыхание.
– Кира, – сказал он, не оборачиваясь, – есть ещё одна вещь. Она вам не понравится.
– Говорите.
– Ваши документы – это уже выборка. «Смерть Сергея» – фильтр. А затем вы добавляете к нему «все странности». Это второй фильтр. И чем сильнее фильтр, тем более «согласованной» кажется история.
Кира встала тоже.
– Но странности есть. Их нельзя отменить.
– Нельзя, – согласился Андрей. – Но можно спросить: «А сколько странностей было в дни, когда ничего не случилось?»
– И как это узнать?
– Надо собрать «нормальные дни» так же тщательно, как вы собрали «день смерти».
Кира смотрела на него, и в её взгляде впервые появилась не только злость, но и работа.
– То есть вы предлагаете мне доказать, что я не схожу с ума, – сказала она.
– Я предлагаю вам доказать, что вы не становитесь жертвой агрегации, – ответил Андрей. – Это почти то же самое, но звучит гуманнее.
Внутри головы Андрея Наблюдатель сказал:
И всё-таки ты не отвечаешь на главный вопрос. Почему именно этот день? Почему именно этот перекрёсток? Ты показываешь ей, что статистика умеет лгать. Но ты не показываешь, кто выбирает, какую ложь включать.
Андрей сжал челюсть. «Кто выбирает» звучало как религия. А он хотел оставаться в науке. Хотя наука в этот момент уже становилась психологией.
5) «Визуальная иллюстрация» без картинок (для ридеров)
Андрей сделал в блокноте простую схему словами – чтобы можно было «увидеть» даже без графиков:
– в каждой подгруппе стрелка идёт вверх: «новое лучше старого»;
– но размеры подгрупп разные: у нового лечения больше тяжёлых случаев;
– когда складываем всё вместе, «тяжёлые» перетягивают среднее вниз;
– итоговая стрелка может пойти вниз: «новое хуже старого».
Кира прочитала и сказала:
– То есть «правда» в каждой подгруппе не спасает от «лжи» в целом.
– Именно. Потому что «в целом» – новый объект. Он не равен сумме частей, если части смешаны.
6) Крючок: данные не просто «есть» – они «собраны». Кто попал в выборку?
Вечером Андрей ехал домой и думал не о Сергее, а о себе. Он поймал себя на том, что начинает искать парадоксы как оправдание: если есть статистические ловушки, можно бесконечно откладывать вывод. Можно не говорить Кире «да» и не говорить «нет». Можно жить в вечном «возможно».
На светофоре он увидел женщину на соседнем переходе: она держала ребёнка за рукав слишком крепко. Ребёнок вырывался. Машины стояли. Ничего не происходило. Но женщина держала так, будто мир уже однажды ударил по ней и она решила: больше никогда.
Андрей вспомнил Киру.
И понял: если он уйдёт в бесконечные уточнения, он станет таким же жестоким, как случайность. Потому что у случайности нет срока ответа.
Дома он открыл свой рабочий ноутбук (тот самый, который не хотел брать в «Штрих») и сделал то, что обещал себе не делать: полез в корпоративные логи, в которых "evt:"‑идентификаторы выглядели так же, как комплимент в ресторане.
Он не искал «заговор». Он искал, не было ли случайного совпадения формата. Но поиск выдал не совпадение, а цепочку: несколько тестовых событий, созданных в ночь перед встречей с Кирой, из песочницы системы персонализации. И создатель событий – неизвестный сервисный аккаунт.
Это мог быть баг. Это мог быть внутренний тест. Это мог быть кто-то из его отдела. Это мог быть он сам – в том смысле, в котором человек иногда «забывает» собственные действия.
И снова Наблюдатель в голове произнёс:
Симпсон переворачивает вывод. А что, если кто-то переворачивает тебя?
Андрей закрыл ноутбук. В комнате было темно, только на экране оставалась строка:
"created_by: svc_observer"
Он долго смотрел на эти слова и пытался понять, что страшнее: что кто-то действительно создал сервис observer, или что его усталый мозг готов поверить, будто это имя говорит о нём.
Перед сном Андрей записал в блокнот:
«Если выборка может перевернуть вывод, то кто выбирает выборку?»
И под этой фразой – в неожиданно чужом почерке, будто нажали сильнее:
«Ты».
7) Головоломки к Главе 3
1) Построй свой пример парадокса Симпсона (по шаблону).
Сделай две подгруппы (например, «молодые» и «пожилые»), два варианта (A и B) и числа успехов/неуспехов так, чтобы:
– в каждой подгруппе A лучше B;
– но в сумме A хуже B.
Подсказка: добейся того, чтобы у A было больше «тяжёлых» случаев.
2) Как распознать риск в реальном отчёте?
Назови 3 признака, что в отчёте может быть парадокс Симпсона: например, разные размеры групп, разные базовые риски, распределение «сложных» случаев между вариантами.
3) Вопрос для себя (практический):
В каком месте вашей жизни вы делали вывод «в целом», не проверив «по группам»?
Пример: оценки сотрудников, успех рекламной кампании, эффективность лекарства, результаты обучения.