Читать книгу Хеш-сумма Вселенной. Научные парадоксы. Том 1 - Группа авторов - Страница 5

ЧАСТЬ I. Проверка не пройдена
Глава 4. Берксон и больница, где все кажутся больными

Оглавление

1) Сцена

Через неделю Кира привела Андрея в больницу. Не ту, где умер Сергей – там, по её словам, «слишком много призраков», – а в другую, ведомственную, куда её знакомая врач согласилась пустить «консультанта по данным» посмотреть на странный отчёт.

Врач была невысокая, с усталыми глазами и неестественно спокойным голосом человека, который видел слишком много одинаковых страданий и научился защищаться монотонностью.

– Меня зовут Елена Павловна, – сказала она, пожав Андрею руку. – Я терапевт. У нас тут… – она чуть помедлила, – интересная корреляция.

Кира стояла рядом молча. Её роль сегодня была другой: она была не клиентом, а свидетелем. Она хотела увидеть, что Андрей умеет держать реальность, даже когда реальность пытается притвориться закономерностью.

Елена Павловна провела их по коридору. Пахло антисептиком и варёной капустой – как в любой больнице, где жизнь не художественная, а бюджетная. В конце коридора она открыла кабинет и показала распечатку.

– Мы изучали факторы риска осложнений после вирусной инфекции, – сказала она. – И нашли странное: среди наших госпитализированных пациенты, которые активно занимались спортом, имели больше осложнений.

Кира резко повернулась к Андрею: «слышите?»

Елена Павловна продолжила:

– Я понимаю, что это звучит абсурдно. Но статистика «у нас» получается именно такая.

Андрей посмотрел на таблицу. Она была простая: «спорт» – да/нет, «осложнения» – да/нет. И действительно: доля осложнений среди «спортсменов» выше.

– А выборка только госпитализированные? – спросил Андрей.

– Да, – сказала Елена Павловна. – Мы работаем с теми, кто попал к нам. У амбулаторных нет полной картины.

Андрей кивнул, и внутри него что-то щёлкнуло: не мистический сигнал, а профессиональный рефлекс.

– Тогда это не «спорт вреден», – сказал он. – Это «в больнице спорт выглядит вредным».

Елена Павловна устало улыбнулась, как человек, который рад, что его не заставят спорить с цифрами в одиночку.

– Вот. Мне нужно, чтобы вы объяснили это администрации. Они любят сенсации.

– Я объясню, – сказал Андрей. – Но начну с парадокса Берксона.

Кира нахмурилась:

– Мы же уже говорили о Берксоне.

– Мы говорили о нём как о теории, – ответил Андрей. – А здесь он будет в чистом виде: больница как фильтр.

И в этот момент Андрей снова услышал Наблюдателя – не как голос, а как собственную мысль, которую он обычно не формулировал:

Ты всё время учишь других ловушкам. А кто научит тебя ловушке «я в правильной выборке»? Ты уверен, что Кира вообще должна была встретить тебя?

Он отогнал мысль. Сейчас была работа.

2) Формулировка парадокса (коротко, но в лоб)

Парадокс Берксона (смещение отбора):

Если мы анализируем связи только среди тех, кто прошёл отбор (например, попал в больницу), то внутри этой отобранной группы могут появиться ложные корреляции между признаками.

То, что кажется «фактом» в больнице, может быть иллюзией, созданной правилом попадания в больницу.

3) История: «больница, где все кажутся больными»

Елена Павловна включила компьютер и открыла список госпитализаций. На экране были обезличенные записи: возраст, сатурация, давление, сопутствующие диагнозы, образ жизни.

– У нас простое правило, – сказала она. – Госпитализируем либо тех, у кого тяжёлые симптомы, либо тех, у кого много факторов риска.

– То есть, – уточнил Андрей, – попадают те, кто либо реально тяжело болен сейчас, либо потенциально опасен по фону.

– Именно, – сказала Елена Павловна. – И вы думаете, что это искажает связи?

– Не просто думаю. Это и есть механизм.

Кира слушала. Её лицо было напряжённым, но уже не враждебным: она училась распознавать, где статистика превращает боль в легенду.

4) Эксперимент: «впускной фильтр» и схема (без сложной математики)

Андрей взял маркер и на листе нарисовал две шкалы:

– по одной – «тяжесть текущих симптомов» (S),

– по другой – «фоновые риски» (R): хронические болезни, возраст и т. п.

– В популяции, – сказал Андрей, – S и R могут быть почти независимы. Можно быть молодым и тяжело болеть. Можно быть пожилым и переносить легко.

Он нарисовал прямоугольник «все люди». Затем условную границу госпитализации: в больницу попадают, если S высокое или R высокое.

– Теперь смотрите, – сказал Андрей. – Среди госпитализированных будет ложное ощущение, что если R высокий, то S часто не такой высокий, и наоборот. Потому что чтобы попасть в выборку, достаточно одного из двух.

– То есть внутри выборки появляется отрицательная корреляция? – спросила Елена Павловна.

– Да. И дальше начинается цирк.

Он повернулся к Кире:

– Представьте: спорт уменьшает фоновые риски R. У спортсменов меньше хронических болезней, лучше сосуды, лучше обмен.

Но если спортсмен попадает в больницу, то чаще всего – не по «фону», а по тяжести симптомов S. То есть среди госпитализированных спортсмены будут смещены в сторону более тяжёлых случаев.

В итоге в больнице может казаться, что спорт связан с осложнениями, хотя в реальности спорт защищает.

Кира медленно кивнула.

– То есть «спортсмен в больнице» – это уже не случайный спортсмен. Это спортсмен, который прошёл через фильтр «почему ты вообще здесь».

– Именно, – сказал Андрей. – Это и есть отбор.

Елена Павловна вздохнула:

– А администрация видит только табличку «спорт – осложнения» и хочет пресс‑релиз.

Андрей посмотрел на распечатку:

– Дайте мне два столбца: почему госпитализировали – по тяжести симптомов или по рискам.

– Есть, – сказала врач и быстро добавила поле.

Андрей разделил выборку на две группы: госпитализированные «по симптомам» и госпитализированные «по рискам». И картинка стала другой: внутри каждой группы спорт уже не был «опасным» фактором, а иногда выглядел защитным. Общая же таблица снова «обвиняла» спорт.

– Вот, – сказал Андрей. – Это Берксон в лабораторном виде.

Кира смотрела на экран так, словно видела не цифры, а судьбу: судьба тоже работает фильтрами.

5) Крючок: если выборка может «рисовать» реальность – то что такое объективность в науке?

По дороге обратно Андрей и Кира шли молча. Кира первой нарушила тишину:

– Получается, объективность – это не «данные», а честность про фильтры?

– Да, – сказал Андрей. – Объективность – это описание того, как именно реальность попала к нам на стол.

– И если это так, – продолжила Кира, – то моя история… – она остановилась, – моя история тоже может быть просто результатом фильтра?

– Может. Но есть важное различие, – сказал Андрей. – В науке фильтры можно описать и повторить. В жизни фильтры часто скрыты. Особенно те, которые выбирают, что вам вообще увидеть.

Наблюдатель внутри Андрея отозвался почти шёпотом:

А кто выбирает, что увидит она? Кто выбрал, что увидишь ты? Ты уверен, что твои фильтры – твои?

Андрей ощутил, как усталость превращается в подозрительность. Это было опасно: он мог стать тем, кого сам же учил избегать – человеком, который видит связи там, где есть отбор.

Он остановился и сказал Кире:

– Мне нужно вам кое-что признать.

Кира напряглась.

– Что?

– «Наблюдатель» может быть не внешним. Он может быть тем, как мой мозг пытается объяснить, почему я полез в логи, почему я заметил идентификатор, почему я оказался рядом. Это может быть просто… форма ответственности, которую я не умею принять прямо.

– Но вы же видели "svc_observer" в логах, – сказала Кира.

– Видел. И это тоже может быть ловушка: имя, которое мозг подхватывает, потому что оно совпало с сюжетом.

Кира посмотрела на него внимательно:

– Вы боитесь, что придумываете заговор, чтобы не чувствовать вину?

Андрей не ответил сразу. Потом сказал:

– Я боюсь, что придумываю порядок. А порядок – наркотик для тех, кто живёт в шуме.

6) Мини‑эссе 1: почему «научные сенсации» часто умирают в повторении

На следующий день Андрей написал для Киры короткий текст – не как отчёт, а как прививку.

6.1. Сенсация почти всегда рождается на краю фильтра

Часто «сенсационные» результаты появляются там, где:

– выборка отобрана странным способом (больница, тюрьма, элитный вуз, приложение, клуб);

– измерения неполные;

– много скрытых переменных;

– исследователи сами «подсвечивали» интересные связи.

Сенсация – не всегда ложь. Но она часто означает: что-то в методе усилило эффект.

6.2. Повторение ломает эффект, потому что меняет фильтр

Когда другой исследователь повторяет работу:

– он берёт другую популяцию;

– использует другие критерии включения;

– измеряет чуть иначе;

– живёт в другой сезон/стране/условиях.

Если эффект был продуктом смещения отбора или случайной удачи, он исчезает.

Это не позор науки. Это её иммунитет.

6.3. Почему люди не любят «неповторяемость»

Потому что она унижает наше желание причинности.

Человек хочет «всегда».

Наука часто даёт «иногда» и «при этих условиях».

6.4. Честный вопрос, который убивает половину сенсаций

«Как именно вы получили эти данные, и кто в них не попал?»

Если исследователь раздражается – это красный флаг.

Кира прочитала и сказала:

– То есть если я хочу правду про смерть Сергея, я должна задать тот же вопрос: кто не попал в мою историю.

– Да, – сказал Андрей. – И ещё: какие варианты мира вы не рассматриваете, потому что они не складываются в сюжет.

Кира отвернулась к окну.

– Я не рассматриваю вариант, что он умер просто так, – сказала она тихо. – Потому что тогда он… – она не договорила.

Андрей понял: вот её настоящая подгруппа. Подгруппа «если принять случайность – я не переживу». И никакая статистика не могла отменить этот фильтр. Можно было лишь уважать его, не подыгрывая ему.

7) Головоломки к Главе 4

1) Задача про «самых высоких людей» среди баскетболистов (отбор)

В школе вы смотрите только на баскетбольную команду и делаете вывод: «у высоких людей хуже оценки».

Как может работать смещение отбора, если в команду берут либо очень высоких, либо очень спортивных? Какую ложную связь вы можете увидеть?

2) Как смещение отбора портит выводы об успехе?

Вы изучаете биографии успешных предпринимателей и замечаете: «они бросали университет».

Почему это может быть иллюзией выживших и отбора? Какая группа отсутствует в данных?

3) Фильтр «больница» (практика)

Назовите 3 вопроса, которые нужно задать, прежде чем делать вывод по данным госпитализированных: например, «по каким критериям госпитализируют», «кто лечится дома», «как менялись критерии со временем».

Синопсис (для закрепления материала)

Синопсис. Глава 3

Андрей показывает Кире парадокс Симпсона: даже если внутри каждой подгруппы эффект один («объезд помогает» / «лечение лучше»), при объединении данных вывод может перевернуться из‑за разного состава групп. Это ломает её уверенность, что общий факт «навигатор привёл» означает причинность. Параллельно Андрей находит в логах странный сервисный аккаунт "svc_observer" и начинает сомневаться, не стал ли «Наблюдатель» его внутренней конструкцией, подпитанной совпадением имени в системе.

Синопсис. Глава 4

Андрей и Кира сталкиваются с чистым смещением отбора в больнице: «спорт» выглядит вредным среди госпитализированных, хотя в реальности защищает. Андрей объясняет Берксона через «впускной фильтр» и подводит к философскому крючку: объективность – это честность о том, как данные собраны и кто из них исключён. Глава заканчивается мини‑эссе о том, почему научные сенсации часто не воспроизводятся, и укрепляет общую концепцию: реальность часто выглядит «подстроенной» не из‑за заговора, а из‑за того, как мы режем мир на выборки.

Хеш-сумма Вселенной. Научные парадоксы. Том 1

Подняться наверх