Читать книгу Модельное мышление. Как анализировать сложные явления с помощью математических моделей - Скотт Пейдж - Страница 5
Глава 1
Многомодельное мышление
Модели в эпоху данных
ОглавлениеПоявление книги о моделях может показаться неуместным в эпоху больших данных, которые сегодня характеризуются беспрецедентной размерностью и степенью детализации. Данные о покупках клиентов, раньше поступавшие в виде ежемесячных совокупных показателей, распечатанных на бумаге, теперь представляют непрерывный поток геопространственных, временных и потребительских тегов. Данные об академической успеваемости студентов теперь включают баллы за каждое домашнее задание, работу, тест и экзамен, в отличие от итоговых оценок в конце семестра. В прошлом фермер мог упомянуть о засушливой почве на ежемесячном собрании ассоциации фермеров. Теперь тракторы передают мгновенные данные о состоянии почвы и уровне влажности в расчете на каждый квадратный метр. Инвестиционные компании отслеживают десятки показателей и тенденций по тысячам акций и используют инструменты обработки текстов на естественных языках для синтаксического анализа документов. Врачи могут страница за страницей получать данные из истории болезни пациентов, в том числе важные генетические маркеры.
Всего каких-то двадцать пять лет назад большинство из нас имели доступ к знаниям, размещавшимся на нескольких книжных полках. Возможно, у вас на работе была небольшая библиотека справочной литературы или коллекция энциклопедий и несколько десятков справочников дома. Хотя ученые и исследователи из правительственного и частного сектора имели доступ к большим библиотечным фондам, им все равно приходилось физически их посещать, чтобы получить необходимые материалы. Даже на рубеже нового тысячелетия еще можно было увидеть, как ученые курсируют туда-сюда между библиотечными картотеками, коллекциями микрофильмов, книжными стеллажами и специальными хранилищами в поисках информации.
Сегодня все по-другому. Контент, веками отображаемый исключительно на бумаге, теперь передается крохотными блоками по воздуху, так же как и информация о событиях, происходящих здесь и сейчас. Новости, приходившие к нам один раз в день в виде газеты, теперь поступают в виде непрерывного цифрового потока на наши персональные устройства. При помощи нескольких движений пальцев или мышки можно узнать курс акций и результаты спортивных соревнований, а также новости о политических и культурных событиях.
Но какими бы впечатляющими ни были данные, это не панацея. Да, теперь мы знаем, что уже произошло или происходит в настоящий момент, но из-за сложности современного мира не всегда способны понять, почему. Выводы, полученные эмпирическим путем, могут вводить в заблуждение. Данные о сдельной оплате труда часто показывают, что чем больше людям платят за единицу продукции, тем меньше они производят. Модель, в которой оплата зависит от условий труда, может объяснить этот парадокс. Если условия плохие и затрудняют выпуск продукции, оплата за единицу продукции может быть высокой. Если условия хорошие, оплата может быть низкой. Таким образом, более высокая оплата не приводит к снижению производительности, скорее наоборот, тяжелые условия труда требуют более высокой оплаты за единицу продукции[4].
Кроме того, большая часть социальных данных (об экономических, социальных и политических явлениях) отражает только отдельные моменты или промежутки времени и редко раскрывает универсальные истины. Наш экономический, социальный и политический мир не статичен. Например, мальчики могут превзойти девочек по стандартизованным тестам в одно десятилетие, а девочки – в следующее. Причины, по которым люди голосуют сегодня, могут отличаться от причин, по которым они проголосуют завтра.
Нам нужны модели, чтобы осмыслить потоки данных, изливающихся на наши компьютерные экраны как из пожарного шланга. Именно из-за их беспрецедентного объема современную эпоху можно также назвать эпохой множества моделей. Взгляните на научный и деловой мир, сферу государственного управления и некоммерческий сектор – вряд ли вы найдете там область исследований или принятия решений, не основанную на использовании моделей. Консалтинговые гиганты McKinsey и Deloitte создают модели для разработки бизнес-стратегий. Такие финансовые компании, как BlackRock и JPMorgan Chase, используют модели для выбора объектов для инвестиций. Актуарии страховых компаний State Farm и Allstate применяют модели для определения риска при расчете цены страховых полисов. Отдел персонала компании Google разрабатывает аналитические модели прогнозирования для оценки более чем трех миллионов кандидатов на вакантные должности. Приемные комиссии колледжей и университетов создают прогностические модели для отбора студентов из десятков тысяч абитуриентов.
Административно-бюджетное управление разрабатывает экономические модели для прогнозирования последствий налоговой политики. Компания Warner Brothers использует анализ данных для создания моделей отклика аудитории. Amazon разрабатывает модели машинного обучения для предоставления рекомендаций по продуктам. Исследователи, финансируемые Национальными институтами здравоохранения, строят математические модели генома человека для поиска и оценки вероятных методов лечения онкологических заболеваний. Фонд Билла и Мелинды Гейтс применяет эпидемиологические модели для разработки стратегий вакцинации. Даже спортивные команды применяют модели для оценки своих потенциальных членов, возможностей для обмена и формирования стратегий игры. Опираясь на модели при отборе игроков и стратегий, бейсбольный клуб Chicago Cubs сумел выиграть чемпионат США по бейсболу после более чем столетия неудач.
Для людей, использующих модели, объяснение популяризации модельного мышления звучит еще проще: модели делают нас умнее. Без них люди страдают от длинного списка когнитивных искажений: придают чрезмерное значение недавним событиям, присваивают значения вероятности, руководствуясь благоразумием, и игнорируют базовые процентные ставки. Без моделей наша способность учитывать данные ограничена. Применение моделей вносит ясность в исходные предположения и позволяет логически мыслить. Кроме того, благодаря моделям мы можем использовать большие данные для подбора, точной формулировки и проверки каузальных и коррелятивных утверждений. Модели помогают нам эффективнее мыслить. В прямом состязании между моделями и людьми побеждают модели[5].
4
См. статью Паарша и Ширера (Paarsch and Shearer 1999), в которой анализируется лесная промышленность. Исходные данные о посадке деревьев указывают на наличие отрицательной корреляции между сдельной оплатой труда и количеством высаженных деревьев – другими словами, чем больше человеку платят за посадку дерева, тем меньше деревьев он высаживает. Этот вывод противоречит стандартной экономической логике. Если вы платите работникам больше за каждое посаженное дерево, они должны работать усерднее. Согласно модели Паарша и Ширера, лесозаготовительные компании платят работникам сдельную ставку за каждое дерево так, что почасовая рыночная ставка заработной платы составляет 20 долларов в час. На основании этого допущения можно вывести следующую формулу расчета оплаты за одно дерево:
20 долларов = количество деревьев, высаженных за час × оплата за дерево.
Если человек посадит десять деревьев за час, то оплата за одно дерево составит 2 доллара, а если двадцать деревьев за час, то 1 доллар. Таким образом, модель указывает на наличие отрицательной корреляции между сдельной оплатой труда и количеством высаженных деревьев. Кроме того, она также говорит о том, что произведение сдельной ставки на количество деревьев равно постоянной величине.
5
Доказательства того, что модели важнее людей, можно найти здесь: Dawes, 1979; Tetlock, 2005; Silver, 2012; Cohen, 2013. О предвзятости суждений читайте здесь: Kahneman, 2011.