Читать книгу Футболоматика: как благодаря математике «Барселона» выигрывает, Роналду забивает, а букмекеры зарабатывают состояния - Дэвид Самптер - Страница 6
Часть I
На поле
Глава 1
Я никогда ничего не предсказывал и никогда не буду впредь
Объясняется случайностью
ОглавлениеИменно непредсказуемость футбольного матча от одной минуты к другой и создает распределение Пуассона по прошествии 90 минут. Мы знаем среднее количество голов, забитых в матче, но их время непредсказуемо. Как итог – некоторые результаты становятся намного более вероятными, чем другие. Парадокс здесь заключается в том, что эти итоги объясняются случайностью. Тот факт, что голы случаются произвольно во времени, делают возможным предсказание закономерности результатов. Эту идею очень сложно понять, но это правда. Факт случайности какого-либо события помогает нам объяснить это и предугадать, как часто оно будет происходить. Случайность позволяет нам делать всевозможные прогнозы о будущем.
Математики используют этот трюк постоянно. В начале нового футбольного сезона, в преддверии чемпионата мира или премии «Оскар» в газетах часто пишут о «гениальном» математике, который предсказал вероятность победы определенных команд или фильмов. Эти прогнозы зачастую выглядят обоснованными, а иногда они оказываются и верными. Но откуда они берутся?
Я открою вам секрет. Эти гении обычно используют распределение Пуассона и немного справочной информации о командах или фильмах. Для моделирования результатов в футбольных матчах используется такая хитрость – рассчитать показатели забитых и пропущенных голов для каждой команды и затем симулировать матчи между ними. Например, в Премьер-лиге сезона-2012/13 «Арсенал» забивал в среднем 2,47 мяча в домашних играх и 1,32 в матчах на выезде. Пропускала команда 1,21 гола дома и 0,74 на выезде. Собирая такую статистику для каждой команды, а затем моделируя игры между всеми парами, мы можем создавать прогнозы на предстоящий сезон. Пример такого предсказания приведен в таблице 1.1, где я использовал данные из сезона-2012/13 и модель, чтобы спрогнозировать четверку лучших в сезоне-2013/14[9].
Таблица 1.1
Лучшие четыре клуба после первой симуляции сезона-2013/14, основанной на коэффициенте забитых голов в течение сезона-2012/13
Этот прогноз не слишком разошелся с тем, что было на самом деле. В реальности «Манчестер Сити» стал чемпионом, оторвавшись на два очка от «Ливерпуля», а «Челси» занял третье место. Но эта таблица – лишь один из многих вариантов четверки, который я получал при нажатии кнопки «Запустить» на компьютере. Каждый раз, когда я запускаю симуляцию, команды встречаются друг с другом дома и на выезде, счет матча выбирается случайным образом на основе средних показателей забитых и пропущенных голов, и я составляю таблицу на основе результатов. Каждый запуск дает разные результаты, иногда совсем разные. В качестве еще одного примера можно привести таблицу 1.2.
Таблица 1.2
Лучшие четыре клуба после второй симуляции сезона-2013/14, основанной на коэффициенте забитых голов в течение сезона-2012/13
Как фанату «Ливерпуля», этот вариант мне нравится намного больше. Он отображает альтернативную реальность, в которой Стивен Джеррард не поскользнулся в решающей игре против «Челси», а «Ливерпуль» выиграл свой первый чемпионат почти за 25 лет. Джеррард перенес бы позитивную энергию на чемпионат мира, где Англия победила, а сам Стиви Джи был бы посвящен в рыцари. Существует множество возможных альтернативных реальностей, поэтому я могу выбрать ту, которая мне больше всего нравится.
К сожалению, объективный ученый во мне чувствует, что ему необходимо сообщить все результаты симуляций. Всего пара минут уходит на то, чтобы на моем ноутбуке запустить симуляцию Премьер-лиги десять тысяч раз, и каждый раз я получаю разный результат. Какой бы интересной ни была каждая из вариаций, по отдельности они несущественны. Важно обобщить, что происходит во всех десяти тысячах. Как часто та или иная команда выигрывает титул? Мы видим, что «Ливерпуль» стал чемпионом всего в 11,5 % симуляций. «Манчестер Юнайтед», победивший в лиге сезоном ранее, выиграл в 26,2 %. «Челси» набрал 19,2 %, «Арсенал» – 17,6 %, «Манчестер Сити» – 12,8 % и «Тоттенхэм» – 6,0 %.
Оглядываясь назад, мы можем увидеть, что эти предсказания были неверными. «Манчестер Юнайтед» сменил тренера и провел ужасный сезон. «Манчестер Сити» и «Ливерпуль» доминировали, обе команды забили более ста голов. Но дело не в этом. Я, конечно, не собираюсь утверждать, что уже создал лучшую модель футбола. Мы только в начале нашей истории, и я не хотел бы раскрывать все карты сразу.
Важным моментом является вот что. Хотя эта модель основана на случайности и не совсем правильная, она в то же время не является абсолютно неправильной. Предполагаемыми чемпионами становятся преуспевающие команды, а итоговая таблица выглядит похожей на реальные результаты сезона или по крайней мере не слишком отличается от ожидаемых. И мы получили это без существенных размышлений. Мы просто симулировали голы в случайном порядке (причем у каждой команды был свой показатель забитых голов) и получали финальную топ-четверку. Это почти полная противоположность непредсказуемому футболу, который описывал Пол Гаскойн. Футбол очень предсказуем. Более 400 игроков на протяжении всего сезона Премьер-лиги каждую неделю бегают и пинают мяч, а побеждает все равно большой клуб из Лондона или Манчестера.
Прогнозирование, основанное на случайности, – это основное применение математики в обществе сегодня. Пока вы ожидаете оператора на линии, аналитик уже изучил скорость, с которой звонки поступают в справочную службу и выяснил, как долго люди готовы ожидать. К тому моменту, когда банк предоставляет деньги маленькому бизнесу или новому домовладельцу, он уже определил вероятность банкротства и применил распределение Пуассона, чтобы выяснить, со сколькими банкротствами он столкнется в ближайшие годы.
Прогнозирование не сможет точно сказать вам, какой клуб победит в чемпионате, как долго вы будете ожидать на линии и какая компания станет банкротом. Речь идет о частоте прошлых событий для расчета вероятности событий в будущем. Все эти предсказания возникают из математической модели, основанной первоначально на немецких солдатах, которых лягают лошади. Если вам нужна простая аналогия, вы можете сказать, что ожидание гола «Ливерпуля» похоже на ожидание автобуса номер 19 в праздничный день – сначала нет ни одного, а затем два или три приходят один за другим. Благодаря этой модели я сделал эту аналогию полезной. Математика позволяет нам выявить особенности, связанные с прибытием автобуса, футбольными матчами, банкротствами, раковыми заболеваниями и телефонными звонками. Затем это позволяет нам предсказать, как часто все эти события будут происходить.
9
В этой модели я использую четыре параметра для каждой команды: среднее число забитых голов дома (SH), пропущенных дома(CH), забитых(SA) и пропущенных(CA) на выезде. Они оцениваются по голам, забитым в сезоне-2012/13. Когда две команды встречаются в лиге в моем моделированном сезоне-2013/14, я сначала генерирую цели для хозяев. Они распределены по Пуассону со средним значением, равным 1/2 (SH + CA), которое учитывает атакующую силу хозяев и оборону гостей. Голы гостей распределены по Пуассону со средним значением, равным 1/2 (CH + SA). Чтобы получить полный сезон, процедура повторяется для всех матчей.