5 мин.

Пользователь Reddit выбрал лучшие команды в истории АПЛ и просимулировал 10 тысяч сезонов. «Юнайтед» не попал в четверку

Болельщики постоянно спорят о том, чемпионство какого клуба круче. В реальном времени такое сравнение провести невозможно – как вы запихнете в один чемпионат «Арсенал» 2004 года и «Сити» 2019, например? 

Остаются только сложные математические модели и симуляции. Этим и занялся пользователь Tsubasa_sama на Reddit. В своем исследовании он взял 19 сильнейших команд в АПЛ по количеству очков за сезон и «Дерби» – команду, набравшую в сезоне 2007/08 всего 11 очков (худший результат лиги).

Список команд (по данным Transfermarkt):

«Манчестер Сити»: 2011/12 (чемпионство в последний день), 2013/14 (Джеррард поскользнулся и дал дорогу к титулу), 2017/18 (команда побила несколько рекордов), 2018/19 (действующий чемпион, обошедший «Ливерпуль» на одно очко);

«Ливерпуль»: 2018/19 (наибольшее количество очков (97) для команды, которая пришла второй);

«Челси»: 2004/05 (команда пропустила всего 15 голов – рекорд АПЛ), 2005/06 (девять побед подряд на старте), 2009/10 (рекордное количество голов, забитых дома – 68), 2014/15 (возглавлял таблицу в 37 из 38 туров), 2016/17 (выиграл 13 матчей подряд при Конте);

«Манчестер Юнайтед»: 1999/2000 (в следующий после требла сезон команда набрала 91 очко), 2006/07 (первое из трех подряд чемпионств), 2007/08 (лучший сезон Роналду в Англии), 2011/12 (проиграл «Сити» по разнице голов в последний день), 2012/13 (Робин ван Перси забил 26 голов);

«Арсенал»: 2001/02 (второй титул Венгера в Англии), 2003/04 («Непобедимые»);

«Тоттенхэм»: 2016/17 (Харри Кейн забил 29 голов в АПЛ, а команда набрала 89 очков).

Методология:

(Можете сразу пролистать на результаты – тут будет много математики).

Если в лиге 20 команд, то сезон состоит из 380 матчей. Фундаментальное предположение, которое сделал автор:

количество голов, забитых командой, соответствует распределению Пуассона;

среднее значение зависит от силы атаки команд и силы обороны противников.

Это разумное предположение, поскольку распределение Пуассона, как правило, смещается в сторону меньших чисел, если среднее значение мало (футбол – игра с низкими показателями). Однако этот метод не идеален: например, наличие голов в матче не зависит от того, когда был забит последний. Если «Сити» забьет 2 «Ливерпулю» на выезде во втором тайме, то скорее всего успокоит игру – такого сценария метод не отображает.

Кроме того, голы – достаточно редкое событие в футболе, а потому размер выборки тоже невелик. Логичнее и эффективнее было бы использовать метод, основанный на xG, но эти цифры недоступны для старых команд. 

Для каждой команды Tsubasa_sama рассчитывал 4 параметра: атака дома, защита дома, атака в гостях, защита в гостях. 

Рассмотрим на примере «Сити» 2018/19:

  • В то сезоне команда забила 57 голов в 19 домашних играх. Это в среднем 3,000 за матч. То есть против «среднестатистической команды» коллектив Гвардиолы забивал 3 гола на «Этихад». 

  • «Сити» пропустил 12 голов дома в 19 матчах – в среднем 0,632. Та же самая «среднестатистическая команда» пропускала дома 1,186. Защита «Сити» относительно среднего показателя лиги составляет 0,632/1,186 = 0,533.

По этой же схеме автор получил коэффициенты для всех команд в чемпионате.

Подсчет на примере матча «Сити» 18/19 – «Дерби» 07/08

«Сити» дома принимает «Дерби».

Сколько забьют «горожане»?

Домашняя атака «Сити» * выездная оборона «Дерби» = 3,000 * 1,583 = 4,749.

Так же считается и количество голов от гостей

Выездная атака «Дерби» * домашняя оборона «Сити» 0,421 * 0,533 = 0,224.

То есть в среднем этот матч закончится 5:0. Для остальных 379 игр в сезоне расчет происходит таким же образом. Тем не менее, количество голов в одной конкретной игре может быть случайным – все из-за распределения Пуассона.

Мы ожидаем, что «Сити» забьет 4,749 гола в этой игре, но по распределению Пуассона есть 0,86% на то, что команда не забьет ни одного! 

Чтобы результаты получились точными, автор провел 10 тысяч симуляций – такое количество повторений свело случайность к минимуму. 

Средняя таблица после 10 тысяч симуляций

  • Если не считать «Дерби», между 1-й и 19-й командой всего 23 очка. 

  • Рекордсмены «Сити» 17/18 и 18/19 подтвердили свой статус, забравшись в тройку. Второй – «Челси» 2004/05 с невероятной защитой. 

  • «Тоттенхэм» 2016/17 в среднем выступил лучше, чем чемпион того сезона «Челси».

  • Во всех симуляциях «Дерби» заканчивал на 20-м месте, забивая в среднем 11,4 и пропуская 152,3 гола. Так над «Дерби» не издевались даже в сезоне 2007/08.

Кросс-таблица (какая вероятность у команды закончить сезон на конкретном месте)

Все команды в выборке (кроме многострадального «Дерби») выиграли чемпионат хоть раз. Чаще всех это делал «Сити» 18/19 (победа в 2195 симуляциях).

У «Челси» 2004/05 1909 титулов, у «Сити» 2017/18 – 1781. Закрывает новую «Большую четверку» «Ливерпуль» 2018/19: команда Клоппа побеждала 1420 раз.