Олимпийский хоккейный турнир с 10 командами был бы честнее? Моделирование говорит “да”

Этот пост написан пользователем Sports.ru, начать писать может каждый болельщик (сделать это можно здесь).

Многим бросилась в глаза заметная несбалансированность состава групп в мужском хоккейном турнире на олимпийских играх в Милане. В группа C первое место безальтернативно должна была занимать сборная США, тогда как в других группах сохранялась интрига. Первое место в группе открывает путь в 1/4 финала без раунда плей-ин, а высокое место в межгрупповой таблице (которое легко занять благодаря тому, что соперники по группе не столь сильны) предполагает в теории легкого соперника в 1/4 финала. Выход в полуфинал дает высокие шансы завоевать хоть какую-то медаль, ведь 3 из 4 команд-полуфиналистов завершают соревнования с медалями.

Итоги группового этапа олимпийского хоккейного турнира в Милане. Скриншот с сайта sports.ru

Можно сказать, что легкие группы и легкие пути до финала, равно, как и группы смерти с тяжелыми сетками, могут появится на каждом турнире. Это дело жребия, случайности. Концептуальный вопрос заключается в другом – может ли быть так, что несбалансированность группового этапа это не разовая случайность, а закономерность которая обусловлена форматом проведения турнира? Я решил проверить это при помощи статистического моделирования.

Загружаю...

Это важно – мои модели не были в прямом смысле симуляциями игр между сборными командами. Цель заключалась не в симулировании хоккея, а в проверке предположение о структурной несбалансированности турниров разных форматов. Сила команд была задана исходя из положения сборных в рейтинге ИИХФ до олимпийского турнира. В моей модели самая сильная сборная – Канада, а не США. Я разыграл турниры с разными посевами сборных в группах несколько тысяч раз и оценил, насколько часто команды выходят в полуфинал. Результат каждой игры и число забитых шайб были заданы согласно случайным числам из распределения Пуассона. Средняя результативность игр была зафиксирована равной 5.2 забитых шайб. Конкретный результат игр зависел от разницы рейтингов (=разницы сил) команд. Было учтено, что у более сильной команды ожидаемых голов должно быть больше, а у более слабой – меньше. Если в основное время возникала ничейная ситуация, то моделировались овертаймы, а потом и серии буллитов, в которых была предусмотрена значительная случайность определения победителя, но команда с высоким рейтингом все равно имела большие шансы на победу. 

Турнир с распределением команд по группам «как на олимпиаде» был разыгран 30 тысяч раз. Также по 4 тысячи раз были разыграны турниры с 150 альтернативными посевами команд в группах. То есть, еще 600 тысяч альтернативных турниров. В итоге я получил количественные оценки вероятности команд разной силы дойти до полуфинала, и то, насколько эти вероятности «гуляют» от среднего значения – это называют стандартным или средним квадратическим отклонением. Все числовые оценки приведенные ниже основаны на этих результатах.

Итак, прежде всего, интересно узнать, насколько несбалансированным оказался групповой посев олимпийского турнира, как сильно он повлиял на шансы команд дойти до полуфинала по сравнению со средними в случайных посевах. Здесь без неожиданностей. Результат ровно тот, который можно предсказать интуитивно, бегло взглянув на составы групп. Серьезный буст в 5.8% для США и весомые штрафы для Чехии (-3.6%) и Швейцарии (-4.1%). Бусты чуть меньше 3% получили Финляндия и Швеция. Канада получила лишь небольшой бонус. Здесь надо заметить, что для самых сильных и самых слабых команд посев в группах не столь важен, поскольку они, как правило, выигрывают или проигрывают в своих группах вне зависимости от набора соперников. 

Загружаю...
Влияние состава групп "как на олимпиаде" на средние шансы сборных выйти в полуфинал. Сила команд была задана на основе рейтинга сборных до олимпиады.

Интересно, что в целом состав групп «как на олимпиаде» по общей несбалансированности не отличался от средней несбалансированности определенной для 150 альтернативных жребиев групп. Это означает, что баланс бустов и штрафов для команд определен структурой турнира, а не конкретным жребием «как на олимпиаде», хотя то, какие команды получают бусты или штрафы от конкретного жребия зависит. Иначе говоря, легкие группы и группы смерти будут формироваться в любом случае, но в них будут попадать разные команды. Тогда я решил проверить будут ли альтернативные форматы проведения турнира для 12 команд более справедливым. Я смоделировал еще по 600 тысяч турниров для двух альтернативных форматов: 1 – в плей-офф выходят по 1 победителю из 3 групп (всего 3 команды) и еще 5 лучших команд из межгрупповой таблицы, при этом первое место в общей таблице играет с восьмым местом, второе с седьмым и так далее; 2 – в плей-офф выходят 2 победителя (первое и второе место) из 3 групп (всего 6 команд) и еще 2 лучшие команды из межгрупповой таблицы. Оба формата без раунда плей-ин. Аналогично, для каждого были смоделированы 150 посевов команд в группах и разыграно по 30 тысяч турниров. 

Загружаю...

Оба альтернативных формата оказались хуже олимпийского. Значительно увеличились стандартные отклонения (усы на графиках), что говорит о большей случайности в определении состава полуфиналистов. Это происходит потому, что раунд плей-ин, в целом, страхует сильные сборные от невыхода в плей-офф в случае их провала на групповом этапе.

Сравнение шансов выхода команд в полуфионал в рамках разных турнирных форматов. Белые маркеры – состав групп "как на олимпиаде", закрашенные маркеры – среднее по 150 альтернативным составам жребиям групп.

Выходит, что формат олимпийского турнира самый справедливый? Вроде бы да, но только если участвуют 12 команд. Как это можно проверить? Конечно же, смоделировав еще 600 тысяч турниров, но уже с другим числом участвующих команд, например 10, разбитыми на 2 группы по 5 команд. Из 12 сборных, игравших на олимпиаде, я исключил две слабейшие по рейтингу (Латвию и Францию), но оставил Италию, как хозяйку олимпиады (если так важно, чтобы организаторы олимпиады принимали участие…). В плей-офф альтернативного турнира с 10 командами выходят 4 лучшие из каждой группы, первое место в первой группе играет с четвертым местом второй группы и так далее. Простая и понятная схема турнира.

Оказалось, что полуфинал такого турнира с 10 сборными оказывается существенно менее зависимым от начального распределения команд по группам. Это означает, что более сильные сборные имеют бОльшие шансы дойти до полуфинал. Иначе говоря, состав полуфиналистов сильнее определяется иерархией сборных по их силе, а эффект от того, как они случайно распределились по группам – меньше. Вроде бы, согласно спортивному принципу так и должно быть в честном турнире, побеждает сильнейший, разве нет? Для лучшей наглядности командные бусты и штрафы удобно сравнить с теми, которые были определены для «олимпийского» формата.

Влияние формата турнира на шансы команд выйти в полуфинал. Вертикальная черная линия и 0% – базовая вероятность формата турнира "как на олимпиаде".

Для лаконичной оценки несбалансированности турнирных форматов имеет смысл исключить самые сильные и самые слабые команды (их выход в полуфинал мало зависят от формата, а значит присутствие в сравнении будет затушевывать эффекты проявлящиеся для всех остальных команд). Другими словами, мы в целом не ожидаем, что Италия будет играть в полуфинале, а Канада до полуфинала наоборот не дойдет. Нам интересно, как формат турнира отразится на шансах сборных с менее предсказуемыми результатами. В итоге для набора команд «топ-6 без Канады» (США, Швеция, Финляндия, Чехия, Швейцария, Словакия), общий эффект снижения случайности полуфининальных пар в «справедливом» турнире с 10 командами по сравнению с олимпийским турниром составил 4.3%. Это весьма ощутимое искажение общего баланса, в то время как суммарные бусты и штрафы для двух отдельно взятых сборных могут достигать  даже двузначных чисел (на олимпиаде реализовалась такая комбинация, при которой эта величина составила 9.9%).

Загружаю...

Разве более справедливая форма турнира это не то что нужно для олимпийского соревнования, где медали должны завоевать сильнейшие сборные, а влияние всех случайных эффектов на результат быть минимальным? Что стоит за желанием организаторов провести структурно несбалансированное соревнование для 12 команд?

Этот пост опубликован в блоге на Трибуне Sports.ru. Присоединяйтесь к крупнейшему сообществу спортивных болельщиков!
Другие посты автора
mrR
Популярные комментарии
Make77777
А как решил 10 команд распределить по группам?
vas1105
10 групп по одной команде в два круга. 1 место выходит, последнее выбывает. Самый справедливый турнир будет
Ответ на комментарий Make77777
А как решил 10 команд распределить по группам?
3 комментария Написать комментарий