6 мин.

ЦСКА-Авангард. Итоги финала

Посмотрим на прогноз, сделанный до начала серии на основании продвинутой статистики. А так же проанализируем увиденное в самом финале. Но для начала небольшое отступление:

В начале второго раунда плей-офф КХЛ я в соавторстве с профессиональным хоккейным аналитиком стал постить итоги матчей в своем телеграме. Некоторые выводы удивляли, некоторые позволяли взглянуть на результаты матчей с другого ракурса. Но чтобы войти в тему, для начала нужно понять, какой статистикой мы оперируем. Т.к. интерфейс спортса пока не позволяет мне вставлять ссылки, добавлю в комментарии под записью.

Помимо матчей мы стараемся обращать внимание и на более общие темы. Например, как мог бы выглядеть анализ игры Динамо после завершения сезона и почему тройка Шипачёва не смогла вытянуть команду на себе. Также я возродил youtube-канал Разборка, где мы погрузились в нюансы победного гола Каски в финале Востока и увидели, как меньшинство Авангарда иногда всё же давало сбой.

Теперь непосредственно к финалу. Я старался сделать текст понятным даже без изучения графиков и цифр. Получились интересные выводы, которые местами идут вразрез с мнением хоккейной общественности.:

1. Активность команд (все броски, бросковые попытки, CF)

Все броски (Corsi For) в серии по периодам

Все броски (Corsi For) команд в финальной серии по периодам. Точные значения и гладкий график

Прогнозируемые значения для обеих команд не подтвердились. В предыдущих сериях ЦСКА в основном играл вторым номером, было много игры по счету. В серии против СКА команда Никитина выглядела менее активной. В финале ожидалось корси в среднем 15-16 за период. По факту 22-23.

Авангард, наоборот, снизил активность с CF 20 за период до 15-16. Много игры по счету, сверхминимальной активности и игры на удержание.

Фактор первого гола, когда забившая команда снижает активность, а догоняющая наращивает, не является причиной такой разницы в цифрах.

ЦСКА действительно пришлось чаще догонять соперника: 8 периодов против 5. Но ЦСКА играл активнее и при ничейном счете, и даже когда лидировал. Зачем тренерский штаб ЦСКА использовал такую стратегию, сказать сложно. Факт в том, что выбор оказался неправильным. Именно при относительном равенстве в показателе CF ЦСКА побеждал (отмечено красным), а при активной игре проигрывал.

2. Качество игровых действий (качество атаки, обороны, % разрушения, % в створ, сумма качеств атаки и обороны, реализация бросков)

Прогнозируемые значения качества атаки и обороны команд не подтвердились. Соответственно не подтвердилась сумма качеств атаки и обороны. Разрывы между качествами по серии получились большими: 0.8 по % в створ и 0.6 по % разрушения. Разница же по сумме этих показателей получилась 0.26 по медианному значению. Все в пользу Авангарда. При этом все прогнозные значения были в пользу ЦСКА. Но:

По вертикальной шкале в каждом графике - CF%, на сколько в % ЦСКА превосходил или уступал Авангарду в бросковых попытках. По горизонтальной - 1. Качество атаки (% в створ) 2. Качество обороны (% разрушения) 3. Сумма этих показателей 4. Реализация бросков

По вертикальной шкале в каждом графике - CF%, на сколько в % ЦСКА превосходил или уступал Авангарду в бросковых попытках. По горизонтальной - 1. Качество атаки (% в створ) 2. Качество обороны (% разрушения) 3. Сумма этих показателей 4. Реализация бросков

Все качественные метрики ЦСКА в прогнозе были получены при низкой бросковой активности команды. На графиках мы видим, как себя ведут метрики ЦСКА, когда активность увеличивается. Они снижаются. Еще раз возникает вопрос, зачем тренеры ЦСКА выбрали такую активную стратегию? Причем не меняя ее по серии до конца.

Теперь посмотрим на Авангард:

По вертикальной шкале в каждом графике - CF%, на сколько в % Авангард превосходил или уступал ЦСКА в бросковых попытках. По горизонтальной - 1. Качество атаки (% в створ) 2. Качество обороны (% разрушения) 3. Сумма этих показателей 4. Реализация бросков

По вертикальной шкале в каждом графике - CF%, на сколько в % Авангард превосходил или уступал ЦСКА в бросковых попытках. По горизонтальной - 1. Качество атаки (% в створ) 2. Качество обороны (% разрушения) 3. Сумма этих показателей 4. Реализация бросков

Качество атаки не проваливается по мере роста активности (CF%). Очень сильно проваливается оборона. Но сумма атака+оборона не уходит ниже определенного значения благодаря хорошему проценту попадания в створ. Авангард показал умение эффективно играть в широком тактическом диапазоне. Реализация просаживается меньше, чем оборона. А главное, у Авангарда было меньше безголевых периодов.

Отдельно по реализации: в прогнозе у Авангарда были выше медианные значения, но ниже средние. +0.4 медиана (что много) и -0.4 средняя. Во многом на этой метрике был построен прогноз по этой серии. Поскольку она тоньше чувствует скрытые преимущества, особенно медиана. В данной серии по средней реализации бросков было преимущество Авангарда 6.6% против 5.8%. Это единственная метрика, близкая к прогнозу. И единственная (но важная), в которой можно наблюдать относительное равенство команд.

3. Блокированные броски (БлБ)

Эта метрика в рамках прогнозных значений. Авангард по серии наращивал %БлБ. Прежде всего ответ на количество попыток бросков ЦСКА, а не некий ключ к победе, воспетый по ходу этого плей-офф.

 

Броски (блокируються)

 На графике четко видна зависимость. Чем больше бросков ЦСКА, тем больше больше блоков у Авангарда. Последний матч с 19 БлБ за период скорее говорит о плохом качестве бросков ЦСКА. Но не делает заблокированные броски главным и уникальным компонентом в хоккее.

Итог

По игре. Авангард заслуженно победил. Нужно выделить два момента. Первое: более широкий атакующий арсенал Авангарда. Ещё это называют технологиями. Второе: в плане подготовленности (функциональной, игровой, психологической) в финале, то есть здесь и сейчас, Авангард выбрал наиболее верную стратегию. Да, она более пассивная, чем у ЦСКА. Но ЦСКА не предложил свой ответ. А главное, стратегия Авангарда привела к победе.

По самому эксперименту с прогнозами на основе первичных и производных показателей. Прежде всего, нужно четко понимать, что хоккей - непредсказуемый вид спорта. С точки зрения прикладных дисциплин, изучающих работу сложных систем в условиях неопределенности (теория сложности, теория хаоса и тд.) на сегодня нет рабочих логических, предиктных моделей на таком уровне сложности системы. Тем не менее, любые эксперименты в этой области полезны, позволяют глубже понимать игру и приводят к созданию рабочих инструментов, которые можно использовать в хоккейной аналитике.

P.S.

Мы задавались вопросом, почему штаб ЦСКА принципиально не менял рисунок игры. Можно предположить, что оценка игры команды проводилась на основе ожидаемых голов (expected goals, xG) или с большим влиянием этого показателя.

Скриншот из модного хоккейного ютуб-канала. Данные Instat

Стабильное преимущество по xG могло скрыть необходимость перемен. Ведь если был перевес по голам ожидаемым, значит должен появиться и по реальным? Но на деле все оказалось сложнее. Ещё раз, это только предположение. И всех деталей работы штаба ЦСКА мы не знаем и не можем знать.