Продвинутая статистика: как разница в счете влияет на Corsi

Этот пост написан пользователем Sports.ru, начать писать может каждый болельщик (сделать это можно здесь).

Всем хорошего воскресного вечера! Поздравляю с началом предсезонных турниров в КХЛ, побед вашим командам. Всю неделю читал различные новости, статьи и интервью, посвященные прошедшим матчам, и несколько раз встретил упоминание о Corsi. Если специалистам оно знакомо, то далеко не все любители хоккея понимают его значение.

Corsi For (CF) – это количество бросков (броски в створ, броски мимо ворот, заблокированные броски), нанесенных командой. Corsi Against (CA) – это количество бросков (броски в створ, броски мимо ворот, заблокированные броски), нанесенных соперником команды. В качестве результирующего показателя используют CF%=[CF/(CF+CA)]*100%. Когда он больше 50%, команда бросает больше соперника, то есть имеет преимущество в матче.

Сегодня я проанализирую CF% команд НХЛ в сезоне 14/15 с точки зрения 7-ми разных состояний счета (ничья, разница в счете в 1 шайбу, 2 шайбы, 3 и более шайб) и покажу, что бросок при -3 имеет большую угрозу, чем бросок при +3.

Загружаю...

Пока смотрим только на расположение групп CF%, не обращая внимания на размер и цвет кружков. Мы все видим семь "ступеней", которые спускаются вниз. CF% наиболее высок, когда команды уступают 3 и более шайбы, и наименее высок, когда команды выигрывают 3 и более шайбы. Это подтверждает, что проигрывающая сторона отправляет все силы в атаку, обстреливает чужие ворота с любых позиций и получает серьезное преимущество по броскам. Наиболее тесно отметки расположены в ситуации "ничья", значит, в этот момент команды примерно равны между собой по количеству нанесенных и пропущенных бросков.

Кстати, замечательные отметки, которые вечно оказываются намного ниже основной группы и говорят о полном проигрыше по броскам, принадлежат одной и той же команде. Нет, не "Эдмонтону". Они принадлежат "Баффало" и подтверждают, что уже с середины сезона (если не раньше) эта команда начала сдавать все и вся в надежде получить право первого выбора на драфте-2015. Фортуна сполна наказала "клинков".

А теперь – сюрприз, изюминка Corsi и продвинутой статистики, о которой я говорил. Во-первых, диаметр кругов соответствует проценту реализованных бросков: чем выше процент, тем больше круг. Средний диаметр наиболее высок в ситуациях, когда команда выигрывает 2 и более шайбы, и это логично: при солидном преимуществе хоккеисты атакуют реже, но тщательнее. При большом отставании, наоборот, все звенья летят вперед и делают ставку на количество, а не качество, часто уступая вратарям. Средний размер кругов минимален.

Загружаю...

Во-вторых, цвет кругов соответствует проценту отраженных бросков: чем выше процент, тем ярче круг. Наиболее ярко выглядят группы в ситуациях, когда команды ведут в счете. Значит, в этот момент вратари более собраны, а соперники наносят наименее качественные броски. Тусклыми же получились результаты, которые хоккеисты показывают в роли догоняющих.

Различный уровень реализации говорит о том, что броски имеют различную ценность. Просуммировав количество бросков и взяв средний процент реализации, можно рассчитать коэффициенты для корректировки бросков во всех семи ситуациях. Так, при отставании в 3 и более шайбы ценность броска дома составляет всего 0.850 от броска при равном счете, а ценность броска на выезде – 0.895. В приведенной ниже таблице все коэффициенты для домашней команды (ДК) и гостевой (ГК). Заметим, что при ничейном состоянии счета бросок ДК менее ценен, чем бросок ГК. Это обусловлено тем, что существует минимальный статистический перевес у команды, которая играет дома из-за так называемого "фактора домашней арены".

Значит, при расчете CF% нужно корректировать броски на коэффициент, который соответствует ситуации на площадке. Я проанализировал обычный и скорректированный CF% команд НХЛ в сезоне 14/15 и сравнил с показателем "шайбы заброшенные" (ШЗ%). ШЗ%=[ШЗ/(ШЗ+ШП)]*100%. ШЗ – шайбы, заброшенные командой. ШП - шайбы, пропущенные командой. Если ШЗ%>50%, то цель достигнута: заброшено было больше, чем пропущено. 

Загружаю...

Как можно увидеть, между двумя видами CF% есть небольшое расхождение. Коэффициент корреляции (R^2) обычного CF% и ШЗ% составляет 0.297, а скорректированного CF% и ШЗ% - 0.308. Значит, скорректированный CF% лучше предсказывает разницу заброшенных шайб и именно его нужно учитывать в вашем анализе. 

Получился лонгрид, но надеюсь, что он был для вас интересен и полезен. Теперь мы знаем многое о Corsi. Стоит или нет оценивать команды и хоккеистов по CF% – делитесь мнением в комментариях, анализируйте предсезонные матчи, публикуйте выводы. Всем хоккей!

Этот пост опубликован в блоге на Трибуне Sports.ru. Присоединяйтесь к крупнейшему сообществу спортивных болельщиков!
Другие посты блога
Fancy Stats
Популярные комментарии
Ребристый Менгисту
А от их специалистов по продвинутой статистике много пользы? Ну наприглашали всякие Аризоны, Эдмонтоны да Нью-Джерси таких спецов – лучше что ли результаты стали?
Ответ на комментарий Имя
Спасибо автору!!! Забавно читать комменты про цифродрочеров, коонечно же, на хрена нам продвинутая статистика, это в НХЛ спецов в клубы приглашают, а нам то нах не надо и знать про неё у нас на глазок виднее, нам и знать то про неё никчему...Ещё раз автору спасибо, я наверное благодарный цифродрочер, нну или как это в женском роде...
kotbegemot2
На самом деле хоккей отстаёт в качестве статистики. Честно говоря, корси и фенвик не очень-то информативны. Скорее, они хороши по принципу "на безрыбье и рак рыба". Во-первых, они сильно зависят от счёта. То есть если команда при -1, -2 или -3 много бросает, это вовсе не обязательно означает, что она имеет преимущество. Соперник ведь может сознательно отдать территорию. Преимущество в игре - это то, что взято силой и/или мастерством независимо от желания и воли соперника. Надеюсь, система, о тестировании которой в НХЛ писали в прошлом сезоне, прошла эти тесты успешно и будет внедрена на постоянной основе и появятся новые интересные статистические показатели. В этом смысле хорошим примером может служить футбол, где существуют различные классификации пасов и ударов, которые много говорят о классе, манере игры команды и о её настрое. Кроме того, в футболе считают все единоборства (в Германии на этом вообще пунктик). В хоккее считают только единоборства на вбрасываниях. По крайней мере, только они есть в открытом доступе. А ведь это гораздо более силовая игра и статистика единоборств может многое сказать как о каждой отдельной игре, так и вообще о команде и игроке. Ещё помимо бросков важен подсчёт моментов (это ведь не то же самое, что броски). Их можно тоже в разных плоскостях классифицировать. Известно, что сами команды НХЛ их для себя считают и анализируют, но в открытом доступе их нет или такие сайты не очень популярны. Ещё подсчёт количества движения. В хоккее это наверно будет самый последний показатель, который начнут считать - слишком сложно в силу динамичности игры и постоянных смен.. Если бы всё это можно было качественно считать, никакие корси и фенвики не нужны были бы, потому что они слишком обобщённые и не конкретные.
Ответ на комментарий FancyStats
Спасибо! Главной целью этого блога является желание показать другую сторону хоккея и другие способы анализа. Хочется, чтобы не только за океаном этому уделяли внимание, чтобы аналитики, тренеры, да и обычные болельщики хотя бы были в курсе другой статистики, выходящей за пределы голов/передач. Следите за обновлениями)
Еще 12 комментариев
15 комментариев Написать комментарий