4 мин.

Продвинутая статистика: как разница в счете влияет на Corsi

Всем хорошего воскресного вечера! Поздравляю с началом предсезонных турниров в КХЛ, побед вашим командам. Всю неделю читал различные новости, статьи и интервью, посвященные прошедшим матчам, и несколько раз встретил упоминание о Corsi. Если специалистам оно знакомо, то далеко не все любители хоккея понимают его значение.

Corsi For (CF) – это количество бросков (броски в створ, броски мимо ворот, заблокированные броски), нанесенных командой. Corsi Against (CA) – это количество бросков (броски в створ, броски мимо ворот, заблокированные броски), нанесенных соперником команды. В качестве результирующего показателя используют CF%=[CF/(CF+CA)]*100%. Когда он больше 50%, команда бросает больше соперника, то есть имеет преимущество в матче.

Сегодня я проанализирую CF% команд НХЛ в сезоне 14/15 с точки зрения 7-ми разных состояний счета (ничья, разница в счете в 1 шайбу, 2 шайбы, 3 и более шайб) и покажу, что бросок при -3 имеет большую угрозу, чем бросок при +3.

CF%

Пока смотрим только на расположение групп CF%, не обращая внимания на размер и цвет кружков. Мы все видим семь "ступеней", которые спускаются вниз. CF% наиболее высок, когда команды уступают 3 и более шайбы, и наименее высок, когда команды выигрывают 3 и более шайбы. Это подтверждает, что проигрывающая сторона отправляет все силы в атаку, обстреливает чужие ворота с любых позиций и получает серьезное преимущество по броскам. Наиболее тесно отметки расположены в ситуации "ничья", значит, в этот момент команды примерно равны между собой по количеству нанесенных и пропущенных бросков.

Кстати, замечательные отметки, которые вечно оказываются намного ниже основной группы и говорят о полном проигрыше по броскам, принадлежат одной и той же команде. Нет, не "Эдмонтону". Они принадлежат "Баффало" и подтверждают, что уже с середины сезона (если не раньше) эта команда начала сдавать все и вся в надежде получить право первого выбора на драфте-2015. Фортуна сполна наказала "клинков".

А теперь – сюрприз, изюминка Corsi и продвинутой статистики, о которой я говорил. Во-первых, диаметр кругов соответствует проценту реализованных бросков: чем выше процент, тем больше круг. Средний диаметр наиболее высок в ситуациях, когда команда выигрывает 2 и более шайбы, и это логично: при солидном преимуществе хоккеисты атакуют реже, но тщательнее. При большом отставании, наоборот, все звенья летят вперед и делают ставку на количество, а не качество, часто уступая вратарям. Средний размер кругов минимален.

Во-вторых, цвет кругов соответствует проценту отраженных бросков: чем выше процент, тем ярче круг. Наиболее ярко выглядят группы в ситуациях, когда команды ведут в счете. Значит, в этот момент вратари более собраны, а соперники наносят наименее качественные броски. Тусклыми же получились результаты, которые хоккеисты показывают в роли догоняющих.

Различный уровень реализации говорит о том, что броски имеют различную ценность. Просуммировав количество бросков и взяв средний процент реализации, можно рассчитать коэффициенты для корректировки бросков во всех семи ситуациях. Так, при отставании в 3 и более шайбы ценность броска дома составляет всего 0.850 от броска при равном счете, а ценность броска на выезде – 0.895. В приведенной ниже таблице все коэффициенты для домашней команды (ДК) и гостевой (ГК). Заметим, что при ничейном состоянии счета бросок ДК менее ценен, чем бросок ГК. Это обусловлено тем, что существует минимальный статистический перевес у команды, которая играет дома из-за так называемого "фактора домашней арены".

Таблица

Значит, при расчете CF% нужно корректировать броски на коэффициент, который соответствует ситуации на площадке. Я проанализировал обычный и скорректированный CF% команд НХЛ в сезоне 14/15 и сравнил с показателем "шайбы заброшенные" (ШЗ%). ШЗ%=[ШЗ/(ШЗ+ШП)]*100%. ШЗ – шайбы, заброшенные командой. ШП - шайбы, пропущенные командой. Если ШЗ%>50%, то цель достигнута: заброшено было больше, чем пропущено. 

CF% обычный и скорректированный

Как можно увидеть, между двумя видами CF% есть небольшое расхождение. Коэффициент корреляции (R^2) обычного CF% и ШЗ% составляет 0.297, а скорректированного CF% и ШЗ% - 0.308. Значит, скорректированный CF% лучше предсказывает разницу заброшенных шайб и именно его нужно учитывать в вашем анализе. 

Получился лонгрид, но надеюсь, что он был для вас интересен и полезен. Теперь мы знаем многое о Corsi. Стоит или нет оценивать команды и хоккеистов по CF% – делитесь мнением в комментариях, анализируйте предсезонные матчи, публикуйте выводы. Всем хоккей!