«Чужие здесь не ходят». Попытка придумать метрику xG для вратарей

Этот пост написан пользователем Sports.ru, начать писать может каждый болельщик (сделать это можно здесь).

То, что вратари - единственное амплуа игроков в футбол, где в РПЛ играют только русскоязычные игроки, подсказало первую часть названия статьи. Вторая же половина обусловлена ставшей основной за последний год темой блога - продвинутой статистикой. Дело в том, что большинство статистических исследований в футболе посвящены анализу атаки, а игру в защите рассматривают только через результат атак соперников: пресловутые xGA (ожидаемые голы соперников). Так что единственный показатель для оценки игры голкипера по метрикам xG - это разница между ожидаемыми (xGA) и реально пропущенными голами (GA). Он достаточно информативен, но сильно зависит от общего уровня соперничающих команд, особенно если в Лиге (как в РПЛ) есть большой разрыв в классе игроков. А основной «классический» показатель игры вратарей - процент отраженных ударов - никак не учитывает сложность ударов. Отсюда бесконечные споры о персоналиях вратарей РПЛ, возникающие из-за скудности критериев оценки. Внимание же к теме понятно с точки зрения вклада в развитие вратарской школы вратарей из СССР и России, поскольку даже награда от ФИФА названа в честь Льва Яшина.

Загружаю...

Составим таблицу из известных данных, касающихся игры голкиперов, разделив внутри клубов показатели разных вратарей. Помимо количества игр, в таблицу внесено количество ударов (Shots) и пропущенные голы (GA). По ним рассчитан процент отбитых ударов. Из продвинутой статистики UnderStat.com взяты ожидаемые голы, созданные соперниками (xGA), а также разница между ними и реально пропущенными мячами (xGA-GA). Этот столбец таблицы «расцвечен» в зеленый (если пропустили меньше, чем создал соперник) и красный (если больше) цвета. Желтым выделены вратари, сыгравшие 2 и меньше игр. Их показатели зачастую очень примечательны, но из-за малой выборки (меньше 15%) не очень надежны и в дальнейших расчетах учтены не будут.

Полученная таблица отражает сложность оценки уровня вратаря только известными показателями. И даже продвинутая статистика не помогает: при одинаковых «зеленых цифрах», определить кто лучше скажем из тройки Гудиев - Кокорев - Песьяков тяжело, поскольку имеется ряд факторов, не учитываемых при расчете. Например то, что количество ударов по их воротам различается в разы, также как и созданная соперником острота. При том, что корреляция основных показателей (% отбитых ударов и «убитых» голов) прослеживается: чем больше «зеленая» цифра, тем и процент выше. На мой взгляд это происходит потому, что показатель отбитых ударов никак не учитывает опасность отраженных ударов. Как его учесть? На мой непросвещенный взгляд может помочь процент опасности удара, равный отношению созданных соперником ожидаемых голов к общему числу ударов (xGA/shots). В физическом смысле он означает сколько опасности в среднем несет каждый удар по воротам. Он позволяет нивелировать разницу в количестве ударов и их опасности для разных вратарей. Полученные результаты приведены в нижеприведенной таблице в столбце, где зеленым и красным цветом «подсвечены» по 2 самых опасных и легких «судеб вратарей» в нынешнем сезоне. Но при определенной информативности процента опасности удара, его надо применять вместе с другими характеристиками, чтобы понять насколько качественно играл вратарь. Например удручающий % отбитых ударов Беленова станет понятен, если посмотреть на % опасности этих ударов. И наоборот, скажем Лещук имеет один из лучших % отбитых ударов, но их опасность невелика.

Загружаю...

Поэтому возникла идея получить универсальный показатель для оценки надежности вратарей. Для этого вспомним, что с точки зрения статистики, да и вообще здравого смысла, любой удар по воротам заканчивается либо голом, либо «сейвом» вратаря. Значит сумма двух рассчитанных нами величин (отбитых ударов и «опасности удара») должна равняться 1, или в процентном выражении - 100 %. Но только если вратарь пропускает столько ударов, сколько должен по xGА, что соответствует среднему по РПЛ уровню игры. Результаты расчета приведены ниже.

Полученные результаты позволяют на наш взгляд оценить в полной мере все аспекты игры вратарей и крайне удобны в интерпретации: все, у кого «надежность» больше 1 - хорошо играют, кто меньше - ненадежны. А Латышонок, который имеет 1,1 - вообще абсолютно лучший вратарь по сезону. Для наглядности результаты объединены по цветам.

Этот пост опубликован в блоге на Трибуне Sports.ru. Присоединяйтесь к крупнейшему сообществу спортивных болельщиков!
Другие посты блога
Кое-что о карме
Популярные комментарии
Андрей Кирилин
Кто бы мог подумать без погружения в статистику, что Зенит борется за чемпионство главным образом не из-за дорогих легионеров или оверперфоманса Глушенкова (на старте сезона), а из-за крутой игры своего голкипера :)
belwrestler
Вы даже не подозреваете, насколько правы в своей шутке. "Оверперформанс" Латышонка как раз и сложился за счет первых 6 туров, когда Глушенков "разрывал" статистику ожидаемых голов. А после 8 туров у него по "краже голов"+/- ноль. А вообще жаль, что из-за праздников этот материал прочитает мало юзеров - хотелось бы узнать мнение людей оп предложенному способу оценки вратарей.
Ответ на комментарий Андрей Кирилин
Кто бы мог подумать без погружения в статистику, что Зенит борется за чемпионство главным образом не из-за дорогих легионеров или оверперфоманса Глушенкова (на старте сезона), а из-за крутой игры своего голкипера :)
Андрей Кирилин
«В каждой шутке лишь доля шутки, остальное — правда» :) Мне нравится ваш способ оценки вратарей, но он подходит конкретно для анализа игры в "раме". Сейчас же от многих голкиперов требуется хорошая игра ногами, точные длинные передачи, грамотные выходы из вратарской или даже штрафной и т.д. Так что если перейти на более глобальный уровень, то сравнение произвести куда сложнее. Советую вам прочитать вот эту хорошую статью, тут как раз попытка в более глобальный охват: https://www.sports.ru/football/blogs/3281484.html Кстати, автор сообщал, что если хочется про РПЛ писать и нужна статистика определенная, то можно обратиться в Рустат, сказать, что пишешь статьи, они пойдут на контакт и предоставят данные. Может быть вам пригодится эта информация.
Ответ на комментарий belwrestler
Вы даже не подозреваете, насколько правы в своей шутке. "Оверперформанс" Латышонка как раз и сложился за счет первых 6 туров, когда Глушенков "разрывал" статистику ожидаемых голов. А после 8 туров у него по "краже голов"+/- ноль. А вообще жаль, что из-за праздников этот материал прочитает мало юзеров - хотелось бы узнать мнение людей оп предложенному способу оценки вратарей.
Еще 1 комментарий
4 комментария Написать комментарий