9 мин.

Статистика ожидаемых голов, xG: отражает ли всю картину?

«Ожидаемые голы» / также xG [expected goals] - это метрика, которая разработана для того, чтобы получить наиболее полное представление о том, насколько качественны выступления футбольной команды, не ограничиваясь при этом просмотром забитых/пропущенных мячей, и прочих первичных статистических данных.

Но всегда ли эти цифры точно отражают происходящее? И всегда ли xG отражает всю правду? Перевод познавательного видео-материала об аналитической стороне футбольного явления.

Метрика ожидаемых голов - это способ измерения результативности команды на основе подсчета «веса» создаваемых и получаемых моментов/ударов по воротам. Не все удары по воротам имеют одинаковый «вес», так, удар издали гораздо менее ценен для атакующей команды, чем удар с с близкой от ворот дистанции. Инструмент ожидаемых голов был разработан как способ дать больше информации о качестве шансов, чтобы получить представление о том, насколько качественные моменты генерирует команда в зоне соперника, и насколько качественны шансы соперников в своей собственной зоне.

Поэтому использование подобных моделей, построенных на основе больших данных в виде созданных моментов по ряду лиг и нескольких сезонов позволяет аналитикам обрабатывать информацию об отдельных ударах, чтобы определить вероятность того что они будут реализованы.

Получаемая информация зависит от конкретной модели, которая может учитывать: местоположение бьющего игрока; расположение игроков между мячом и воротами; расположение мяча в пространстве, или того - является ли конкретный момент передачей или ударом. Далее, модель выдает число между нулем - шансом, который не может быть забит, и единицей - шансом, который не может быть упущен. Это число будет отражать вероятность реализации удара.

Например, в английской Премьер-лиге пенальти имеет вероятность около 80 процентов - означает ожидаемый «вес» реализации удара: в таком случае «стоимость гола» или «хG пенальти» представляется в виде цифры 0,8.

Каждому шансу модель присваивает значение, затем, сложив все значения шансов, созданных командой за определенный период времени, и сравнив оэто бщее значение хG с фактическим количеством забитых голов, можно увидеть их соотношение.

Реклама 18+

Например, после победы над «Кристал Пэлас» (со счетом 4:1), «Арсенал» имеет в этом сезоне ожидаемое количество голов 53,8 - по сравнению с 66 фактически забитыми голами по данным статистического сайта-агрегатора «FB Ref». Это значит, что они перевыполнили показатель своих ожидаемых голов на 12,2 - другими словами, они забили на 12 голов больше, чем ожидалось.

На другом конце спектра, за тот же период, «Арсенал» имеет 27,0 ожидаемых пропущенных голов по сравнению с 26 фактически пропущенными. Это отражает превышение показателей, но гораздо более меньшее по сравнению с забитыми мячами, так, лондонский клуб пропустил на один гол меньше, чем можно было ожидать.

Если взять показатель «Арсенала» по xG ожидаемых голов и вычесть из него показатель хG пропущенных - получится ожидаемая разница мячей за период сезона, который завершился победой 4:1 над «Кристал Пэлас». Ожидаемая разница мячей у «Арсенала» составляет 26,7/28 за игру, итого получается 0,95 - этот показатель отражает ожидание того, что в среднем, они имеют совокупность моментов, содержащих в потенциале на один гол больше, чем у соперников.

Теперь очевидно, что «Арсенал» заслуженно занимает свое место.

С другой стороны есть «Борнмут», который имеет показатель разницы ожидаемых моментов за игру около -0.9. Это означает ожидание того, что они пропустят больше, чем соперники: примерно на 1 гол. Это отражается на их положении в турнирной таблице, где клуб Южного побережья в настоящее время занимает одно из мест на выбывание.

Но что происходит, когда позиция команды в таблице не отражает ее основные ожидаемые показатели по голам? Так ли просто предположить, что команда, фактически показывающая отличные результаты, в конечном итоге опустится туда, где, согласно их ожидаемых показателям, она должна находиться? Или же команда с низкими результатами должна держаться и ждать позитивного поворота событий?

В текущем сезоне английской Премьер-лиги подобная ситуация возникала несколько раз. Так, «Фулхэм» провел большую часть текущей компании в лиге на гораздо более высокой позиции, чем ожидалось на основе того, что показывали цифры. Показательно, что они были худшими в лиге по ожидаемому количеству пропущенных голов в тот момент, когда претендовали на место, дающее им право выступать в еврокубках.

ВАЖЕН КОНТЕКСТ

В таких ситуациях всегда стоит оценить контекст, чтобы понять, откуда взялись эти цифры. Если проделать это с «Фулхэмом», то становится очевидным, что большинство ожидаемых пропущенных голов приходятся на матчи против команд из верхней половины чемпионата. До сих пор, в этом сезоне, их ожидаемая разница пропущенных мячей против топ-команд составляет: 16,67, или их ожидаемая разница забитых и пропущенных мячей против остальных команд составляет: + 4,51. Теперь ясно, что значительную роль в их ожидаемом показателе по пропущенным голам играют матчи против команд из верхней половины таблицы.

Реклама 18+

Таким образом, несмотря на отрицательные показатели, контекст показывает, что «Фулхэм», вероятно, ближе к позиции в середине таблицы, чем можно предположить по ожидаемым значениям.

На другом конце таблицы находится «Лидс Юнайтед», выступающий под руководством Джесси Марша. Команда, с трудом достигающая побед, несмотря на позитивные ожидаемые показатели. Снова контекст может помочь в некотором представленим о том, почему это может происходить.

В этом случае поможет разделение значений хG на стадии игры: то есть когда игра имела ничейный счет, или когда команда отыгрывалась, имела преимущество; то вскоре стало очевидно, что они были гораздо более продуктивны в отрицательных состояниях игры, особенно когда надо было отыгрываться с 0-2. Другими словами, «Лидс» становился гораздо более опасной командой, когда проигрывал. Снова контекст обеспечивает некоторую ясность в понимании того, почему метрика ожидаемых и пропущенных головов - их разницы, иногда не отражает фактическое положение команды.

Если «Лидс» лучше генерирует показатель ожидаемых голов, когда уступает в счете, то это ставит под сомнение устойчивость их подхода в долгосрочной перспективе.

Методика ожидаемых/пропущенных голов/их разницы добавляет полезный слой полезных данных, который позволяет анализировать игру команды с большей степенью детализации, чем позволяли ранее доступные метрики. Однако они также требуют КОНТЕКСТА, чтобы избежать простого приравнивания сырых ожидаемых значений к качественной или ненадлежащей производительности футбольных команд.

Реклама 18+

Как и любой другой прогноз, хG лучше всего использовать в качестве направленной, а не абсолютной метрики. Ни одна модель не может использовать прошлую статистику конвертации шансов в голы и предсказать игру в будущем.

Те, кто изучал статистику или использует ее в своей профессии, не найдут в этом ничего удивительного. Даже самые лучшие статистические модели для того, чтобы быть полезными нуждаются в дополнительном контексте.

Мне кажется, что система xG используется по-разному. Например, если собрать все фактические статистические данные «Брентфорда» и сложить их вместе, то можно увидеть, что они удивительным образом коррелируют. «Брентфорд» очень близок к своим xG, xGa и xPts, и является одной из трех команд, чья ожидаемая позиция совпадает с фактической. У них лучший процент конверсии ударов в лиге и один из самых высоких показателей xG/шансов (не помню, кажется, у «Сити», было качественнее?) - и это не случайность, а результат правильной интерпретации и применения.

Система разработана таким образом, чтобы повышать качество моментов, которые создает команда, и снижать качество моментов, которые могут быть реализованы соперником.

Благодарю за Внимание! Любите, изучайте, и наслаждайтесь Футболом!