Как Иван лежа на печи xG считал

Этот пост написан пользователем Sports.ru, начать писать может каждый болельщик (сделать это можно здесь).

Есть такая профессия Родину защищать метрика Xg, которую пихают последнее время везде.

Тренеры говорят, что она их не интересует

Комментаторы и эксперты говорят, что тренеры лукавят

Болельщики смотрят на нее и оправдывают поражения своей команды в своих же глазах невезением: по xg же набрали больше чем соперники!

Я постараюсь ниже разобраться, что это за метрика и как ее трактовать, ведь ее истинное понимание приходит только если посидеть и самостоятельно попытаться посчитать несколько туров подряд

Упражнение было таково, что сначала я считал сам, а потом сравнивал с источниками. К слову, все источники дают порой очень отличающиеся результаты, что говорит к слабому доверию

Ремарка. Все, что я считал, я считал еще в прошлом году на матчах РПЛ

Источники

Считаю важным привести известные мне источники

  1. Yandex Спорттех https://t.me/yandex_sportstat. У них есть тг-канал где они публикуют, то что насчитали.
  2. раньше было в приложении Sports но куда исчезло (по крайней мере у меня)
  3. Матч ТВ показывает в своей трансляции минут за 15 до конца матча
  4. https://soccer365.ru/ - наверное больше всего нравится
  5. телеграмм РПЛ публикует (но похоже что это Яндекс)
  6. https://understat.com/ - раньше был жив но сейчас зашел - что то не грузится. Да и данные после сравнения со своими замерами, мне в последнее время казались странными

Терминология

Xg - это сумма ожидаемых голов команды в матче. Сумма: удар по воротам*вероятность забить из этого положения (средняя вероятность)

Загружаю...

Пример расчета:

Допустим у команды А было 3 удара по воротам

  • 1-й из положения откуда забивают каждый 5-й гол - 0,2 по xg
  • 2-й из положения откуда забивают каждый 2-й - 0,5 по xg (это откровенный выход 1 на 1)
  • 3-й из положения откуда забивают каждый 10-й - 0,1 по xg

суммарный Xg будет 0,8 - несмотря на то что команда имела 2 отличных момента, а 0,2 - это очень хорошо, команда на гол так и не наиграла

Важные ограничения на примерах и неочевидности при вычислении

  1. Самый важный, который чаще всего ломает вообще всю логику показателя, пример - это пенальти. Считается что вероятность забить пенальти 0,8 - соответственно вклад в xG будет 0,8. Представьте, что вратарь отбил и было добивание - в этом случае в xg войдут оба удара и пенальти и само добивание и часто xg этого момента будет 1,5!
  2. Тут же важен и xg самого пенальти - пенальти бывают созданные, а бывают левые. Левый - например, когда мяч случайно попадает в руку на краю штрафной, наверное смешно говорить о том что в этом случае команда наиграла на 0,8 xg
  3. если был прострел и игрок не дотянулся 1мм до мяча для удара в пустые ворота - xg будет 0 - удара не было
  4. Если был чистый выход 1 на 1, но вратарь бросился в ноги и забрал мяч - xg будет 0
  5. Если был дальний удар, вратарь ошибся и скинул мяч на голову сопернику в пустые ворота - xg будет 0,7 или около
  6. неназначенные пенальти и микровнеигры - тоже никогда не добавляют в xg, хотя есть явные ошибки арбитра и миллиметровое везение защитника защищающейся команды
  7. Очевидно что уровень мастерства повышается от лучших чемпионатов к худшим, поэтому xg в разных чемпионатах сравнивать можно но наверное не совсем корректно
  8. из 2 следует что xg так то и между командами одной лиги рознится так как и от исполнителей тоже зависит много, но я не видел чтобы это где то исследовали и мы этим тоже пренебрежем

Трактовка и заинтересованные стороны

Главный вывод из всего вышесказанного: Показатель Xg значит ровно то, что он значит по ОПРЕДЕЛЕНИЮ и ничего больше. Да, возможно, в 60% - 70% случаев она отражает распределение сил на поле и атакующий потенциал команд.

Но самый главный вопрос: кому нужны эти 60-70% процентов? В особенности, когда нет приличных источников веры. В футболе больше интересны конкретное состояние конкретной команды в конкретный промежуток времени. Все очень круто меняется от матча к матчу в зависимости от того, какие составы, как часто играл и кучи других метрик

Тренеры/аналитики команд - эти ребята готовятся к конкретным соперникам. Из вышесказанного маловероятно что их интересует xG - они сами посмотрят игры и посчитают атакующие потенциалы так, как им интересно

Болельщики: возможно, если игру ты не посмотрел а порубиться с друзьями за игру нужно

Эксперты и комментаторы: наверное это самые большие заинтересанты, они делают контент и наверное не всегда смотрят все матчи или смотрят все, но их очень много и трудно удержать все в голове

Внешние ребята которые занимаются оценкой команд - капперы, букмейкеры, независимые аналитики (не путать с экспертами, хотя иногда телеэксперты тоже разбираются и др.) - им очевидно эта метрика тоже не к селу ни к городу. На кону стоят большие деньги, которые такой метрике не доверишь

Мой вывод из этого всего: кто-то когда-то придумал метрику, в контент она вписалась и все продолжают бездумно ее считать подавая ее как атакующую силу команд

А какая метрика бы подошла?

Я, условно, причисляю себя к группе внешних аналитиков. Когда я считал Xg моей целью было реально оценить атакующий потенциал команд и силы команд в конкретной игре, поэтому я невольно задался вопросом - а какая метрика мне нужна, так как xG оказалась несостоятельна

Загружаю...

Пофантазируем и назовем ее xxG

  1. метрика должна решать проблем с частотностью. Это значит, что должно быть понятно сколько и какого качества моментов создали команды
  2. xg одного игрового момента не должен быть больше 1
  3. очевидные моменты для гола должны учитываться даже если не было удара (с дисконтом). К примеру это тот же самый 1 на 1
  4. отскоки должны считаться по первоначальному удару с премией за удачу. Пример: изначальный удар был с xg 0,07 а отскок - xg 0,7. Я для себя решил в таких моментах добавлять просто 0,15 xxg - надбавка за удачу (условно за то, что тот к кому попал мяч добежал и добежал возможно в то самое место куда был должен добежать или находился там где должен )
  5. должна отражать частотность моментов с xg более 0,15 (моменты с ударами и без) - это в целом может быть отдельная метрика моменты, но я добавил все в одну
  6. XG в периоды отсечки должен считаться отдельно: для себя я выбрал 4 универсальные ситуации

Как выглядит проектируемая метрика на примере

  • 1 цифра - сумма xxg с моментами <=0,25 xg
  • через плюс добавляем явные голевые моменты- c xg > 0,25 - их всегда очень мало или нет совсем но их надо увидеть отдельно
  • если пенальти то учитываем как xg момента но добавляем что это пенальти, например 0,25п
  • если пенальти левый 0п
  • так как xg момента у меня всегда меньше 1, то 2 удара в створ, с xg, например по 0,7, считаем как единый момент по формуле xg1м + (1- xg1м)*xg2м - таким образом он никогда не будет больше 1

Таким образом получим следующее отображение

xxG: 1,05(0,7+0п+0,35о) VS 1,6(1,2+0,4)

по фактам события матча команда 2 создала больше моментов и была лучше. В ЭТОМ ПРИМЕРЕ ПАРАМЕТР РАСЧИТЫВАЕТСЯ В СКОБКАХ А ЗА СКОБКАМИ ЭТО СУММАРНОЕ ЗНАЧЕНИЕ ДЛЯ ТОГО, ЧТОБЫ ПОТОМ СРАВНИТЬ С Xg

xG для сравнения: 2,2 VS 1,6 - команда 1 лучше команды 2, если принять что 0,35о состоял из момента 0,2xg и добивания после отскока на 0,5xg

Заключение:

Для себя я пришел в итоге к абсолютной бесполезности xg для какого-то прикладного применения. По поводу своей метрики я не претендую на какую-то эксклюзивность или идеальность, но она точно лучше xg показывает силу команд: надеюсь и уверен, что свои адекватные крутые метрики есть во всех тренерских штабах и компаниях, связанных с внешней аналитикой

P.S. посмотрим как это работает

сравнение xg (возьму от яндекса) и xxg (упрощенный, суммарный для целей сравнения цифр) для 22 тура РПЛ (я считаю xxg)

Ахмат - Ростов (xg хорошо отражает реальность)

xG: 0,39 - 1,67

xxG: 0,5 - 1,77

full xxG:

1т 0,35 + 0,15п - 0,07

2т |от 0 - 1 + 0,7

Комментарий: еще один матч, который заставляет задуматься - основной xg ростов внес последние 10 мин. Ужасный 1т Ростова. Отсечку поставил из за травмы Богосавца, вероятно игрока Ахмата было не очень хорошо.

Балтика 4 - 0 Сочи (xg хорошо отражает реальность)

xG: 2,46 - 0,12

xxG: 2,07 - 0,17

full xxG:

0,8 + 0,4 + 0,4 - 0,07

0,47 - 0,1

Комментарий: отличный 1т от Балтики и невнятный второй несмотря на количество голов.

Динамо 1 - 3 Зенит

xG: 0,41 - 1,24

xxG: 0,75 - 1,26

full xxG:

0,3 - 0,4 + 0пн + 0,33

0,3 - 0,4 |от 0,15 - 0,13

Комментарий: несмотря на все хвалебные речи после этой игры в сторону Зенита они сыграли обычную выездную игру, в которой имели один отличный момент. Другое дело, что и Динамо сыграло матч, который легко встал в ряд последних игр - почти без моментов.

Загружаю...

Краснодар 5 - 0 Пари НН (xg хорошо отражает реальность)

xG: 2,7 - 1,1

xxG: 3,14 - 1,05

full xxG:

0,52 + 0,5 + 0,5 + 1 - 0,3

0,42 - 0 |от 0,2 - 0,5 + 0,25п

Комментарий: можно увидеть, что во 2т команды были примерно равноостры несмотря на град голов в ворота Пари НН.

Крылья Советов 0 - 0 Рубин (xg хорошо отражает реальность)

xG: 0,44 - 0,28

xxG: 0,49 - 0,5

full xxG:

0,37 - 0,35

0,12 - 0,15

Локомотив 5 - 0 Акрон

xG: 2,15 - 0,76

xxG: 2,97 - 1,25

full xxG:

1,6 - 0,05 + 0,5 |от 0,62 - 0,1

|от 0,35 + 0,4 - 0,6

Комментарий: если смотреть на 1т то локо насоздавал огромную кучу моментов 1,6xg низкочастотных моментов - это огромное количество, а Акрон создал всего один хороший момент. Во 2т команды сыграли примерно равномикроостро. |от - означает что локо повел в 3 гола

Оренбург 0 - 2 Спартак

xG: 0,99 - 2,14

xxG: 1,1 - 1,53

full xxG:

0,25 - 0,4 + 0,33

0,45 + 0,4 - 0,8

Комментарий: мы видим что Оренбург и Спартак создали по одному отличному моменту, в остальном Спартак чаще создавал моменты, но по сумме ожидаемых голов ушел не далеко

ЦСКА 3 - 1 Динамо Мх

xG: 2 - 0,4

xxG: 2,54 - 0,95

full xxG:

0,65 + 0,9 - 0,32 + 0,33

0,15 + 0,5 - 0,3 |от 0,34 - 0

Комментарий: несмотря на огромный xg у ЦСКА видно что большая часть уложилась в 2 момента. у Динамо только момент с голом должен быть в классике 0,6 - 0,7, странные цифры от Яндекса на мой взгляд. В тоже время мы видим что кроме гола у дмх были только полумоменты но на общий гол они наиграли. Можно сказать и по другому - молодая связка защитников Лукин-Данилов точно наиграла на пропущенный гол по xg. Также можно видеть что до 3гола ЦСКА во 2т ничего не создал.

Этот пост опубликован в блоге на Трибуне Sports.ru. Присоединяйтесь к крупнейшему сообществу спортивных болельщиков!
Другие посты блога
RPL is my Love
Популярные комментарии
Петр Иванов_1116919959
Интересно. Но, как видно на конкретных примерах сравнения xG и xxG разница была не велика. В целом обе метрики отражали перевес игры. Интересно было бы почитать после каждого тура и увидеть аномалии в сравнениях на деле.
SportWatt
именно этот тур получился примером нормальности.
Ответ на комментарий Петр Иванов_1116919959
Интересно. Но, как видно на конкретных примерах сравнения xG и xxG разница была не велика. В целом обе метрики отражали перевес игры. Интересно было бы почитать после каждого тура и увидеть аномалии в сравнениях на деле.
2 комментария Написать комментарий