Что ждать от 27-го тура РФПЛ? Версия xG

Пару дней назад Леша Чернов написал с предложением начать новую рубрику – считать возможные xG в предстоящих матчах РФПЛ. По понятным причинам отказать я не мог, и мы взялись за дело, хотя важно понимать, что модель еще достаточно сырая. [nikitarfs]

Описание модели.

1. На длинной дистанции xG коррелирует с реальными исходами матчей

2. Ожидаемые созданные xG i-ой команды в матче против j-ой команды являются средним геометрическим от ожидаемых созданных xG i-ой команды и ожидаемых пропущенных xG j-ой команды. 

3. На xG влияет форма команды за последние 5 матчей, причем ближайшие прошедшие матчи имеют более высокий коэффициент.

Загружаю...

4. Команда может по-разному набирать очки в домашних и гостевых матчах. Коэффициент выводим, как отношение всех очков в другом статусе за матч разделить на число всех очков. То есть если команда играет дома, то выглядит это так:

Этот же коэффициент также будет стоять перед средним геометрическим, только в данном случае будет считаться уже прямое отношение. То есть, если команда играет дома, то будет браться отношение домашних очков ко всем очкам.

5. xG, созданные в матче с лидером и с аутсайдером имеют разный вес.

Естественно в моделе есть ряд недоработок:

Загружаю...

1. Было бы неплохо считать проценты на победу хозяев, победу гостей и ничью, но пока непонятно, как это реализовать. 

2. Было бы неплохо оценивать силу команд исходя не просто из числа набранных очков, а используя некоторую нормировку. Скажем, «Динамо» на старте сезона и сейчас – это две разные команды. Есть такой вариант: делить все игры на n групп, по степени удаленности. Скажем, первые несколько туров – одна группа, вторые – другая и т.д. Каждой группе присваивается свой вес (чем ближе к началу чемпионата, тем он ниже), который затем используется в виде коэффициента. Проблема в том, что это слишком энергозатратно.

3. Было бы неплохо подцепить к оценке силы команд не только их очки, но и их xG по ходу сезона. Задача, которая решается проще всего – достаточно посчитать xG за первые 20 туров.

[nikitarfs].

Расчеты для ближайшего тур

Ссылка на расчеты

«Крылья Советов» –  «Уфа»

Ожидаемые xG: 1,21 - 0,67

Последние матчи самарцев получились относительно качественными, чего не скажешь об уфимцах  5 проигрышей по xG в 5 матчах. При этом, подопечных Перевертайло отличает неплохая реализация  они вполне способны сделать гол из единственного момента, поэтому победа «Крыльев» совсем не очевидна.

«Ростов» –  «Локомотив»

Ожидаемые xG: 1,15 - 0,64

Несмотря на поражение от Мордовии, ростовчане сейчас на ходу, что нельзя сказать о железнодорожниках, уступавших по xG в последних трех матчах. Также хорошим подспорьем для дончан будут родные стены, впрочем, и Локо играет в гостях ничуть не хуже, чем дома. Логичным прогнозом на матч будет ничья или победа желто-синих с разницей в один мяч.

«ЦСКА» –  «Терек»

Ожидаемые xG: 1,59 - 0,54

В четырех последних матчах армейцы уверенно переигрывали своих оппонентов - и в этот раз забуксовавшие грозненцы вряд ли окажутся непреодолимым препятствием для команды Слуцкого.

Загружаю...

«Анжи» –  «Зенит»

Ожидаемые xG: 0,93 - 1,39

В этой паре такое низкое предполагаемое преимущество петербуржцев связано с тем, что только в последних двух матчах оборона сине-бело-голубых не позволила создать много моментов у своих ворот, тогда как до этого провела несколько не самых уверенных игр. Анжи тяжело выглядел в матче с Краснодаром, но до этого неплохо смотрелся в матчах против соперников в борьбе за выживание.

«Кубань» –  «Мордовия»

Ожидаемые xG: 1,88 - 1,30

Несмотря на то, что форма у Кубани еще хуже, чем у Мордовии, южанам сильно помогают родные стены, в то время как саранцы в гостях являются лишь бледной копией самих себя домашнего образца. Ожидаем небольшое преимущество краснодарцев с обилием голевых моментов.

«Рубин» –  «Краснодар»

Ожидаемые xG: 0,87 - 1,05

Казанцы провели несколько неплохих с точки зрения xG матчей, команда Галицкого тоже уверенно прошлась по уступающим классом соперникам. Только вот с реализацией у Краснодара полный порядок, чего нельзя сказать о Рубине.

«Амкар» –  «Урал»

Ожидаемые xG: 1,23 - 0,75

Находящемуся в плачевной форме Уралу придется тяжело в Перми. Амкар хоть и не блещет, но и не проваливается так, как шмели в матче с армейцами. При адекватной реализации можно ожидать непроигрыш пермяков.

«Спартак» –  «Динамо»

Ожидаемые xG: 1,62 - 1,2

Хорошую игру в обороне спартаковцы показали только в последнем матче, поэтому, согласно модели, бело-голубые вполне могут рассчитывать на забитый мяч. Не стоит забывать и про не слишком уверенную игру красно-белых на своем новом стадионе. Впрочем, глядя на нынешнее Динамо и разыгравшихся игроков атакующей группы Спартака, можно ожидать, что хозяева создадут больше моментов у чужих ворот.

Этот пост опубликован в блоге на Трибуне Sports.ru. Присоединяйтесь к крупнейшему сообществу спортивных болельщиков!
Другие посты блога
Без лжи об xG
Популярные комментарии
android11
Крутая тема, это будет классно, если сработает хоть как-нибудь, ведь ценность модели именно в предсказательной способности. Забавно, что я как-то тоже думал о почти таких же формулах для предсказания, жалко, руки не дошли сесть посчитать для какого-нибудь чемпионата. А почему силу соперника тоже нельзя оценивать во временном окне, вообще забыв про начало сезона? Что-нибудь типа количество очков в предыдущих 5 матчах? Ведь ситуация как у Динамо может быть и обратную сторону (см Лестер прошлого сезона). И ещё такой вопрос: а какой-нибудь тест модели вы проводили? Или просто интуитивно исходя из написанных соображений её конструировали? Ведь параметры типа временного окна можно пытаться подбирать, чем 5 лучше, чем 3, например?
AlFonLur
Весьма интересный материал, с удовольствием слежу за блогом, надеюсь, что дальше будет только интереснее и информативнее)))
nikitarfs
Не проводили тестов, а взяли число туров, за которые у меня есть данные) Про начало сезона забывать все же не стоит, потому что возможна ситуация, когда команда в начале всех мочила, потом пошли травмы и следственно спад. А теперь все травмированные восстановились. Нельзя же силу этой команды оценивать на основании только последних игр ослабленным составом, верно?
Ответ на комментарий android11
Крутая тема, это будет классно, если сработает хоть как-нибудь, ведь ценность модели именно в предсказательной способности. Забавно, что я как-то тоже думал о почти таких же формулах для предсказания, жалко, руки не дошли сесть посчитать для какого-нибудь чемпионата. А почему силу соперника тоже нельзя оценивать во временном окне, вообще забыв про начало сезона? Что-нибудь типа количество очков в предыдущих 5 матчах? Ведь ситуация как у Динамо может быть и обратную сторону (см Лестер прошлого сезона). И ещё такой вопрос: а какой-нибудь тест модели вы проводили? Или просто интуитивно исходя из написанных соображений её конструировали? Ведь параметры типа временного окна можно пытаться подбирать, чем 5 лучше, чем 3, например?
Еще 18 комментариев
21 комментарий Написать комментарий