5 мин.

Футбольный «+/-» для игроков

Футбол - запутанная игра, слишком многогранная, чтобы математизировать её. При этом результат матча далеко не всегда отражает качество игры команды, и встаёт вопрос: возможно ли создать систему, показывающую, какая команда была лучшей на поле не по результату, а по игре.

За последние годы футбольное сообщество добилось немалых успехов, в частности, система xG - "expected goals". Вкратце о том, как работает эта система, разработанная Майклом Кэли: каждому удару присваивается свой коэффициент опасности в зависимости от типа удара (удар головой, удар, последовавший после кросса) и точки, откуда был нанесён удар (атакующая треть разделена на зоны, у каждой свой коэффициент: очевидно, что удар из вратарской куда опаснее удара с 30 метров с острого угла), а затем полученные коэффициенты суммируются, и получается наглядная картина матча.

К примеру, матч "Норвича" с "Ливерпулем" был сыгран со счётом 4:5 в пользу гостей, в то время как данная система отсчитала 1.5 ожидаемых голов у "красных" и 0.6 (не считая пенальти у "канареек", которому, кстати, присваивается коэффициент около 0.8) у их оппонентов. Или ещё один пример: недавний матч "Арсенала" с "Саутгемптоном", завершившийся нулевой ничьей, насобирал аж 2.9 "голов" команды Арсена Венгера и 0.8 - подопечных Кумана, что свидетельствует о прекрасной игре Фрейзера Форстера в рамке ворот гостей вкупе с неудачной игрой "канониров" в стадии завершения. Также существует система "unexpected goals", или "non-shot expected goals", связанная с вышеописанной, которая заключается в подсчёте созданных моментов, после которых удары нанесены не были (такие, как неудачная обводка вратаря, элементарный промах по мячу и тому подобное) с аналогичными коэффициентами.

Однако эти системы оценивают игру всей команды, в то время как индивидуальные действия каждого игрока все ещё остаются загадкой: сколько сделал Рияд Марез для столь успешного выступления "Лестера", сколько сделал Роберт Хут, а сколько - Марк Олбрайтон? Кто полезнее на поле для xG всей команды - Пабло Сабалета, Серхио Агуэро, Кевин де Брюйне? Может, Хесус Навас?

Одним из способов выяснить это является статистика "+/-", широко применяемая в баскетболе и хоккее. Система отсчитывает количество забитых и пропущенных голов за время, пока игрок находится на поле. В этом методе есть, безусловно, недочёты и уточнения, например, такие, как партнёры футболиста (насколько они хороши), оппонент (сила соперника) и значимость матча (разница между товарищеским матчем и условным принципиальным соперничеством в полуфинале Лиги Чемпионов очевидна).

Также препятствием применения системы "+/-" здесь является то, что по природе своей футбол - низкорезультативный вид спорта (в отличие от баскетбола, в частности, той же НБА, где команды вместе забивают около ста очков в среднем). Игрок, действительно влияющий на ход игры, ввиду обстоятельств мог получить -1 за время пребывания на поле, а после замены (например, из-за усталости) футболисту, вышедшему вместо него, могла улыбнуться удача, и его партнёры забили три гола без участия данного игрока. Забивание голов - капризная деталь футбольной статистики, зачастую не подчиняющаяся логике, так что использование "плюс-минуса" на основе голов - не очень удачный выбор. А что с xG?

Была использована система, совмещающая "expected goals" и "unexpected goals" [пришлось уточнять данную информацию у автора в твиттере]. Данный метод разбивает матч на несколько отдельных сегментов, в каждом из которых на поле находятся одни и те же игроки, а новый период начинается, когда в составе происходит изменение (замена, удаление). Показатель xG подсчитывается для каждого периода, после чего сумма конвертируется в среднее значение за 90 минут.В данном уравнении каждый игрок является "переменной" - такова идея; задача вклада каждого игрока в достижение большей разницы xG для команды может быть решена с помощью уравнения регрессии (более подробная информация о расчёте по ссылке ниже в оригинале). Для удобства использованы коэффициенты, сведённые к нулю (дабы не создавать чересчур большие разрывы между показателями игроков).

Для начала, я [автор - прим. автора] рассчитал "+/-" для последних трёх сезонов АПЛ (2012/13-2014/15). Учитывался каждый игрок, появивишийся на поле за всё это время, без какого-либо ограничения по сыгранным минутам, хотя для игроков, сыгравших меньше 900 минут, статистика куда менее точная.

Что ж, график ниже показывает отношение игроков с различными показателями "+/-" за 90 минут. Если мы возьмём команду из 11 игроков, показатель (разница) каждого из которых равен нулю, разница xG всей команды будет равна нулю. Заменив какого-нибудь такого игрока на другого с результатом, равным 0.10, разница, соответственно, увеличится на 0.10.

Показатели xG

 

Показатель"+/-" каждого игрока может быть равен от -0.15 до 0.15, то есть, заменив игрока с нулевым результатом игроком с показателем 0.15, команда получит лишние 5.7 голов разницы за сезон, что даст примерно 4 дополнительных очка команде в среднем.

Ниже вашему вниманию предоставляется таблица лучших тринадцати игроков АПЛ за рассматриваемый период (учитывались игроки, отыгравшие больше 3420 минут, т. е. больше одного сезона)

Наиболее значимые игроки

Вполне предсказуемо появление в топе игроков Венсана Компани (всем давно известно, что оборона "Манчестер Сити" с бельгийцем и оборона без него - две разные истории, что особенно ярко показывает сезон нынешний), Пер Мертезакер тоже не должен вызывать вопросов - громадный немец стабилен на дистанции и крайне полезен и в обороне, и на стандартах в атаке. Смотрим на третье место в списке - ... Джо Аллен! Даже самые близкие его друзья и родные на вряд ли осмелились бы заявлять, что валлиец - один из полезнейших игроков Премьер-Лиги, но модель показывает, что полузащитник добавляет "Ливерпулю" мозгов на поле, что Джо - ценный актив, который поднимает общий уровень игры, находясь на поле. Никто не скажет, что Аллен - техничный, супернадёжный футболист или игрок с лучшим видением поля в Англии, но когда "валлийский Пирло" выходит на поле, он действительно добавляет игре команды организованности, идейности. Этот результат неочевиден, но ведь одна из целей подобного анализа - найти, выделить игроков, которые обычно не будут никем отмечены, и в этом она преуспела.

Интересно отметить самых полезных форвардов Премьер-Лиги - Дэниэла Старриджа и Серхио Агуэро (что совпадает с моим личным представлением о двух лучших страйкерах чемпионата, когда оба в строю), а также полезнейшего вратаря - Уго Льориса, а вовсе не Давида де Хеа, Симона Миньоле(ха-ха), Джо Харта или Петра Чеха, но при этом надо понимать, что статистика для голкиперов совсем другая, здесь не учтены процент сейвов, "суперсейвов", ударов из Danger Zone и т.д., так что вратарскйи рейтинг должен быть построен иначе (основываясь на вратарских способностях).

Оригинал: http://2plus2equals11.com

Вашему вниманию предоставлена первая часть текста: во второй мы рассмотрим недочёты системы, найдём ошибки, объясним вторую графу (Standard Errors) и подведём итоги. Продолжение скоро!