Блог Без лжи об xG

Почему мы неправильно оцениваем вратарей

Когда у Теда Натсона – основателя Statsbomb.com, в свое время работавшего на «Брентфорд» и пару других клубов, спросили, какие позиции самые сложные для скаутинга, он назвал ЦЗ и вратаря. Про центральных защитников может быть пойдет разговор потом – как сказал мне однажды уже покойный Юра Елисеев, правда по другому поводу, это тема для отдельного анализа и не надо перепрыгивать с одного на другое, – а сейчас поговорим о вратарях.

Казалось бы, почему в числе самых сложных для оценки амплуа находится самое статичное? Ведь это так просто на первый взгляд – оценить, насколько хорошо вратарь отражает удары.

«Оценивать вратарский скилл очень сложно – вот почему я никогда не пытался делать это. Наряду с базовыми и фундаментальными навыками отражения ударов лучшие вратари должны уметь оценивать ситуацию и решать – выходить из ворот или остаться на ленточке. Игра на высоких мячах, организаторские навыки, коммуникации, игра ногами – это все очень важно. Соедините это все вместе, и вы получите перечень навыков, который практически невозможно оценить, используя обычную статистику» (Колин Трейнор)

При оценке вратарей зачастую существует не только проблема отсутствия релевантной статистики (и неумения ее интерпретировать), а также различные психологические моменты (впрочем, свойственные большинству жизненных аспектов):

  • Выработка мнения о вратаре на основе короткого отрезка и последующее восприятие только тех фактов, которые соответствуют заранее выбранной позиции, и игнорирование (зачастую неосознанное) тех, которые ей противоречат
  • Следование стереотипам: к примеру, что вратарь должен выручать, то есть последовательно играть выше ожидаемого уровня на ленте, или то, что рост имеет серьезное влияние на игру на выходах.
  • Установление оценок на основании только тех примеров, которые быстро приходят в голову. К примеру, небезызвестный чилийский вратарь один раз ошибается на выходе, этот момент крутят всю неделю по Sky – формируется общее мнение, что он на выходах плох. Однако затем он может ни разу не ошибиться, выходя на кросс, а пару раз сыграть даже блестяще, однако клеймо останется на нем до конца карьеры – или, по крайней мере, до следующей подборки на Ютубе.

При попытке анализа на основе статистики важно понимать, что далеко не все можно измерить числами, а то, что можно, зачастую нельзя трактовать однозначно. Вот примерный список основных важных навыков:

1)      Отражение ударов

2)      Выходы

3)      Ноги

4)      Throwing

5)      Sweeping

6)      Error making

7)      Организация защиты

Приступим.

Отражение ударов

Даже сейчас, когда можно достать достаточно подробные данные, основным инструментом для оценки эффективности игры на линии является процент отраженных ударов, что, конечно, прилично далеко от точности.

Во-первых, в таком случае все удары уравниваются исходя из предпосылки, что на дистанции всем бьют примерно с одинаковой сложностью, что, конечно, неверно. Вратарям андерграундных команд в среднем приходится сталкиваться с более сложными ударами, из-за чего они могут быть недооценены. Плюс, существуют нюансы, связанные со стилем игры команды.

К примеру, в АПЛ этого сезона активно форсится тема, что Гвардиола и Клопп ошиблись с выбором вратарей, что Браво, Кариус и Миньоле повально плохи. Однако, мало кто заглядывает глубже. Я даже не буду говорить об их важности для выхода из-под прессинга и построения атаки – тут есть другие нюансы. Слабо верится, что Кариус, который был хорош в «Майнце» (другая система по сравнению с Клоппом) и Браво, отлично, а местами просто блестяще игравший в «Сосьедаде» и «Барсе» (более устоявшаяся система, с обжившимися защитниками, а спустя 5 лет после ухода Пепа еще и с более вертикальным билдапом, отличная от того, что сейчас происходит в «Ман Сити»), резко стали плохи.

Неудивительно, что наиболее критикуемые вратари лиги играют именно в «Сити» и «Ливерпуле». Хоть Гвардиола на каждое сравнение с Клоппом отвечает, что они совершенно разные, сходств достаточно много, особенно после того, как немец начал все больше дрейфовать в сторону позиционного футбола (например, потому, что осознает те проблемы, которые возникают у «Ливерпуля» с андерами), внедряя элементы Juego de Posicion (концепции, к которой Гвардиола привержен со времен работы в «Барселоне-Б»).

В чем-то Пеп прав – Клопп любит атаковать заднюю линию соперника большим числом игроков, грузить центр, создать ситуацию для рывка Мане за спину. Гварди же в большей степени нацелен на айзо, веря в скилл дриблинга Сане и Стерлинга. Однако, сходства есть.

«Сити» и «Ливерпуль» схожи. 4-3-3 с очень редкими отклонениями у Клоппа и 4-3-3 у Пепа в качестве базы (тут, правда, мутаций по ходу сезона гораздо больше). Перед обороной, в позициях контролирующих опорников, люди, всегда игравшие несколько выше – Хендо и Туре (окей, можно всерьез забиться за Фернандиньо, однако даже при Пеллегрини всегда были вопросы касательно целесообразности использования его так глубоко) – сравните с Почеттино, который играет с чистым разрушителем перед обороной (Ваньяма), из-за чего больше надежности, но страдает билдап. В центре – игроки, привыкшие играть в атакующих тройках или на флангах – Де Брюйне называл свои с Сильвой роли в этом сезоне «свободными восьмерками», Лаллана до этого сезона играл выше, Вейналдум вообще лучшие игры проводил на фланге.

Добавьте сюда рискованную позиционную структуру, когда одновременно оба фланговых защитника уходят вперед, и сзади остается только по два игрока (вместо трех, как делает большинство в АПЛ) – уже потенциальная уязвимость перед контратаками. И в «Сити», и в «Ливерпуле» игроки только учатся контрпрессинговать в новых системах – неудивительно, что часто эти попытки разбиваются, и соперник убегает в контры. Шансы в контратаках в подавляющем большинстве случаев более высокого качества – сопротивление при ударах меньше, зон больше, вратари не получают достаточной поддержки.

Неудивительно, что два своих лучших матча в сезоне «Лестер» сыграл как раз против «Сити» (4:2) и «Ливерпуля» (3:1) – когда вся лига, понимая, в чем была их сила, подстраивается, чтобы избежать разрушительных контратак, Пеп и Клопп играют рискованно, излишне компактно, агрессивно, с высокой линией.

Допущенные удары в среднем за матч:

«Сити» – 8

«Челси» – 8,2

«Ливерпуль» – 8,2

Это три лучших команды в лиге по защите. Клопп на вопросы об уровне обороны ни раз отвечал, что «Ливерпуль» ограничивает соперника на небольшое число ударов за матч. Однако, если контрпрессинг не срабатывает, возникают опасные шансы в контрах (плюс стандарты, естественно, но это отдельная тема) – вратарям не часто бьют, но если бьют, то обычно на убой. Истина где-то посередине – они, конечно, не без слабых мест, но не так плохи. Фактор очень высокого среднего качества ударов плюс оверперформинг соперников делает свое дело. Проблемы обоих кроются далеко не во вратарях.

А теперь одиозное.

Об этом регулярно писали западные аналитики – Sander Ijsma и Колин Трейнор, например. Дело в том, что у процента сэйвов очень низкий уровень повторяемости – р-квадрат между двумя последовательными сезонами равен всего 0,09. То есть процент отраженных ударов в первом сезоне лишь на 9% объясняет то, что произойдет в следующем. Это неповторяемая метрика, но при этом сложно представить, что все вратари играют настолько нестабильно – нет, просто показатель недостаточно хорош, чтобы точно описывать их игру. 

Конечно, есть исключения в обе стороны – люди, которые на достаточно продолжительной дистанции играют сильно лучше/хуже других. К примеру, на графике выше обведены те, кто находится значительно выше/ниже двух стандартных отклонений от среднего, что, конечно, достаточно значительно. Однако, и тут есть два момента:

Во-первых, с увеличением дистанции (движением вправо по абсциссе) разброс сжимается, что серьезно говорит о ее важности. Во-вторых, это все равно не помогает нам использовать метрику для того же скаутинга – да, выдающиеся вратари, типа Нойера, будут наверху, откровенные мешки – внизу, однако значительных различий по остальным нет.

Подытожим: два фактора – отсутствие повторяемости и уравниловка всех ударов не позволяет считать процент сэйвов сколько-нибудь значимым показателем.

Что же делать в таком случае? Сделать второй шаг – пытаться вклинить в анализ качество ударов, с которыми сталкиваются вратари, то есть, по сути, обратиться в xG.

xG часто трактуют неверно – задача модели оценивать моменты таким образом, чтобы с увеличением выборки соотношение NPG/xG обитало в окрестности единицы, то есть адекватно оценивало качество шансов – с чем наша модель справляется достаточно неплохо.

Одна из базовых концепций xG заключается в том, что знание об ударе заканчивается в момент нанесения. Мы знаем о части тела, о локации, о скорости атаки, типе передач в атаке, были ли ошибки по ходу со стороны обороняющихся, был ли дриблинг, была ли обводка вратаря, был ли ребаунд и т.д. Это позволяет оценить атаку – какими средствами продвигался мяч, из какой локации удалось пробить – и оборону – откуда дали пробить, как далеко дали зайти и т.д.

Однако, такие модели основаны на всех ударах (формулы xG выводятся по ретроданным естественно) – в том числе, мимо створа и заблокированных, – в то время как вратари, очевидно, встречаются только с ударами в створ. Соответственно, модель, основанная только на ударах в створ, будет выше оценивать качество ударов – проходит определенная аналогия с формулой Байеса: если наше знание об ударе не заканчивается на моменте исполнение, то мы, зная, что удар пришелся в створ, понимаем, что его вероятность стать голом выше, чем когда знание об ударе обрывается в момент касания бьющего.

Такую идею реализовал Пол Райли, составив xG-модель только на базе ударов в створ, что позволило адекватнее оценивать вратарей. Здесь самое время поговорить о расхожем мнении, что вратарь должен часто «выручать», то есть играть выше ожидаемого уровня на длительной дистанции. Данные Райли показывают, что это не так – лучший (по модели) вратарь играет на 16% выше ожидаемого уровня, в то время как основная группа незначительно отклоняется от xG/NPG = 1.

Это пул данных по вратарям АПЛ с сезона-2010/11. Первым идет Хитон, вторым – Адриан. Причем у кипера «Бернли» это всего второй серьезный сезон в АПЛ (то есть дистанция не так велика), а испанец к началу этого сезона рейтинг как раз возглавлял. Адриан, наряду с Пайетом, внес главный вклад в успех «Вест Хэма» в прошлом сезоне (неслучайно «молотки» пропускали сильно меньше ожидаемого уровня). Однако, стоило Адриану начать ошибаться, как он практически тут же присел под Рэндольфа – он не перестал «выручать», он потерял в стабильности, прекратив отбивать несложные удары.

На короткой дистанции возможны разговоры про «выручать» – так на определенных отрезках уже этого сезона, например, Льорис и Ли Грант имели показатели xG/NPG 1,9 и 1,7 соответственно – со временем они естественным образом регрессировали к средним значениям. На длительной дистанции от вратаря нужна стабильность игры в районе ожидаемого уровня. Если вывести за скобки выдающихся людей типа Нойера, который несколько раз перевернул игру, то остальные топы – это разговор в первую очередь про стабильность. Осеннее мини-исследование Леши Чернова показывает это на примере того же Буффона. 

В этом контексте забавляют разговоры о том, что вратарь может принести команде дополнительные 10-15 очков за сезон (Джон Терри однажды прямым текстом так сказал про Петра Чеха). Однако, когда вспоминают о ярких спасениях вратаря, почему-то забывают о ситуациях, когда они не отбивают более-менее очевидные мячи, не говоря уже о том, что игнорируется важность оборонительной системы в целом. Мёрфи как-то подсчитал, что за 6 сезонов именно сэйвами вратарь АПЛ принес своей команде максимум 2-3 дополнительных очка/сезон. То есть при оценке игры на линии нужно отталкиваться от того, что важнее не пропускать свое, чем отбивать что-то сверх. Значит ли это, что вратарь неважен? Конечно, нет. Просто, видимо, его влияние на результаты в гораздо большей степени проявляется в организации игры защиты (в том же подсказе), чем в прямом противодействии с ударами.

Однако, достаточно ли хороша модель, улучшение которой заключается только в знании, что удар пришелся в створ? Очевидно, что нет. Ведь мы не знаем, в какую точку ворот полетел мяч – в мертвую зону для вратаря или прямо в него? Конечно, можно думать, что на дистанции распределение по зонам ворот у всех киперов более-менее одинаково, однако это не так. Регулярно возникают примеры, когда вратарь пропускает удары с 15-20 метров, получает мало xGa в зачет, из-за чего его коэффициент эффективности становится сильно меньше единицы. При этом зачастую шансов вытащить эти удары было по минимуму. Классический пример – Тибо Куртуа в первые три месяца этого сезона АПЛ. Защита «Челси» играла достаточно надежно, не допуская большого числа ударов по его воротам, однако получив возможность пробить, соперники зачастую били по мертвым зонам – Тибо проседал по xG, отбивая только половину ударов, с которыми его приходилось встретиться. Был ли он плох?

Сэм Джексон – парень, уже в 22 года возглавивший статистическую компанию, которая занимается оценкой вратарей – показал, что нет. Согласно его данным (впрочем, формул в открытом доступе нет, но его числовая оценка вполне сочетается с моей эвристикой), в первом круге АПЛ именно Куртуа пришлось столкнуться с самыми сложными ударами. Модель Джексона достаточно умная – она учитывает не только зону ворот, в которую полетел мяч, но и скорость удара, закрывался ли вратарю обзор, был ли рикошет и так далее.

Старик Гарри Гелайд тоже обратил на это внимание. Результаты его расчетов наглядно демонстрируют, насколько серьезнее влияние на вероятность забить оказывают отклонения от центра створа по горизонтали и вертикали.

У нас пока нет возможности реализовывать модель xG2, потому что данные, которыми мы располагаем, включают в себя только 6 зон створа, чего, конечно, недостаточно. В идеале, конечно, иметь разлиновку ворот типа такой:

Тем не менее, сейчас основная тема в этой сфере на Западе – поиск оптимальных параметров в моделях xG2 – Джексон, Райли, Ste Mc – вот примерный список тех, за кем надо послеживать, чтобы иметь примерное представление о том, в каком направлении идет движение.

Самое забавное, что до цели пока далеко. Колин Трейнор с Константиносом Чаппассом 2,5 года назад представили один из лучших вариантов – и на сегодняшний день ничего лучше пока не придумали. Однако, они не удовлетворились результатами и потестировали модель на предмет самого важного – повторяемости. Причем они сделали достаточно хитро – первым этапом отобрали вратарей, которые за прошедшие сезоны получили минимум 500 ударов в створ (таких набралось 31). Затем разделили эти данные на две группы и изучили корреляцию Sv% и xG2 между первой и второй корзиной по 250 ударов – результаты xG2 оказались сильно лучше – 0,405 против 0,06, однако даже в этом случае результаты во второй группе лишь на 16% объясняются результатами первой, то есть о серьезной повторяемости говорить не приходится.

Второй этап был более изощренный – 500 ударов рандомно делились на две группы по 250 ударов и опять высчитывалась корреляция – результаты стали чуть лучше, однако р-квадрат у xG2 все равно был всего лишь 0,22, что недостаточно много, чтобы говорить о серьезной зависимости. 

Конечно, есть отдельные выдающиеся люди типа Де Хеа (или Нойера, о котором речь шла выше), которые в обоих группах демонстрировали высокие результаты – у испанца xG2/NPG в первой группе равнялось 1,23, во второй – 1,21. Однако, для оценки всех вратарей и скаутинга xG2 годится слабо (процент отраженных ударов не годится вовсе) – яркий перформанс вратаря даже в двух последовательных сезонах даже близко не гарантирует, что он будет хорош на новом месте. Два классических примера:

  • Миньоле в «Сандерленде» несколько сезонов отыграл выше ожидаемого уровня, а перейдя в «Ливерпуль» ни в одном из сезонов не дотянулся до единицы
  • Интересен кейс Стэфана Рюффье из «Сент-Этьена». Основываясь на данных Трейнора и Чаппасса, мы знаем, что его результат в первой группе – 1,15, а во второй – всего лишь 0,98. Если судить его по первой, то он один из лучших в мире в этом компоненте. Если по второй – обычный середняк. Представьте разочарование клуба, купившего его по результатам результатов первой группы. 

Данные за сезон-2015/16 + 17 туров сезона-2016/17 РФПЛ

Наша модель xG достаточно неплоха, имеет высокую корреляцию с реальностью и здорово подходит для оценки нападающих, ассистентов и защиты, однако в оценке вратарей, по сравнению с Западом, мы пока что, к сожалению, в ясельной группе. Нет, конечно, это большой шаг вперед по сравнению с опорой на процент отраженных ударов – по крайней мере, учитывается сложность. Однако, в качестве точки, вокруг которой происходит все движение, нужно рассматривать не единицу, а среднее значение по лиге – таким образом, статистика принимает лишь описательный характер. Мы можем оценивать людей, которые особо выделяются или играют сильно ниже ожиданий, можем искать недооцененных игроков, можем пользоваться такими данными, как первичным инструментом скаутинга – не делать громких выводов, но по крайней мере отмечать направления, в которых надо двигаться. И, конечно, всегда стоит помнить об одном – ДИСТАНЦИЯ. В таблице, например, есть люди, которым за последние полтора сезона 18 раз пробили в створ – это слишком мало, чтобы вообще о чем-то говорить. 

Игра на выходах против кроссов

В данных, которые можно достать в открытых источниках, я видел несколько вариантов оценить игру на выходах: число claims (вратарь фиксирует мяч), число punches (вратарь отбивает мяч кулаком), процент успешных claims. Все это, конечно, не годится. Во-первых, вратари сильных команд априори обделены – им реже навешивают, поэтому у них меньше шансов сыграть на выходе. Во-вторых, само по себе число claims и punches в отдельности мало о чем говорит.

Еще летом я показывал, как работает модель, которую презентовал Сэм Джексон на Opta Forum в 2015-м году. Естественно, тогда я допустил несколько ошибок, которые сейчас исправлены.

Для начала вводятся два показателя:

Aggression = (claims + punches + claims failed)/ (crosses-blocked crosses).

Все попытки игры на выходе делятся на число кроссов, которые сделал соперник команды вратаря, за вычетом заблокированных. Позволяет нам оценить, насколько агрессивно вратарь идет на выходы. При этом деление на кроссы позволяет исключить недооценку вратарей сильных команд.

Claim proficiency – claims/ (claims + punches + claims failed)

Метрика, оценивающая процент claims от всех попыток сыграть на выходе. Вполне разумная предпосылка, ведь claim, в отличие от punch, гарантирует владение. Что, во-первых, позволяет избежать суеты после подбора, а, во-вторых, быстро начать свою атаку.

Сделав коррекцию на среднее по лиге получаем примерно следующее:

Данные за сезон-2015/16 + 17 туров сезона-2016/17 РФПЛ

Чем правее и выше находится вратарь, тем лучше он имеет дело с кроссами в штрафную. Понятно, что, как и любая статистика, данная метрика действует тем лучше, чем больше дистанция. Как и Джексон, я взял сюда только тех, кто за полтора сезона встретился минимум с 200 незаблокированными кроссами. Исключение сделал лишь для Лунева – у него 161.

Возникает разумный вопрос: а можем ли мы объединить два показателя? В целом можем – решение достаточно тривиальное. Зная координаты каждой из точек и координату верхнего правого края (максимум), можно по теореме Пифагора посчитать расстояние. Затем, приняв максимум за (1;1), можно посчитать близость каждой из точек к нему – чем ближе к 100%, тем лучше.

Корреляция между Hyp. Ranking в двух последовательных сезонах равна 0,7 (например, такая же корреляция между ростом отца и сына), что достаточно сильно, и позволяет нам при анализе всерьез полагать, что вратарь сохранит свой уровень на следующий сезон – то есть метрика достаточно показательная.

Я, в отличие от Джексона, не в большом восторге от единого показателя. Стремление все упростить – ложный путь в анализе. Расклад по двум переменным позволяет получить более подробную информацию о слабых и сильных сторонах вратаря. Помимо прочего, это весьма спорно, что aggression и claim proficiency должны иметь одинаковое влияние на агрегированный показатель – уверен, что у разных тренеров и аналитиков, в зависимости от требований и предпочтений, мнения будут разниться. 

Помимо прочего, есть несколько моментов, которые можно улучшить. Во-первых, примерно 13% незаблокированных кроссов прилетают в зоны, в которые вратарю вообще неразумно выходить. При нынешнем доступе к данным я не могу отсечь эти 13% и вынужден работать с погрешностью, однако при текущих возможностях Opta и Wyscout это легко делается (недавно я разговаривал с их директором Владом Андерсеном, поэтому не беру информацию с потолка).

Второй момент более сложный – уровень aggression может быть занижен, поскольку вратарь получает указание от тренера выходить реже, оставляя больше работы защите (к примеру, у нас высокие ЦЗ). Это может говорить в пользу модели – к примеру, тренер знает, что вратарь недостаточно хорош на выходах в толпу, но при этом имеет хорошую технику, поэтому бережет его (у меня есть гипотеза, что реинкарнация Джанаева отчасти связана с этим – Курбан Бердыев дает указание выходить реже, тройка ЦЗ снимает верх, Сослан меньше нервничает, если же мяч удобен, то техника позволяет ловить на уровне топ-5 лиги и гарантировать владение). При этом это может и ввести в заблуждение – скаут, не знающий указаний, будет неверно оценивать игрока.

Однако, как инструмент, в руках тренера, который знает о своих указаниях, и скаута, который умеет оценивать контекст, эта модель может быть чрезвычайно полезна. 

Давно бытует миф, что низкие вратари плохо играют на выходах. Конечно, рост дает определенное преимущество в этом компоненте, однако если построить диаграмму зависимости роста и показателя, о котором я рассказал выше, то можно легко заметить, что корреляция достаточно низкая – далеко не рост является определяющим фактором в успешной борьбе против кроссов.

Ноги

Вся оценка уровня игры вратаря в пас сейчас строится на точности передач, что, строго говоря, неверно.

Очевидно, что если брать общую точность, то велик риск недооценить тех, кто чаще использует длинные передачи – поскольку в коротких вратари практически не ошибаются.

Брать точность коротких передач просто не имеет смысла. Обычный вратарь в среднем делает 0,1-0,2 неточных коротких передач за матч – для сравнения, на этом же отрезке он пропускает в 5-10 раз больше голов. Всерьез ранжировать вратарей на основе того, что один делает неточную короткую передачу раз в 7 матчей, а другой – раз в 10, неверно, ибо различие слишком мало и сильно подвержено случайности.

С точностью длинных передач все сложнее (здесь уже присутствуют очень приличные разбросы), однако пользы от них несильно много. 

Расхожее мнение, что точность длинных передач вратаря зависит от роста атаки, не соответствует действительности. Корреляция между пасами такого типа и процентом выигранных верховых единоборств низка, коэффициент р-квадрат равен всего 0,05 – незначительно.

Весьма вероятно, что точность может серьезно зависеть от других вводных, которые сложно измерить. Одно дело, когда команда намеренно играет подготовленными длинными передачами от вратаря, другое – когда ее стиль строится вокруг билдапа в короткий пас, а к лонгболлам приходится прибегать только при мощном прессинге соперника, который перекрывает все короткие опции и ставит вратаря в цейтнот. Это может серьезно сказываться на точности лонгболлов вратарей топовых команд, которые играют в короткий пас гораздо чаще остальных.

Еще одна проблема применимости точности лонгболлов в качестве оценки – вратари могут просто быть не заточены на это. Звучит абсурдно, однако в интервью тренеров АПЛ ни раз проскакивали слова, что в конкретных играх вратарю надо было отправить мяч не обязательно на своего, а просто в определенный квадрат на чужой половине поля. Таким образом команде удается избегать прессинга соперника и насыщенного центра поля и сразу вступить в борьбу за second-third balls на чужой трети поля. Игра уже отодвинута от своих ворот, у штрафной соперника сеется хаос. Передача зачастую оказывается неточной, однако это не несет вреда команде.

Дополнительный момент, который важно понимать – в число длинных передач одновременно заносится как игра с поля, так и мячи, которые вратари выбивает с руки. О чем нам может рассказать такая каша?

Ну, и вторая серьезная проблема – отсутствие повторяемости. Вот, например, статистика Нойера в трех последовательных полных сезонах (точность лонгболлов):

2013/14: 72%

2014/15: 62%

2015/16: 47%

Он играл в одной команде, у одного тренера (Пеп), который хоть и революционер, но базовые принципы оставляет неизменными, примерно с одними партнерами. Лучший вратарь в мире по игре ногами внезапно разучился пасовать на большую дистанцию? Да так, что его показатель за два сезона упал на 25%? Скорее напрашивается вывод, что точность длинных передач – показатель достаточно рандомный.

Так и есть. Я посчитал зависимость между точностью лонгболлов в двух последовательных сезонах – коэффициент р-квадрат равен всего 0,25. Корреляция есть, но она незначительная.

Если точность лонгболлов без знания указаний тренера не годится, то какие есть варианты? Сэм Джексон вот придумал RPI – поле делится на 9 зон по вертикали, показатель сравнивается со средним по лиге для каждой зоны, а потом суммируется. Но все опять завязано на точности, что мало нам дает.

Любопытная идея – считать процент передач вратаря от всех пасов команды, получается своеобразный рейтинг вовлеченности. Однако, брать все пасы все равно ошибочно – в лонгбольных командах типа «Бернли», нынешнего «Стока» (еще год назад Марк Хьюз был хипстером, играл с ложной девяткой, подтягивал в состав техничных ЦЗ, а теперь вернулся в андерграунд, опять надел дырявые кроссы и забрасывает на Крауча), «Уотфорда» вектор «вратарь – центральный нападающий» зачастую является самым популярным в матче. Том Хитон на Барнса или Воукса, Ли Грант на Крауча, Гомес на Троя Дини, Хеннесси на Бентеке у Эллардайса в «Кристал Пэлас» и так далее. Вратарь имеет высокий процент вовлеченности, однако это никак не говорит о его уровне, а только о стиле. 

Если взять только короткие передачи, то в топе действительно будут те, чьи команды любят постепенный билдап – Браво, Кариус, Миньоле, Льорис (у «шпор» история гибридная, скорее у них просто частые проблемы с продвижением). Однако, это все равно свидетельствует скорее о стиле, чем о скилле.

К примеру, Льорис находится на первом месте по вовлеченности, однако он лидер этого сезона по числу ошибок, приведших к ударам (6), и числу ошибок, приведших к голам (2). В матчах Лиги чемпионов, когда «ТТХ» оказывался под приличным прессингом «Монако» и «Байера», Льорис делал по две неточные короткие передачи за игру – дистанция, конечно, ничтожна, но сам контраст со средним показателем в 0,1 – 0,2 за игру впечатляет. Команда склонна вовлекать Льориса, однако его одноногость и уязвимость под прессингом в данном случае вскрывается.

Еще одна проблема – рейтинг может недооценивать вратарей из команд с более вертикальным билдапом. Тот же «Арсенал» может много пасовать, быть в топе по владению, но при этом больше времени проводить на чужой трети и в центральной трети поля – вратарь естественным образом заигрывается меньше. Опять же: говорит о стиле, а не о качестве. 

Так может ли этот показатель дать нам какую-то полезную информацию? Определенно. К примеру, команда, много владеющая мячом и активно вовлекающая вратаря, хочет подписать нового кипера, у которого процент использования оказывается значительно ниже. Как минимум, это стоит принять во внимания и ожидать тяжелого процесса адаптации к незнакомому стилю. И наоборот: команда, играющая от вратаря в короткий пас, берет нового, у которого процент вовлеченности даже выше – в этом плане его адаптация должна пройти легче.

Нынешними ресурсами померить уровень игры ногами невозможно, но в целом идеи есть. Уже сейчас та же Opta считает число передач правой и левой ногой, а также число передач направо и налево. Хорошо играющий ногами кипер в идеале, во-первых, должен играть в касание (это тоже можно померить), во-вторых, отдавать направо – правой ногой, а налево – левой. Посчитав отношение передач направо правой ногой плюс отношение передач налево левой, мы получим рейтинг, лежащий в интервале от нуля до двух. Соответственно, чем ближе к двойке, тем лучше.

Двуногость + скорость – залог успешной игры под прессингом. Соперник не получает времени на перестроение и перекрытие всех опций – мы выходим в следующую фазу, реализовав численный перевес за счет вратаря.

Да и вообще, пожалуй, важно понимать, что вратарь в команде Гвардиолы или Тухеля и вратарь у Шона Дайча при владении – это вообще два разных амплуа и оценивать их надо по-разному, разными метриками.

Sweeping

Я не видел, чтобы где-то пытались оценить этот показатель, поэтому приходится идти наугад, строить рассуждения без теоретической базы.

В среднем лишь 3-4 вратаря за сезон записывают на свой счет хотя бы один перехват – ничтожно мало, чтобы пытаться делать какие-то выводы. Однако, тут на помощь может прийти статистика по recoveries – подборы ничейных мячей (в терминологии Opta). Конечно, часть из них (в случае вратаря) – это простые безадресные забросы, когда мяч сам прилетает к вратарю, однако зачастую приходится выбегать из штрафной и играть на опережение, сохраняя при этом владение. 

Данные за сезон-2015/16 + 17 туров сезона-2016/17 РФПЛ

В идеале, конечно, эти данные требуют коррекции. Во-первых, следует исключить recoveries в радиусе 11 метров от ворот. Во-вторых, сделать данные possession adjusted, то есть с нормировкой на владение мячом 50%. Грубо говоря, у вратаря, чья команда владеет мячом 60% меньше шансов сделать recovery, чем у того, чья владеет 40%.

Для первой цели нужны просто лучшие данные. Реализовать вторую достаточно просто, но энергозатратно – без первой влияние все равно не будет столь велико.

Кейс Селихова

Мы пока не видели его в деле за «Спартак», но сейчас шаг руководства кажется разумным. Они подождали, пока парень отыграет целый календарный год и наберется определенная дистанция для выводов.

Что мы имеем:

  • Топ-4 по отражению ударов за последние полтора сезона при сложности средней по лиге (превосходит нынешнего основного)
  • Выше среднего в игре на выходах, по обоим параметрам превосходит нынешнего основного
  • Топ-1 по числу подборов
  • Вовлеченность гораздо ниже, чем у Реброва

Все сказанное выше рисует следующий сценарий: «Спартак» точечно попал (учитывая еще возраст и не слишком высокую цену), однако Каррера пока не рискует ставить его в состав. И все делает правильно. Ибо, во-первых, у Селихова могут возникнуть проблемы к адаптации в игре в пас, когда его будут вовлекать в два раза больше, чем было в «Амкаре». Это в свою очередь может повлечь перекос во всех показателях из-за банального выхода из зоны комфорта. Во-вторых, у Реброва наверняка появилась связь с защитниками, которую Каррера не хочет разрушать – это невозможно померить нынешними методами, не находясь внутри команды, но глупо отрицать, что этого нет и что это неважно только на основании того, что я не могу это измерить.

Летом Селихов наверняка станет основным.

Кейс Лунева

НО!

  • Игра на ленточке чуть выше среднего по лиге (ничего страшного) при сложности ударов в два раза ниже среднего (вот это должно заставить напрячься).
  • По игре на выходах в числе лучших
  • Степень вовлеченности даже выше, чем у Лодыгина – не говорит об уровне игры ногами, но проблем с адаптацией в этом компоненте быть не должно
  • По подборам выше среднего по лиге

НО!

Главная опасность в трансфере Лунева – дистанция. Его перформанс не проверен временем. «Спартак» проверил Селихова двумя разными сезонами, Лунев же провел всего 10 игр, в одной из которых вышел на замену.

10 игр – вообще ни о чем дистанция, чтобы делать выводы на основании статистики. Я включил сюда данные по Луневу, просто чтобы не было вопросов, но я готов до утра говорить о важности дистанции и повторяемости.

Делать выводы по 10 играм все равно, что покупать игрока на основании (только!) успешного выступления на чемпионате мира или Европы – затея, с высокой вероятностью обреченная на провал.

Насколько мне известно, Луческу предлагали зимой любого российского вратаря на выбор (без сами знаете кого, разумеется), его не устроил никто. В итоге взяли Лунева – по решению сами знаете кого.

Я не говорю, что скауты «Зенита» ошиблись. Просто не совсем понятно, на основании чего принято решение.

Есть бесплатный Беленов с лучшими показателями в большинстве сфер. С перформансом, подтвержденным временем. Беленов, который в этом сезоне изменил отношение к игре. Беленов, который скрупулезно изучает пенальтистов.

Есть Лунев за 3,5 миллиона, для которого это первый сезон в РФПЛ.

Может быть, я попался в ловушку, которую описал в начале – игнорирую одни факты и придаю излишнее значение другим, – однако, немаловажный показатель, на мой взгляд, что после того, как Шелия оправился от травмы,  Гончаренко вернул его в состав (хотя Лунева хайпили на каждом углу). И только после удаления грузина в матче с «Рубином» Лунев вернулся в ворота и отыграл до перерыва.

В свое время Майкл Льюис в «Маниболе» описал скаутов, которые умели определять – хорош игрок или нет, – глядя на его ягодичные мышцы. Возможно, в «Зените» умеют так же.

Кейс Песьякова

В этом сезоне Сергей Песьяков не играл в РФПЛ. Сложно оценить его мотивацию и желание.

Однако, данные по 17 играм прошлого сезона говорят, что Песьяков недооценен.

  • Самый агрессивный на выходах (пусть и при плохом claim proficiency)
  • Третий на ленточке при самой высокой средней сложности ударов
  • Число подборов выше среднего

Добавьте сюда российский паспорт, непредельный возраст (28 лет) и вероятно низкие отступные – контакт истекает через год, при лучших раскладах он третий вратарь «Спартака», на которого не рассчитывают – получается вполне неплохой актив.

Еще раз: я не знаю, в каком он состоянии. Может он забил на футбол. Однако, если нет, то многим клубам будет разумно рассмотреть его. К примеру, «Тереку» очевидно нужен вратарь. Или если «Краснодар» потеряет Крицюка летом и не будет иметь достаточно денег, то Песьяков – вариант, с которым можно рискнуть.

На мой взгляд, это игрок, который лучше своей репутации. Несколько ошибок, гол с центра поля от «Томи» плюс излишняя зацикленность Карпина на игре ногами, превратившаяся в мем – задолго до прихода Браво в «Сити» всерьез предлагали «Спартаку» играть с полевым в воротах – все это создало неверное восприятие Песьякова. Он еще может перезапустить карьеру.

 

Можно было бы еще обсудить недооцененного Рыжикова, Газизова, который умудрился обменять Лунева на Беленова и еще заработать на «Клинском» 3,5 млн, Акинфеева, но место и так нерезиновое. Вывод простой: при оценке вратарей мы многое до сих пор не можем подсчитать и учесть, но это не значит, что эти факторы не важны и их не существует. А то, что можем оценить, всегда важно ставить в правильный контекст.

Неслучайно Билли Бин, который пару лет назад консультировал один голландский клуб, как-то сказал: «В футболе у вас не так много времени, чтобы доказать, что вы правы. В конце концов, прежде чем оценивать кого-то числами, убедитесь, что вы собрали правильные данные и правильно их интерпретируете, потому что риск очень велик».

Еще год назад я думал, что неизмеряемые факторы неважны, однако за это время я успел побродить по кладбищу собственных иллюзий и переосмыслить этот момент. Мы не должны откидывать то, что не можем объяснить, однако должны стремиться найти способ формализовать это.

Текст – Никита Васюхин

Помощь в сборе данных – Андрей Кривоногов, Алексей Чернов

Подписывайтесь на паблик Блокнот

Фото: РИА Новости/Алексей Даничев

Автор

Комментарии

  • По дате
  • Лучшие
  • Актуальные
  • Друзья