11 мин.
0

Цифры, цифры, цифры: почему обычной статистики уже недостаточно

О метрике, которая помогает замечать то, что обычно теряется между ударами, передачами, xG и хайлайтами.

Футбол давно принято обсуждать через самые заметные вещи: голы, ассисты, удары, а в последние годы ещё и через xG. Это понятный язык, потому что он сразу переводит разговор к результату. Но у такого взгляда есть очевидный предел: матч почти никогда не решается только в момент удара.

Очень часто всё главное происходит раньше – в перехвате, в первом продвижении мяча вперёд, в выходе из-под прессинга, в действии, которое не попадёт в хайлайты, но именно оно меняет весь эпизод.

Из-за этого разговор о футболе часто оказывается слишком узким. Мы хорошо замечаем финал атаки, но куда хуже видим и гораздо реже обсуждаем путь к нему. Кто на самом деле сдвинул эпизод в пользу своей команды? Кто сделал атаку опасной ещё до удара? Кто, наоборот, погасил угрозу одним своевременным действием, которое в базовой статистике почти теряется? Неудивительно, что в такой системе внимания индивидуальные награды чаще достаются атакующим игрокам: их вклад легче увидеть, легче пересказать и проще подтвердить привычными цифрами вроде голов и ассистов.

Голы и ассисты почти целиком сосредоточены на финале атаки. xG уже копает глубже, но всё равно в первую очередь говорит о качестве удара. Даже более продвинутые счётчики вроде прогрессивные действия чаще отвечают на вопрос «сколько» и «куда», чем на вопрос «насколько это действительно изменило положение команды».

Из-за этого в одной плоскости оказываются действия, которые по смыслу совершенно не равны. Два паса могут одинаково попасть в статистику как продвигающие, хотя один просто передвинул мяч в безопасную зону, а второй вскрыл структуру соперника и резко приблизил атаку к опасному моменту. Точно так же один отбор может быть обычным рабочим эпизодом в нейтральной зоне, а другой – действием, которое сорвало контратаку и фактически спасло команду от большой угрозы. В базовых цифрах эта разница часто либо почти не видна, либо не видна совсем.

Это особенно заметно, когда речь заходит об игроках, чья польза не сводится к результативности. Центральный защитник может не выделяться по простому объёму прогрессии, но очень качественно продвигать мяч в правильные моменты. Полузащитник может не собирать яркую статистику, но регулярно ускорять владение одним пасом раньше, чем это становится очевидно по ходу атаки.

Именно здесь и появляется запрос на другую оптику. Нужна метрика, которая пытается оценить не только сам факт действия и не только его внешнюю форму, а его реальную ценность в контексте эпизода.

Отсюда и интерес к метрикам нового типа – тем, которые пытаются оценивать не только итог эпизода, но и ценность каждого действия, предшевствовавших ему. Одна из самых интересных таких метрик — VAEP. VAEP расшифровывается как Valuing Actions by Estimating Probabilities, то есть оценка действий через изменение вероятностей. О ней и пойдёт речь: что именно она измеряет, зачем нужна, что помогает увидеть – и где проходят её пределы.

Как VAEP даёт оценку важности действий 

Сначала задаётся ценность игрового состояния:

V(S) = P(score | S) − P(concede | S)

То есть ценность состояния – это вероятность забить из этого состояния минус вероятность пропустить.

Тогда ценность конкретного действия считается как разница между состоянием после и до действия:

VAEP(a_i) = V(S_i) − V(S_{i−1})

Если раскрыть это через вероятности, получится:

VAEP(a_i) = [P(score | S_i) − P(score | S_{i−1})] − [P(concede | S_i) − P(concede | S_{i−1})]

Ладно, ладно… Давайте простыми словами.

Если объяснять совсем коротко, VAEP оценивает, насколько действие приблизило команду к голу и одновременно отдалило её от угрозы у своих ворот. Не просто был ли это пас, отбор или ведение мяча, а изменило ли это действие ситуацию в пользу команды. Стало ли после него легче забить? Стало ли труднее пропустить? 

В этом и состоит её главное отличие от более привычного языка статистики. Обычные метрики часто считают само событие: удар, пас, ассист, продвижение. VAEP смотрит чуть глубже – на последствия. Один и тот же пас может быть формально успешным, но почти ничего не поменять. А может, наоборот, резко улучшить положение команды и приблизить её к опасному моменту. Для VAEP эта разница принципиальна.

Поэтому у этой метрики ценность получают не только действия, которые попадают в хайлайты – перехват у своей штрафной, первый пас вперёд после отбора, умное продвижение мяча через линию прессинга соперника, своевременный перехват мяча при чужой атаке – всё это может быть очень важным, даже если в базовой статистике выглядит скромно. И именно этим VAEP интересен: он пытается вернуть в поле зрения те действия, из которых и складывается футбол между голами.

Представим простой эпизод: защитник перехватывает мяч у своей штрафной, полузащитник тут же открывается под передачу, затем следует быстрый пас вперёд между линиями. В протоколе это могут быть просто перехват и два точных паса. Но по смыслу эпизода ценность здесь куда выше: команда не только сняла угрозу у своих ворот, но и резко улучшила старт собственной атаки. Именно такие сдвиги VAEP и пытается улавливать.

То есть действие получает плюс не потому, что выглядит эффектно, а потому, что улучшает положение команды. И точно так же получает минус не потому, что выглядит «некрасиво», а потому, что повышает риск. Рискованный пас поперёк под давлением у своей штрафной может быть формально точным, но всё равно вредным по смыслу. Безопасный на вид эпизод иногда ухудшает положение команды сильнее, чем кажется на первый взгляд.

Именно так работает VAEP и именно этим он и интересен именно как метрика последствий. Он оценивает футбол не как набор отдельных галочек в протоколе, а как цепочку действий, каждое из которых понемногу двигает эпизод либо к опасности у чужих ворот, либо к проблеме у своих. И уже из этой логики становится понятно, почему VAEP стоит сравнивать не только с привычными статистическими данными, но и с другими продвинутыми метриками вроде xG и xT (xThreat – ожидаемая угроза воротам соперника).

Чем VAEP отличается от xG и xT

Чтобы не запутаться в футбольной аналитике, полезно сразу развести три разные логики. xG отвечает на вопрос, насколько опасным был удар. xT – насколько мяч переместили в более опасную зону поля. А VAEP задаёт более широкий вопрос: насколько конкретное действие в целом улучшило положение команды с учётом контекста и риска.

В этом смысле xT и VAEP особенно интересно сравнивать между собой. xT хорошо показывает ценность продвижения мяча: откуда и куда его переместили. Это очень удобная и наглядная модель, потому что она помогает увидеть создаваемую угрозу. VAEP пытается смотреть шире – не только на продвижение, но и на то, как действие меняет общее положение команды.

Из-за этого одна и та же ситуация может выглядеть по-разному в двух моделях. Например, пас назад под давлением возле своей штрафной для xT часто не выглядит особенно важным: мяч ведь не приблизился к чужим воротам. А для VAEP это может быть плохое действие, если оно повышает риск потери в опасной зоне у своих ворот. И наоборот, отбор или перехват, с которого начинается перспективный переход, xT может оценить довольно скромно, потому что сам мяч ещё не оказался в очень ценной зоне. VAEP же лучше чувствует сам перелом эпизода.

Поэтому VAEP интересен не как замена xG или xT, а как иная точка зрения на игру. xG полезен, когда речь идёт о качестве ударов. xT – когда важно понять логику продвижения мяча. VAEP – когда хочется оценить более общую ценность действия внутри эпизода. И именно поэтому он особенно хорошо подходит для разговора о тех игроках, чья польза не всегда лежит на поверхности.

Зачем болельщику аналитический портал

Так или иначе возникает самый практический вопрос: а зачем это вообще нужно болельщику и где всё это вообще? Большинство болельщиков не могут посмотреть 20 матчей каждого футболиста, о котором вдруг заговорили в контексте трансфера или который просто заинтересовал по ходу сезона. Особенно если речь идёт об игроке, которого ты видел от силы один-два раза. В таких условиях аналитический портал становится не заменой просмотру, а инструментом быстрого и осмысленного ознакомления.

Идеальный пример такого инструмента – ScoutLab. Это портал, который собирает по игроку огромный массив статистических и аналитических данных и превращает их в читаемый профиль. В отличии от Fbref, который уже канул в небытие, здесь есть не только базовая карточка футболиста, но и саммери, динамика показателей, сравнение с другими игроками, радары, графики, рейтинг схожести профиля игрока, а также целый набор карт действий на поле. За счёт этого пользователь получает не просто россыпь цифр, а уже структурированное представление о том, что это за игрок и в чём именно его сильные и слабые стороны.

Особенно важны визуальные разделы – ScoutLab показывает, как именно футболист действует на поле: где он чаще вступает в отбор, где совершает перехваты, в каких зонах получает мяч, как продвигает его вперёд, насколько часто идёт в дриблинг, куда и как пасует. Это очень важное преимущество, потому что портал переводит сухую статистику в более привычный язык – то, что изложено визуально всегда проще воспринимать, нежели впитывать одни лишь цифры. Одно дело – просто увидеть число прогрессивных передач и совсем другое – сразу понять географию игры: с какого фланга игрок начинает атаки, насколько вертикален его стиль, где он активен без мяча и в каких зонах чаще всего влияет на владение.

Не менее полезен и аналитический слой. На карточке игрока показатели разложены по смысловым блокам – от продвижения мяча до креатива, точности передач, дриблинга и игры при приеме мяча. А главное, здесь видны и более глубокие метрики вроде VAEP, которые позволяют оценивать не только объём действий, но и их ценность. Такой портал особенно полезен в тех случаях, когда базовая статистика не даёт полной картины: например, когда игрок не поражает голами и ассистами, но очень силён в продвижении мяча, в развитии атак или в оборонительных эпизодах, которые не всегда заметны на поверхности.

Это не окончательный ответ о качестве игрока, но очень сильная отправная точка для понимания того, что из себя представляет игрок. Но здесь особенно важно не переоценивать даже самый удобный инструмент. Как точно сформулировал Иан Грэм, цитируя Дина Оливера: «Глаза видят матч лучше цифр, а цифры видят все матчи сразу». В этом и состоит правильная роль таких порталов: не заменить просмотр футбола, а помочь быстро собрать информацию об игроке, увидеть большой массив данных и понять, на что именно стоит обращать внимание дальше.

Почему VAEP не всевидящий

Самое очевидное ограничение в том, что VAEP почти не видит игру без мяча. Он не может по-настоящему оценить качественное открывание, ложное движение, которое освобождает зону для партнёра, грамотное позиционирование в обороне, перекрытие линии передачи без касания или давление, которое вынуждает соперника ошибиться ещё до отбора. А ведь именно из таких вещей часто и складывается большая часть пользы сильного игрока.

Есть и другая проблема: VAEP гораздо менее нагляден, чем более простые модели вроде xT. Карту угрозы по зонам можно объяснить почти с одного взгляда. С VAEP так не получится: он лучше чувствует контекст, но хуже переводится в интуитивную картинку для массового читателя. Именно поэтому эту метрику особенно полезно использовать не в одиночку, а вместе с видео, картами действий, сравнением ролей и обычным здравым смыслом.

Сама идея оценивать действия по тому, как они меняют положение команды, оказалась настолько плодотворной, что вокруг неё быстро выросло целое семейство похожих моделей. Исследователи и аналитические компании начали по-разному отвечать на один и тот же вопрос: как именно лучше считать ценность действия – через продвижение мяча, через изменение вероятности гола, через короткий временной горизонт или через более сложный контекст владения.

Отсюда появились и новые версии самого подхода. В экосистеме KU Leuven позже развивали Atomic-VAEP – более детальную версию, где игровые события раскладываются на более мелкие элементы, чтобы точнее разделять вклад разных действий внутри эпизода. Параллельно другие компании и исследовательские команды пошли своими путями: StatsBomb развивает OBV, American Soccer Analysis – g+, Stats Perform – PV. Все они по-своему описывают детали, но в одном сходятся: оценивать футболиста только по голам, ассистам и базовым счётчикам недостаточно.

Разумеется, даже самый удобный публичный аналитический портал – это лишь верхний слой той data-среды, в которой живут профессиональные клубы. Внутри клубов по каждому матчу собираются и обрабатываются куда более массивные пакеты информации: физические показатели, скорость и интенсивность действий, позиционные модели, внутренние отчёты скаутов, видеоразборы и многое другое. Иными словами, публичные платформы дают очень богатый, но всё же ограниченный срез. Клубы работают с куда более глубокими и закрытыми массивами, где футболист оценивается не только по итоговым метрикам, но и по множеству контекстных параметров, которые в открытом доступе просто не появляются.

Именно поэтому такие метрики и такие порталы важны прежде всего для нас – для людей, которые просто смотрят футбол, но хотят чуть глубже погрузиться в язык анализа, статистики и аналитики. Они не превращают болельщика в скаута и не дают того объёма информации, которым располагают клубы. Но они позволяют выйти за пределы разговоров только о голах, ассистах и хайлайтах, помогают внимательнее смотреть на игру и лучше понимать, за счёт чего футболист действительно влияет на матч.

В этом их главная ценность: они не заменяют профессиональный рекрутинг, а открывают для обычного зрителя дверь в более сложный и интересный способ говорить о футболе.