13 мин.

Футбольные архитекторы: как пионеры в области обработки данных убедили спорт обратить на них внимание

Это перевод статьи Джейкоба Уайтхэда из The Athletic.

Если вам понравится этот материал, заглядывайте в телеграм-канал Хроники Английских Чемпионатов. Там много всего интересного про английский футбол.

«Весь этот анализ данных в футболе — чушь собачья, не так ли?»

Иэн Грэм был нанят для помощи команде по подбору персонала «Тоттенхэм Хотспур», но его первая встреча с Майклом Эдвардсом, его боссом в «Тоттенхэме» и будущим спортивным директором «Ливерпуля», прошла не очень хорошо.

«Встреча была долгой и агрессивной», — объясняет Грэм. «После встречи я позвонил своему боссу (в аналитическую компанию Decision Technology) и сказал, что, по-моему, «шпоры» хотят отказаться от наших услуг, потому что они явно считают нас идиотами. Но босс хотел узнать ответ. Судя по тому, какие вопросы он задавал представителям «Тоттенхэма», я подумал, что босс пытается выставить меня дураком, но он честно пытался оценить качество нашей работы».

Работая под руководством Эдвардса и Юргена Клоппа в «Ливерпуле», Грэм помог клубу стать чемпионом Премьер-лиги и выиграть Лигу Чемпионов, одновременно преобразовав состав команды.

Но его первый опыт был типичен для многих пионеров в области обработки данных в английском футболе. Однако теперь они добились прорыва: их работа стала мейнстримом в подборе игроков и методологии тренировок. 

«Когда я начинал этим заниматься, задача, если говорить честно, была такой: „У нас много данных, и мы думаем, что в них есть определённая ценность. Можете ли вы найти что-нибудь полезное?“» — говорит Сэм Грин, бывший аналитик данных в Opta, который позже перешёл в «Астон Виллу». «Вот и всё. Мы не планировали менять футбол».

Обычно зарождение футбольной революции данных относят к середине 2000-х годов, хотя такие компании, как Opta и Prozone, собирали данные ещё с конца 1990-х. В то время, даже если идеи были здравыми, их сторонникам приходилось бороться за то, чтобы люди в них поверили.

Отчасти проблема заключалась в ограниченности имеющихся данных. Бейсбол, олицетворявший аналитический бум, располагал набором данных за десятилетия. В отличие от этого, когда Грэм начал работать в «Тоттенхэме», у него была выборка из всего двух сезонов для сбора данных, а данные по многим зарубежным лигам были в принципе недоступны. И если в бейсболе специалисты по данным умели получать из огромного вала информации реально нужные и полезные знания, в футболе с этим было куда сложнее. Какую пользу клубу должна была принести информация о том, что игрок за матч сделал 19 передач ? 

«Футбол — один из самых сложных для анализа видов спорта, просто из-за большого количества вовлеченных людей», — объясняет Грин, один из ключевых участников разработки такой метрики, как xG. «Нужно учитывать динамику взаимодействия этих 22 игроков, и это значительно усложняет задачу».

«Что такое пас, что такое борьба в воздухе, что такое вынос мяча?» — спрашивает Сара Радд, один из первых штатных аналитиков данных в «Арсенале». «На самом деле, это довольно сложно. Пытался ли этот игрок сделать навес или ударить по воротам? Вокруг этих вещей много неопределенности, поэтому достичь согласия между сборщиками данных непросто. И это создаёт всю эту путаницу: мы даже не можем толком определить, где был пас или удар, а теперь пытаемся строить на этом сложные модели».

Репутация многих аналитиков 2000-х годов оказалась подпорчена репутацией Чарльза Рипа — во многом визионера, проведшего кропотливый, рукописный анализ игровых схем 1950-х годов, но в конечном итоге подвергшегося широкой критике за свои выводы, которые ставили футбол, основанный на лонгболлах, выше любого другого игрового стиля.

Его идеи впоследствии, в 1980-х, пропагандировали такие тренера, как, например, Чарльз Хьюз, что, возможно, отбросило английский футбол назад в стилистическом плане на десятилетия. В своей книге «Как выиграть Премьер-лигу» Грэм в качестве примера приводит бывшего главного тренера «Ливерпуля» Брендана Роджерса.

Однако у самого Грэма появился сторонник в лице Эдвардса, который начал видеть и понимать ценность его работы.

«Отчасти причиной изначального скептицизма Майкла было то, что он начинал аналитиком Prozone, где его наняли составлять статистические отчёты для тренеров «Портсмута», — объясняет Грэм. «Но он знал, что Харри Реднапп и его помощники вышвырнут его из комнаты, потому что его отчёт был довольно бесполезным — количество спринтов и общая дистанция. Майкл был молод, но благодаря своей футбольной интуиции он понимал, что это ничего не говорит об игре».

«Так что отчасти его скептицизм был обусловлен тем, что он уже видел насколько это плохо реализовано раньше. У нас была очень ранняя версия ожидаемой угрозы (expected threat - вероятности забить гол, основанная на текущем местоположении мяча), и он начал разбивать в пух и прах все её модели. «Иногда пас назад — лучший вариант», — говорил он, хотя, как нам пришлось признать, мы не могли этого увидеть в данных.

«Лука Модрич был игроком, по которому у нас было больше всего разногласий (когда мы оба работали вместе в «Тоттенхэме»). Мы говорили, что он игрок выше среднего уровня, но не входит в топ-10 Премьер-лиги. Майкл настаивал, что Модрич, безусловно, лучший игрок в нашей команде, и он был прав, потому что его навыки не очень хорошо отражались в данных, которые мы собирали».

Это говорит о практически универсальном опыте, с которым столкнулись первые аналитики данных в футболе. Несмотря на то, что порой их считали «гиками, работающими с цифрами», их важнейшим навыком был навык социальный — умение доносить свою работу до членов клуба, чтобы продемонстрировать её ценность.

«Социальные навыки, возможно, немного мешают: мы все интроверты. Это стандартный тип личности для нас», — говорит Грэм. «Но общаться необходимо. Ричард Фейнман, физик-теоретик, лауреат Нобелевской премии — отличный пример. Он работает над сложными вопросами, квантовой механикой, но у него есть такая цитата: «Если вы не можете объяснить свою теорию за пять минут тому, кто подаёт вам пиво в местном баре, значит вы сами её не понимаете».

«Многие сотрудники футбольных клубов не являются экспертами по данным . Им и не следует быть экспертами, у них слишком много других дел, и они не могли позволить себе потратить три года на получение степени по математике. Но они, как правило, умные люди, полные энтузиазма, и ваша задача как специалиста по данным — объяснить этим людям понятным футбольным языком как работает ваша модель».

Основатель Statsbomb Тед Кнутсон несколько лет проработал в «Брентфорде», где его труд высоко ценился, но опыт работы в других клубах порой заставлял его испытывать определенные трудности. 

«С некоторыми футбольными директорами старой школы мне было очень сложно работать», — говорит он. «Они были не готовы к подобному. Первые пять лет у меня постоянно возникали противодействия, и даже в прошлом году у меня был конфликт с одним тренером. Но в конце концов владельцы клубов увидели, что лучшие команды мира используют данные, и поняли, что должны принять это».

Как только они закрепились на рынке, аналитики данных всё чаще стали ссылаться на их достижения как на доказательство их ценности. Например, в «Брентфорде» данные были ключевой частью философии клуба. Находясь в Первой лиге и не имея ресурсов для покупки топовых игроков, клуб вместо этого постепенно продвигался вверх по лигам, постоянно покупая перспективных игроков за гроши и потом продавая их с большой прибылью».

«В мои последние годы в «Арсенале» у нас была основная группа футбольной разведки, которая работала очень слаженно», — говорит Сара Радд. «Мы сосредоточились на снижении риска любых подписаний, используя все источники информации, будь то данные или более традиционное скаутинговое наблюдение. Если посмотреть на трансферную историю «Арсенала» за этот период, то с 2020 года соотношение удачных и неудачных сделок резко изменилось».

«Например, мы поработали над сбором по-настоящему индивидуальных, субъективных данных об игре в защите. Это была огромная чёрная дыра в аналитике, и она остаётся таковой для большинства клубов по всему миру и сейчас. Хотя данные о событиях обычно фиксируют подкаты и единоборства, это всего лишь результат агрессивной игры футболистов, но настоящее искусство защиты заключается в выборе позиции и предвосхищении развития событий, а не во вмешательстве уже по факту произошедшего события.

«Но мы разработали способ сбора собственной информации о защитниках. Это была программа, которая, по сути, оценивала, когда игроки действуют правильно, а когда нет, невероятно сложная и трудоёмкая. Потребовалось пять лет, чтобы методология заработала, и приобретения центральных защитников «Арсеналом» в последние годы имеют довольно хорошую историю».

Революция данных не была линейным процессом и даже не ограничивалась лишь горсткой пионеров. С середины 2000-х годов параллельно шло множество исследований: исследования ставок Тони Блума и Мэтью Бенхэма, владельцев «Брайтона» и «Брентфорда» соответственно, внутренние исследовательские группы «Арсенала» и «Ливерпуля», а также внешние консультанты, такие как Opta и Statsbomb. Зачастую они работали совершенно независимо друг от друга.

«Иногда я ходил на встречи с коммерческими ребятами, которые продавали наши работы», — говорит Грин, тогда работавший в Opta. «И когда я это делал, всё было довольно скрытно. Создавалось впечатление, что клубы заинтересованы в наших услугах, но никто не раскрывал все карты. Помню, как пошёл в «Челси» и точно знал, что они что-то делают, но понятия не имел, насколько это ценно».

Кнутсон утверждает, что историю футбольных данных можно условно разделить на четыре волны:

  • Волна азартных игр , возглавляемая Бенхэмом и Блумом, когда футбольные данные впервые были использованы в коммерческих целях.

  • Внутренняя волна — когда такие клубы, как «Арсенал» и «Ливерпуль», подхватили эти возможности и начали проводить собственную работу за кулисами.

  • Демократизация данных , в ходе которой такие компании, как Opta и Statsbomb, начали продавать инструменты, к которым клубы разного уровня, входящие в футбольную пирамиду, могли получить доступ и использовать их.

  • Рождение данных отслеживания — когда такие сервисы, как SkillCorner, начали добавлять объективные физические данные к существующим цифрам, что вышло за рамки некоторых возможностей традиционного скаутинга

На раннем этапе задачи Грина в Opta в плане исследований и разработок носили в целом экспериментальный характер.

Грин — одна из ключевых фигур, стоящих за разработкой xG. Пока Радд в частном порядке разрабатывала аналогичную модель в «Арсенале», первоначальный пост Грина в блоге на эту тему превратился в достаточно известную статистику, чтобы её можно было использовать в Match of the Day. «Это как если бы Ньютон и Лейбниц одновременно независимо друг от друга описывали исчисление», — шутит Радд.

«Это странно, потому что это (xG) не стало особо популярным в то время, но стало популярным впоследствии», — говорит Грин. «В конечном счёте, это попытка описать игру, систематизировать то, что, по вашему мнению, происходит на самом деле. Если вы наносите удар с 25 ярдов, вероятность того, что он попадёт в цель, меньше, чем при ударе головой в упор».

«Так что для меня это стало важным строительным блоком. Нужно было это освоить, чтобы понять ценность генерации различных ударов и забитых голов, потому что именно к этому агрегированию все стремятся в футболе. Но массовый успех xG довольно удивителен для меня».

Грэм спешит отметить, что ему повезло работать в «Ливерпуле» под руководством Клоппа и Эдвардса, где были чёткие рабочие процессы.

«Важность честности с менеджером при подборе персонала недооценивается», — объясняет он. «Нужно сказать тренеру, что, хотя вы считаете игрока X лучшим, на самом деле он не идеален, и вот его слабости. Комфортно ли вам будет работать с таким игроком ? 

«В Юргене было замечательно то, что он был готов принимать недостатки игроков, в обмен на их сильные скиллы. Он говорил, что если у игрока есть суперсильные стороны, он сможет скрыть их недостатки. Как отдел подбора персонала, мы могли честно высказывать своё мнение, и это избавляло тренера от разочарования, когда игрок оказывался неспособным сделать что-то определенное».

В «Арсенале» структура постепенно совершенствовалась. «Мы так рано начали работать с данными, что многие ещё не понимали, что мы делаем и как нас лучше всего использовать», — объясняет Радд. «Думаю, одной из проблем поначалу было то, что до появления спортивных директоров за всё отвечал один менеджер. Конечно, они не особо задумывались о том, как должен выглядеть процесс принятия решений, что порой мешало нам оказывать максимальное влияние рабочие процессы».

«Некоторые считают, что данные при подборе игроков используются только для составления списков или их фильтрации. Я твёрдо убеждена, что данные и аналитика имеют свой собственный голос и должны проводить независимую оценку игроков, отдельно от скаутов, чтобы у вас были разные точки зрения и вы могли как бы подсветить слепые зоны друг друга».

Сейчас практически в каждом клубе Премьер-лиги есть технический директор или его эквивалент, что позволяет данным занимать важное место в структуре управления клубом. Конечно, между лидерами, к которым обычно относят «Манчестер Сити», «Ливерпуль» и «Арсенал», и клубами, занимающими нижние строчки турнирной таблицы, по-прежнему существует огромная разница.

Но некоторые новички, работающие на более обширных футбольных должностях, даже обладают аналитическим опытом. Бен Кнаппер, бывший менеджер по арендам «Арсенала» и новый спортивный директор «Норвич Сити», вместе с Сарой Радд работал в StatsDNA. Это демонстрирует новый масштаб этой дисциплины.

Что ждет аналитиков данных дальше? Остаётся лишь один вопрос: начнут ли они влиять на тренеров в игре, предлагая замены по ходу матчей или изменения в системе в целом. Определённый технологический прогресс делает некоторые аспекты этого теоретически возможными, хотя на практике эта планка еще очень далека.

«Одна из причин, почему это так сложно, заключается в том, что в футболе существует множество способов победить. Это не бейсбол, где существует идеальный и точный способ перемещения игроков по базам», — объясняет Радд. «Это действительно можно оптимизировать, чего нельзя сделать в футболе, потому что, какую бы стратегию вы ни придумали, кто-то обязательно её уравновесит. К тому же, 45 минут тайма— это не так уж много данных для анализа и принятия решений».

«Честно говоря, именно здесь человеческий мозг гораздо лучше справляется с выявлением закономерностей. Довольно рано в «Арсенале» мы получили доступ к данным отслеживания в режиме реального времени, и тренеры хотели, чтобы мы определяли зоны, которые можно использовать. Но эти зоны не остаются открытыми долго, поэтому человек гораздо лучше справляется с тем, чтобы сказать: „Этот игрок неудачно расположен или реакция того игрока немного замедлена“. С помощью современных инструментов, вероятно, можно было бы построить модель немного лучше, но, думаю, именно здесь человеческий мозг действительно превосходит все ожидания».

Грэм согласен. «Я не думаю, что данные пока что-то значат для тактики и этому есть просто объяснение. Чтобы что-то сказать о тактике, нужна хорошая модель отслеживания, а у большинства команд её нет . Разве что у крупных команд Премьер-лиги и пары европейских грандов. Нам потребовалось два года, чтобы создать такую модель в «Ливерпуле», и у нас была одна из самых обеспеченных ресурсами команд по анализу данных в футболе».

«Но для большинства команд, если данные влияют на тактику, то, вероятно, не стоит этого делать, если только вы не уверены, что у вас очень хорошая модель. Вам нужно убедить тренера использовать её, а это очень высокая планка».

Вместо этого некоторые видят следующий рубеж в использовании данных. 90% работы Грэма было связано с подбором игроков, и, хотя Радд была сосредоточена на подписании контрактов лишь наполовину, трансферы считались главным приоритетом. Однако данные можно использовать и в других направлениях работы клубов.

«Данные тренировок и совершенствование навыков игроков будут иметь большое значение в будущем», — говорит Кнутсон. «Использование такого оборудования, как высокоскоростная камера и радар LiDAR, могут помочь улучшить технику ударов по мячу .Это может иметь большое значение, поскольку от правильной техники ударов во многом зависит результативность. Но это также влияет, например, на то, насколько стабильно центральный защитник будет отдавать мяч на фланг. А мы знаем, что это очень ценный пас, который может сделать далеко не каждый центральный защитник».

Аналитикам данных пришлось долго бороться, чтобы доказать свою важность для футбола. Иногда цифры не говорят сами за себя, и им нужен кто-то, кто их поддержит и сможет объяснить другим. Но сейчас представить работу любого успешного клуба невозможно без аналитики данных.