Райан Охэнлон. «Чистая прибыль. Революция аналитики в прекрасной игре». Глава 7: Большой Тед, часть 2
Этот пост написан пользователем Sports.ru, начать писать может каждый болельщик (сделать это можно здесь).
- Проблема больших данных, часть1 и часть 2
- Только данки, часть 1 и часть 2
- Мифическое завершение
- Денежный путь
- Мимолетное увлечение
- Стандартные положения
- Большой Тед, часть 1 и часть 2
- Среднее поле
- …
Покинув крыло Бенхэма, Кнутсон вернулся в StatsBomb и превратил сайт в консалтинговую компанию. Блог остался, но он служил своего рода маркетинговым рычагом — резюме образа мышления StatsBomb, краткий взгляд на то, что вы можете заплатить им, чтобы они сделали для вас. В каком-то смысле «Мидтьюлланд» и «Брентфорд» были худшими местами для работы Кнутсона: их процессы были уже отлажены; из всех клубов мира именно эти два меньше всего выиграли бы от присутствия его мозгов в комнате.
Помимо работы с игроками, тренеры стали обращаться к Кнутсону и по поводу его писательской деятельности. Томас Тухель, который в перерывах между работой в Германии вывел «Пари Сен-Жермен» в финал Лиги чемпионов в 2020 году, а затем выиграл ее с «Челси» в 2021 году, был очарован идеей создания шансов с высокой вероятностью и выяснил, как это сделать. Это видно и по тому, как сейчас играют его команды: команда Тухеля, как правило, наносит меньше ударов по воротам, чем другие большие клубы Европы, но сами удары почти всегда оказываются более качественными. Рогер Шмидт, бывший тренер леверкузенского «Байера» в Германии, также заинтересовался работой Кнутсона. Его команда играла, пожалуй, в самом неистовом стиле среди всех современных команд, выступающих в крупных европейских лигах. Они наносили удары по своему усмотрению, быстро перемещая мяч вверх по полю или даже отбивая его куда подальше после восстановлееения владения. В паре с агрессивным прессингом они пытались быстро отвоевать мяч на половине поля соперника, чтобы иметь возможность еще больше бить по воротам. Майкл Кейли написал анализ команды Шмидта, в котором он обнаружил грубую ценность системы прессинга. В то время как в среднем владение мячом приводило к удару всего 2 раза из 100, вероятность того, что владение мячом, начавшееся с перехвата мяча в районе середины поля в центре половины поля соперника, приводило к удару в 10 раз выше. «Я показал это Рогеру, и он пришел в восторг», — сказал Кнутсон. В 2015 году Кнутсон обсуждал стратегию стандартных положений с тогдашним тренером «Нью-Йорк Ред Буллз» Джесси Маршем. «Через год после того, как мы говорили об этом, у Саши Кльестана было 20 передач или что-то вроде этого абсурда в MLS, и они забили бесконечное количество мячей со стандартов».
Даже если вы не могли убедить всю организацию принять вашу философию, и даже если футбольный мир в целом был как глыба в своем сопротивлении переменам, все равно везде, в каждом клубе, в каждой команде были любопытные люди. Консультации — это способ привлечь их и заставить их дать вам деньги. С помощью Йорка и других людей Кнутсон довольно быстро начал работать с клубами по всему миру, давая им советы о том, кого подписать и каких тренеров нанять. Большинство людей игнорировали их, некоторые прислушивались, и еще меньше людей действовали в соответствии с их советами. Один из клубов MLS попросил StatsBomb провести анализ трех игроков, которых они собирались подписать. StatsBomb провела анализ и вынесла одинаковый вердикт по каждому парню: не подписывайте его. Вот только клуб хотел не этого. Видите ли, они уже подписали всех трех игроков, и им не очень-то нужна была честная оценка их способностей. Нет, им просто нужны были цифры, которые позволили бы их новым подписаниям выглядеть хорошо. Не могли бы вы, ребята, сделать именно так?
Попутно Кнутсон продолжал разрабатывать общие контуры своей теории правильного ведения игры. Для начала научитесь хорошо играть при стандартах. «Если вы не готовы к стандартам, это преступная халатность по отношению к своей работе, и вы должны быть уволены, — сказал Кнутсон. — Вы просто очень тупой, и так нельзя». А когда вы не пытаетесь ошеломить защиту заранее заданными схемами и точными передачами со стандартных положений, вы должны бегать, бегать и бегать. В отличие от тренера, который, как отметил Люк Борнн, мог разработать свою теорию о том, как выигрывать матчи, исходя из череды случайных событий, приводящих к забитым голам, Кнутсон разрабатывал свои теории с открытым сердцем. Он хотел знать, что побеждает в играх, чтобы люди могли заплатить ему за то, что он скажет им, что побеждает в играх. И, судя по тому, что он видел, прессинг противника на его оборонительной трети — это то, что нужно. Преимущества двойные: (1) если вы отвоевываете мяч, вы отвоевываете его у игроков, которые настроены на атаку, а не на защиту. Это создает бреши в оборонительной структуре, которых в противном случае не было бы. И (2) это отдаляет действие от ваших ворот, где могут произойти плохие вещи.
«Мы уверены, что прессинг — это система с самой высокой ожидаемой ценностью, но с самыми высокими затратами, и вы должны быть готовы либо внедрить ее во всем клубе и сказать: «Это наша этика», либо иметь запасной вариант, вторую альтернативу, — сказал он. — Я думаю, что это очень важно в сезонах, когда у вас много игр и вы мало отдыхаете. Даже если вы найдете лучшую систему, вы не всегда сможете ее использовать, потому что затраты слишком высоки».
Некоторые тренеры избегают прессингового подхода по тем же причинам, по которым тренеры избегают всего: они напуганы. Когда вы всей командой пытаетесь отвоевать мяч, вы неизбежно допускаете несколько некрасивых голов, когда соперник вырывается вперед, а нападающий соперника прорывается на 35 метров. Когда все идет плохо, это и выглядит очень плохо, но положительные стороны значительно перевешивают отрицательные, если вы придерживаетесь этого подхода в течение длительного времени. Есть и дополнительное преимущество для небольших клубов, играющих в более агрессивном стиле.
«Если вы сейчас не очень озабочены повышением в классе и играете в более высоком темпе, то более высокий темп увеличит статистику голов, что повысит рейтинг ваших игроков в лиге, — говорит Кнутсон. — Это интересно. О, может, нам стоит купить этого парня? Почти никто из тех, кто работал в этом спорте семь или восемь лет назад, не смотрел на него через эту призму. Но если вы родом из игровой среды, вы начинаете понимать все такие вещи. Как я могу продать кому-то свой товар по более высокой цене, чем он готов заплатить в противном случае?» Другой способ сделать это: «Нападающие должны исполнять пенальти, потому что они будут отражаться в статистике голов, и не все их исполняют», — сказал Кнутсон.
В это время самой большой проблемой для StatsBomb было понять, как разговаривать с людьми в игре. Идеи о коэффициентах конверсии, превышении ожидаемых голов и исполнении пенальти — это здорово, но вам еще нужно убедить руководителей и тренеров, что то, что вы делаете, может принести пользу.
«По сути, мы потратили целый год на то, чтобы выяснить, что волнует тренеров в плане игроков или ролей, и сделали это с помощью архетипов. Это было что-то вроде: «Хорошо, тренер, для этой роли назовите мне любую суперзвезду, которая была бы идеальным воплощением того, что вы хотите, чтобы эта роль делала. Дайте нам три или четыре. Кому это подойдет? Кого мы можем найти в этих данных?» А потом: «Что они делают? Опишите, чем они занимаются. Какие вещи они должны делать, а какие — просто иметь?» Мы можем играть в вашу систему, а можем и не играть, но скажите нам, кто эти ребята, чтобы мы могли найти их и отдать вам. Первый год в футболе был связан с тем, чтобы понять, как разговаривать с этими ребятами, и попытаться найти способы привлечь их к работе, в том числе лингвистически, а также дать им возможность довольно быстро добиться успеха, чтобы они потом захотели делать это чаще».
Логической точкой любого великого консультанта должно быть самоотречение. Ваши идеи окажутся настолько успешными и распространенными, что ваши услуги больше не понадобятся. Вы освоите язык, все в конце концов начнут прессинговать, все поймут, что голы с пенальти говорят не больше, чем «этот игрок был выбран для исполнения пенальти».
«Я думаю, есть три фазы, когда данные приходят и разрушают спорт, — говорит Кнутсон, — и первая фаза — это естественная фаза Манибола. В принципе, как нам найти лучших игроков? И это происходит в каждом виде спорта, потому что это самый большой центр затрат. Если вам удастся это сделать, вы получите большое преимущество на ранней стадии. Это преимущество можно сохранить, если вы начнете получать более качественные данные, более совершенные способы анализа или что-то еще. Итак, это первая фаза. Вторая фаза: как сделать спорт лучше, эффективнее и выигрышнее? В баскетболе это трехочковые, проходы под кольцо и тому подобное, а в бейсболе — выяснение того, что скорость и угол пробивания довольно интересны. Но третья волна — это всегда, когда мы имеем эффективный рынок вокруг игроков, и мы понимаем, как играть в игру наилучшим способом, который мы знаем на данный момент — хотя эти грани могут меняться со временем по мере того, как мы получаем все больше и больше информации, мы получаем лучшие технологии, которые мы будем применять — так что третья фаза такая: как нам лучше тренировать игроков? Думаю, сейчас футбол находится за миллион километров от этого. Могу ли я научить кого-то бить по мячу, как Месси? Если я это сделаю, то смогу получать много дополнительных голов в год только со штрафных ударов, потому что он такой невероятный».
Хотя футбол все еще борется с первыми двумя фазами, Кнутсон не хотел становиться жертвой собственного успеха, поэтому в 2018 году StatsBomb вступила в следующую фазу своего развития. Сначала, это был блог Magic: The Gathering. Тогда это был способ скоротать время во время химиотерапии. Затем он стал центральным узлом любительской аналитики. Потом он стал консалтинговой компанией. А теперь это компания по обработке данных.
* * * *
Ожидаемые голы — это не реальность. Это набор решений, принятых отдельным человеком или группой людей, которые пытаются имитировать реальность. И большинство моделей ожидаемых голов не пытаются имитировать реальность в данный момент, они пытаются имитировать ее в долгосрочной перспективе. Модель Майкла Кейли и все другие ранние модели работают в агрегатах. Они сравнивают каждый удар с несколькими ударами предыдущих сезонов, чтобы вычислить, как часто удар с определенным набором характеристик превращался в гол. Однако каждая отдельная попытка уникальна, и истинная вероятность того, что она будет преобразована — если это вообще возможно выяснить, — отличается от того, что говорит модель. Разница обычно невелика, и редко какая команда или игрок постоянно создает или упускает моменты, которые не соответствуют историческим показателям. Но такое может случиться, и волатильность статистики на небольшой выборке делает ее сомнительной при оценке точного качества одного удара. Даже для одной игры существует разрыв между тем, что предполагают модели, и тем, что происходит в реальности.
Основной способ, с помощью которого модели xG пытаются решить эту проблему и одновременно усугубить ее, — это так называемый «Большой момент». При всей сложности алгоритмов и мощных вычислений данных, стоящих за этими моделями, в основе большинства из них лежит сиюминутное решение. Учитывая, что исходными данными для моделей являются лишь некоторые показатели атаки — тип паса, используемая часть тела, место удара, — вы можете получить ситуацию, когда игрок отрывается от своих ворот, не видя ни вратаря, ни защитника, и забрасывает мяч в ворота с края штрафной площади. Базовая модель видит удар ногой с края штрафной и видит, какой пас привел к удару. Он не будет знать, что рядом с мячом нет ни защитников, ни вратаря, и отнесется к попытке так же, как к подавляющему большинству попыток с такими стилистическими метками. Чтобы избежать такой ситуации, Stats Perform заставляет своих кодеров помечать определенные попытки как «Большие моменты», которые они определяют как «Ситуация, когда от игрока можно ожидать гола, обычно в сценарии один на один или с очень близкого расстояния, когда мяч имеет четкий путь к воротам и на игрока оказывается слабое или умеренное давление». Метка «Большой момент» сразу же увеличила значение xG удара, а также повысила предсказательную силу статистики, уничтожив при этом его микроточность.
Помните тот разговор Пола Пауэра с Гордоном Страканом? Представьте, что это еще один шаг вперед.
А вот и хорошая атака, которая создала много пространства для удара. Как эта штука решает, какую стоимость придать этой штуке?
Ну, значит, где-то в офисе сидит человек, который решает...
Что? Кто?
Я не знаю. Они фрилансеры, обычно только что окончившие университет.
Господи, мужик. Что за черт?
У самого Кнутсона было много подобных разговоров на протяжении многих лет — самый яркий из них с бывшим тренером мужской сборной США Бобом Брэдли, который проходил собеседование на должность в «Мидтьюлланде», когда Кнутсон еще работал в клубе. Создание более совершенной модели xG не только даст StatsBomb инструмент, позволяющий получить поддержку со стороны традиционной футбольной аудитории и, следовательно, заработать больше денег, но и прольет немного больше света в темноту.
В середине 2018 года StatsBomb запустила свое подразделение по сбору данных, а к сентябрю 2018 года объявила о своем самом громком клиенте: «Пари Сен-Жермен». В центре информации, за которую ПСЖ теперь платит, был новый способ думать об ожидаемых голах. Модель StatsBomb отказалась от «больших моментов» и вместо этого включила в себя несколько новых факторов, которые были получены с помощью компьютерного зрения. Компьютерное зрение — именно то, как оно и звучит: использование компьютера для идентификации объектов на цифровом изображении. В тот момент, когда один из кодеров StatsBomb регистрирует кадр, компьютер делает снимок транслируемого видео. Затем он определяет, какое давление оказывается на мяч: как далеко находится ближайший защитник? Затем следует структура защиты: сколько защитников стоит за линией удара и как они расположены? И, наконец, учитывается позиционирование вратаря: где он стоит по отношению к прицелу бьющего по отношению к воротам? Эти факторы отражают некоторые основные интуитивные детали того, о чем думает большинство тренеров и большинство людей, когда оценивают качество момента. Они сделали модель более точной, когда речь шла об индивидуальных моментах и результатах игры, и, согласно независимому анализу, проведенному математиком Ларсом Мауратом, эти факторы также позволили модели значительно лучше предсказывать будущие результаты, чем модели xG первого поколения.
Одним из основных способов улучшения модели по сравнению с данными, которые были получены до нее, является интеграция одной из вещей, которые, по мнению Кнутсона, являются центральными для наиболее эффективного способа ведения игры: давления. Эффективность командного прессинга впервые была оценена в 2014 году аналитиком Колином Трейнором, который в своем посте для StatsBomb создал метрику под названием PPDA (passes per defensive action — пасы на одно защитное действие). В статистике Трейнора учитывается количество передач соперника в обороне на трех пятых поля и делится на количество защитных действий команды (подкаты, перехваты, неудачные подкаты и фолы) на том же участке поля. Это отличная, описательная метрика, но она была прокси (измерение одной вещи в качестве показателя другой вещи), и ее нельзя было применить к отдельным игрокам. Хотя подкаты и перехваты мяча фиксировались уже давно, они рассказывали только о том, как отдельный игрок вернул себе владение мячом. Тренеры ценили игроков, выигрывающих мяч, но еще важнее была способность игрока заставить соперника принять решение, в идеале — менее оптимальное. Прессинг составлял большую часть активных, индивидуальных защитных действий игроков, но его не было видно в собираемых данных, пока StatsBomb не создал свои собственные. В сезоне 2020/21 Премьер-лиги лидер лиги по подкатам и перехватам зарегистрировал 174 таких действия. Лидер лиги по давлению делал это 807 раз. Еще одно мерцание в темноте.
С новыми данными StatsBomb также предоставила новую схему оценки эффективности вратарей. Если и есть в спорте позиция, которая поддается анализу, близкому к изолированному анализу добавленной стоимости, то это вратарь. Но долгое время необходимой статистики не существовало. Количество сейвов вратаря больше зависело от того, насколько плоха была его защита, чем от того, насколько хорошо он умел отбивать мяч. Процент спасения был немного лучше: сколько ударов по воротам он отбил? Но это все равно не учитывало виды ударов, с которыми он сталкивался. Вместо того чтобы признать все это, Премьер-лига решила просто пожать плечами и вручить награду тому, кто сыграл больше всего матчей на ноль. И да, даже если за весь матч вы не противостояли ни одному удару по воротам, это все равно засчитывалось на ваш счет.
Несмотря на то, что есть небольшие преимущества в других навыках, таких как: принятие передачи в штрафную, выбегание из штрафной и вынос потенциального прорыва, надежный пас, когда ваша команда владеет мячом, основная задача вратаря — не дать ударам соперника оказаться в сетке. Единственный способ узнать, насколько хорошо вратарь справляется с этой задачей, — проследить за каждым ударом по его воротам. Потенциальные подводные камни, которые могут возникнуть, если этого не сделать, заставляют вспомнить высказывание Билла Джеймса, отца бейсбольной аналитической традиции: «Наблюдая за игрой, невозможно определить разницу между хиттером с коэффициентом .300 и хиттером с коэффициентом .275. Разница — один удар каждые две недели... Разница между хорошим и средним хиттером просто не видна — это вопрос записи». Даже самые натренированные человеческие глаза с трудом справляются со всеми факторами, которые влияют на качество вратаря. Есть киперы, которые довольно часто совершают очевидно отличные сейвы, но, возможно, они делают это потому, что находятся не в хорошей позиции. Они также могут пропустить голы, которые, казалось бы, невозможно отбить, но до которых можно было бы добраться при более удачном позиционировании. Есть и те, кто всегда находится в правильном положении, поэтому большинство их сейвов выглядят обыденно. В каждом конкретном матче первый кипер будет выглядеть лучше, и только долгосрочный анализ большой выборки ударов покажет ценность второго. Разница между хорошим и средним шот-стоппером тоже может быть вопросом записи.
Летом 2018 года «Челси» заплатил £71,6 млн. за приобретение 23-летнего Кепы Аррисабалаги из «Атлетик Бильбао», побив мировой рекорд по сумме трансфера за вратаря. Он был молод, высок, красив и атлетичен, и уже успел стать основным игроком сборной Испании. Да, это были большие деньги, но кого это волнует? Владельцем «Челси» был русский олигарх. Большинство ведущих изданий высоко оценили этот шаг. Но не StatsBomb. Вооружившись новыми инструментами компании, специалист по анализу данных StatsBomb Деррик Ям решил провести их тест-драйв на Кепе. Рассмотрев скорость удара и положение удара мяча по рамке ворот для 95% ударов Кепы и других киперов Ла Лиги в сезоне 2017/18, он смог определить, как часто средний кипер пропускает гол. Основываясь на количестве ударов, нанесенных по воротам, Ям определил, что процент спасения Кепы на четыре процентных пункта ниже, чем можно было бы ожидать от среднего вратаря. Что еще важнее, он пропустил 37 голов из 126 ударов по воротам, в то время как средний кипер пропустил бы около 31. Другими словами, «Челси» заплатил рекордную сумму за игрока, который был ниже среднего в главном, что должен делать вратарь.
В свой первый сезон в клубе Кепа пропустил на 1,8 гола больше, чем ожидалось, согласно данным StatsBomb, но в каждом матче такая результативность совершенно незаметна невооруженным глазом. Ваш мозг не может понять, что значит пропускать дополнительные 0,05 гола за игру. Таким образом, трансфер продолжал оставаться успешным. В конце 2019 года ESPN назвал Кепу седьмым лучшим кипером в мире: «Самый дорогой вратарь мира всех времен и народов стоит каждого пенни для «Челси» с момента перехода из «Атлетик Бильбао» в 2018 году». Но когда это было написано, Кепа находился в самом разгаре фиаско, которое в итоге стало невозможно игнорировать. В сезоне 2019/20 он допустил на 9,5 гола больше, чем в среднем по команде; каждый может отличить игрока с результативностью .100 от игрока с результативностью .300. В следующем году «Челси» заменил Кепу на Эдуарда Менди, примерно среднего шот-стоппера за свою карьеру, и выиграл Лигу чемпионов. Тем временем, вскоре после написания этой статьи, Деррик Ям был принят на работу в команду «Балтимор Рейвенс».
* * * *
Одно из главных различий между ранними этапами развития аналитики в бейсболе и ранними этапами развития аналитики в футболе — это доступность данных. Если не считать того, что Чарльз Рип и Ричард Поллард записывали в свои блокноты, не существует исчерпывающих данных о событиях в матчах европейской Большой пятерки лиг до 2008 года, то есть настолько далеко, насколько позволяет база данных Stats Perform. В матчах до этого времени вам повезет, если вы найдете точные данные по количеству забитых мячей, не говоря уже о передачах или ударах. Несмотря на первоначальное недоумение по поводу новомодных расширенных статистических данных, бейсбол имеет долгую историю ведения учета. В открытом доступе есть хотя бы частичные данные о статистике матчей в профессиональном бейсболе, начиная с 1876 года — благодаря Шону Форману.
Во время написания диссертации по микробиологии в Университете Айовы Форман решил, что было бы забавно запустить сайт, на котором можно было бы собрать всю эту информацию. Как он это описал: «Я просто подумал: «Эй, знаете, бейсбольная энциклопедия на компьютере — это было бы очень круто». Вы можете оказаться на странице Микки Мэнтла. Вы можете зайти на сайт «Нью-Йорк Янкиз» 1962 года и посмотреть их статистику одним махом, а не таскать с собой пятикилограммовую книгу. На тот момент это было технически осуществимо, а я был аспирантом, так что у меня появилось свободное время, и я решил этим заняться».
Запущенный в 2000 году как хобби, сайт Baseball-Reference.com превратился в полноценную компанию-Sports Reference с 20 сотрудниками и миллионами ежемесячных пользователей. И теперь это не только бейсбол. Есть баскетбольный сайт, футбольный сайт, хоккейный сайт, а с 2018 года и футбольный сайт под названием FBref.com. Сайт по всем видам спорта, кроме футбола, наполнен очень интересными таблицами и страницами игроков, которые отслеживают практически все статистические данные, которые только можно себе представить в современной истории основных американских видов спорта. Если вы хотите узнать, сколько общих баз записал на свой счет Хонус Вагнер в 1901 году, или кто лидировал в НФК Восток по показателю «ярд за вынос» в 1984 году, или кто совершил больше всего попыток бросков с любого места площадки в составе «Нью-Йорк Никс» в сезоне 2007/08, вы можете найти ответы на одном из сайтов Шона Формана. Невероятно, но все это бесплатно. Изначально планировалось, что футбольный сайт когда-нибудь станет похож по масштабу и охвату на другие сайты семейства Sports Reference, но данных для этого просто не существует.
«Он очень, очень, очень отстает, — сказал Форман, сравнивая доступность данных о футболе с доступностью данных о главных американских видах спорта. — Очень долго не отслеживалось ничего, кроме материалов высшего уровня. Ла Лиге все равно, как выглядит статистика Премьер-лиги, и наоборот. Поэтому нет никакой реальной стандартизации в том, как учитываются передачи в разных лигах и тому подобное. В бейсболе у нас есть записи 98% всех игр, начиная с 50-х годов. Это 70 лет игровых отчетов о матчах, которые Opta начала вести в середине 2000-х годов. И, знаете, Opta не очень-то дешевая и публичная компания».
До приобретения компанией Stats Perform, Opta защищала свои данные, лицензируя некоторые из своих основных показателей на нескольких ужасно оформленных сайтах, таким как WhoScored и Squawka. В течение нескольких лет единственным общедоступным источником данных по ожидаемым голам был сомнительного вида сайт под названием Understat. Сами данные, по словам некоторых моих знакомых, имевших доступ к цифрам Opta xG, были очень похожи на те, что выдавала модель Opta xG. Но опубликованной методики не было, и никто не знал, кто создал этот сайт. Там был русский IP-адрес, и я знаю это только потому, что сайт был временно заблокирован ИТ-отделом студии, на которой располагался наш офис, когда я работал на сайте The Ringer. На этом же участке снимали телесериал «Скандал»; здесь хранились жизненно важные секреты, которые нужно было защищать.
Почему все это имеет значение, если большинство профессиональных клубов могут легко позволить себе оплатить стоимость любых данных, которые предлагает им Opta или любой другой поставщик данных? Чем больше людей имеют доступ к данным, тем больше вероятность того, что кто-то откроет для себя что-то новое о спорте. Билл Джеймс, чьи соображения о том, что именно приводит команды к набору очков, легли в основу ранней аналитической теории в бейсболе, был аналитиком-любителем и пришел к этим идеям, когда работал ночным сторожем на консервном заводе в Лоуренсе, штат Канзас. В конце 2000-х годов несколько аналитиков-любителей придумали, как получить подробные данные о питчингах с медиасайта Главной лиги бейсбола. Данные, которые компания Sportvision называет PITCHf/x, включают в себя точную скорость, тип и местоположение каждой подачи. Три разных блогера использовали эти данные, чтобы обнаружить то, что они назвали «фрейминг питча» — определенные кэтчеры чаще превращали подачи, которые были болами, в страйки, и наоборот. Долгое время менеджеры считали, что кэтчеры обладают подобным «мастерством», способностью обмануть судей тем, как они принимают подачу. Данные до немыслимой степени это подтвердили. Исследователи-любители обнаружили, что разница между лучшими и худшими игроками составляет до 30 ранов за сезон, или несколько побед. Они открыли тонны ценностей и перевернули представление о спорте большинства аналитиков, которые списывали кэтчера как менее ценную позицию. Все трое вскоре были приняты на работу в команды MLB.
«Билл Джеймс положил этому начало, но после него были и другие, — сказал Форман. — Вы посмотрите на всю первую волну людей, которых нанимали команды MLB. Там были люди с таких сайтов, как Baseball Prospectus и FanGraphs, которые проводили публичные исследования». Он добавил: «В других видах спорта вы не увидите такого количества общедоступных данных, как в бейсболе. Билл Джеймс и Общество американских бейсбольных исследований на протяжении долгого времени добивались предоставления большего количества данных в открытом доступе. Именно здесь вы увидите, как это выгодно».
Общедоступность также означает, что данные доступны большему числу людей: любой человек, имеющий подключение к Интернету и компьютер, может работать с числами. Как вы, наверное, уже заметили, большинство ведущих фигур в зарождающемся аналитическом движении в футболе шли разными путями, но почти все они — белые, и почти все они — мужчины. Большее количество данных, доступных большему числу людей, теоретически могло бы изменить ситуацию, хотя этого не произошло ни в бейсболе с его ГМ-клубом Лиги Плюща, ни в баскетболе. Аналитик ESPN и бывший игрок НБА Джален Роуз предположил, что растущая зависимость лиги от данных вытесняет чернокожих кандидатов на руководящие должности в спорте, где большинство составляют чернокожие. «Многие люди считают, что в этом есть культурный подтекст, который, по сути, говорит о том, что, хотя я, возможно, не играл, а вы играли, я умнее вас, и я знаю некоторые вещи, которые вы не знаете, и цифры поддерживают меня, а не вас», — сказал он в интервью The New Yorker. В Премьер-лиге аналитика не вытесняет кандидатов из числа меньшинств, потому что она еще не достигла широкого распространения, а также потому, что вытеснять некого. Несмотря на то, что игроки примерно на 30% состоят из небелых людей, в Премьер-лиге в сезоне 2021/22 работает один чернокожий тренер и всего несколько небелых руководителей клубов, самым известным из которых является председатель совета директоров «Манчестер Сити» Халдун аль-Мубарак, получивший образование в Тафтсе, генеральный директор фонда национального благосостояния ОАЭ.
Наивно полагать, что новая эра футбола может породить новую, разнообразную рабочую силу, не связанную с игрой, но хуже от этого точно не станет. К тому же, хотя большинство тех же закономерностей, что и в бейсболе и баскетболе, постепенно повторяются и в футбольном мире, контекст другой: расовое равенство и равноправие сейчас гораздо более актуальная тема, чем когда ботаники захватили другие виды спорта. Если футбольные команды действительно хотят выйти за рамки типичного клубного пула, они могут это сделать. В 2019 году шотландский клуб «Данди Юнайтед» нанял 17-летнего индийского студента по имени Ашвин Раман, который жил с родителями и публиковал аналитические материалы в своем блоге и на странице в Твитере. Он жил в Бангалоре, где подрабатывал аналитиком и скаутом в клубе.
Большую часть своей работы до «Данди» Раман проделал, используя скудные общедоступные данные. То есть до того, как FBref и StatsBomb объединились. В 2019 году, стремясь расширить свой процесс, StatsBomb приобрела ArqamFC, компанию по сбору спортивных данных, расположенную в Каире, Египет, с более чем 100 сотрудниками. Способ сбора данных компании похож на метод Stats Perform — кодеры смотрят игру и отмечают все, что StatsBomb хочет отметить, обычно около 3400 событий за матч, но в их процессе используется компьютерное зрение. Сейчас StatsBomb собирает расширенные данные по более чем 80 мировым лигам. А в 2019 году они начали предоставлять часть средств FBref для лиг Большой пятерки, Лиги чемпионов и Лиги Европы, а также Чемпионата мира и Евро. Команда Формана решает, какую статистику отображать, как ее отображать и даже какую статистику создавать. Доступ к данным StatsBomb для команды FBref позволил получить простую на первый взгляд, но очень полезную статистику под названием «действия, создающие удар», которая дает оценку любому игроку, участвовавшему в любом из двух действий — пас, дриблинг, удар, приведший к другому удару, или привлечение фола — предшествующих удару. Рассматривая эти цифры в долгосрочной перспективе, вы получаете более полное представление о том, какие игроки участвуют во владениях, которые, как вы уже догадались, создают удары. Помимо действий по созданию ударов, FBref предлагает данные StatsBomb по xG, статистику прессинга, а также всевозможную информацию по дриблингу и пасам. Хотите узнать, как далеко Кристиан Пулишич прошел с мячом против «Бернли» в октябре 2019 года? Вы можете знать даже больше: он прошел с мячом 320 метров, но только 244 из этих метров были направлены в сторону ворот соперника.
Учитывая всемирную популярность этого вида спорта и дважды в год поднимающуюся до пены у рта тему потенциальных трансферов игроков, Форман решил, что создание футбольной версии других сайтов Sports Reference — дело решеное. Это мир, в котором фанаты часто отслеживают информацию о рейсах по Европе в надежде связать их с трансфером игрока, следят за передвижением фургонов «Мерседес» без опознавательных знаков по городским улицам и заваливают комментарии к постам любимой команды в социальных сетях фразами «Объявите [игрока X, которого я хочу подписать]». Нигде в Интернете болельщики «Манчестер Юнайтед» не могли получить подробную, детальную, поматчевую информацию о новом полузащитнике, которого они только что подписали. Кроме того, футбольные фанаты в Интернете любят спорить, а теперь у них есть все эти бесплатные данные, которые они могут использовать, а чаще — злоупотреблять ими, чтобы выиграть свои споры. Однако этого до сих пор не произошло. «Наша аудитория не так велика, как мне хотелось бы, —говорит Форман. — Это все еще самый маленький сайт — даже меньше, чем наши баскетбольный и футбольный сайты, что меня немного удивило».
Форман объясняет это черной магией поисковой оптимизации, а также говорит, что многие новые пользователи — их самая большая аудитория из Великобритании, вторая по величине из США — жалуются на то, как выглядит сайт, как будто им обидно, что энциклопедия футбольной статистики выглядит как энциклопедия. Большинство американских болельщиков познакомились с сайтами Sports Reference еще тогда, когда все в Интернете выглядело немного хуже, так что они привыкли к этому. Но помимо этих причин, подгруппа болельщиков, которым важно знать эти вещи — кому интересно, как выглядят показатели xG их команды или кто из их полузащитников чаще всего продвигает мяч вперед по полю — остается относительно небольшой. А еще есть группа фанатов, которых оскорбляет сама идея существования такого сайта, как FBref.
«Я не могу вспомнить некоторые из уничижительных терминов, которые я видел у людей, использующих FBref», — сказал Форман, отметив, что в бейсболе «количество людей, которые высмеивают Wins Above Replacement, сокращается. Я не знаю, дойдет ли футбол до этого. Не знаю, стоит ли, но я думаю, что с учетом миллиардов людей, следящих за футболом, наверняка найдется сотня миллионов, которые захотят взглянуть на аналитику? Пятьдесят миллионов? Но мы еще не дошли до этого, так что если у вас есть идеи, я буду рад их услышать».
* * * *
Грань между компанией, предоставляющей данные, и маркетинговой компанией быстро становится размытой. В каком-то смысле так и должно быть. StatsBomb продает свои данные FBref, и они также получают выгоду от того, что их имя ассоциируется с сайтами Sports Reference. Они выпустили бесплатные данные StatsBomb для каждого матча, в котором Лионель Месси когда-либо играл за «Барселону», а также для некоторых других, ранее не учтенных соревнований. Они также предлагают различные курсы — один по тренировкам стандартных положений, другой по скаутингу и рекрутингу, а третий, более общий, по использованию аналитики для улучшения вашей команды. Стоимость обучения варьируется от $80 до $650, а в занятиях участвуют представители ряда ведущих клубов мира. По словам Кнутсона, StatsBomb не ставит перед собой задачу безубыточности этих курсов, но увеличение числа тренеров в мире, ориентированных на аналитику, также увеличит число клубов, которые могут быть заинтересованы в приобретении данных, необходимых для применения этих аналитических стратегий.
StatsBomb также популяризировал столь порицаемый радарный сюжет. По сути, это круг с 11 равноудаленными точками, расположенными по краям. Каждая точка представляет собой статистику, а внутри круга находится еще 11 точек. Их расстояние от центра круга определяется процентильным рейтингом игрока по данному показателю. Затем точки соединяются линиями, и получается многоугольник с отклонениями. Это сложно описать, но интуитивно понятно: чем больше заполнен круг, тем лучше игрок. Иногда они заставляют Кристиана Пулишича выглядеть так, будто он не хуже Лионеля Месси.
Только вот радар предполагает, что на первый взгляд вся статистика одинакова ценна, а форма во многом определяется тем, как каждая статистика расположена по окружности. Люк Борнн ненавидит их, и даже Дэрил Мори выступил против графиков, написав в Твиттере: «Ни один аналитик, достойный своего хлеба, не использует радарные графики, круговые диаграммы или 2 оси Y. Возможно, даже больше, если подумать. Все это вводит в заблуждение». Это больше маркетинг — легко поделиться в социальных сетях, легко посмотреть, легко поспорить, — чем устройство, продвигающее нас к более просвещенному пониманию спорта. То же самое можно сказать и о некоторых визуализациях, создаваемых StatsBomb и другими компаниями. Вы увидите черный фон с различными огненно-раскрашенными векторами, разбегающимися во все стороны, с небольшими изменениями в каждой линии — тильда в середине, другая форма на конце — для обозначения различных действий, которые представляет линия. Это как если бы Джексон Поллок был графическим дизайнером, которого волновал только футбол. Я буду восхищаться деталями и дизайном, прежде чем натолкнусь на интеллектуальную стену: о чем это мне говорит? Как я могу узнать здесь что-то, кроме «Этот игрок или эта команда точно много чего сделали?» И тут я понимаю, что это не так: это демонстрация вычислительных мощностей компании, призыв убедить больше клиентов подписаться.
И их становится все больше и больше, потому что помимо радаров и диаграмм разбрызгивания, можно выиграть и сэкономить миллионы долларов, выяснив, что могут рассказать данные, которые предоставляет StatsBomb. Теперь это не только ПСЖ: у компании Кнутсона есть клиенты практически во всех ведущих лигах мира. Они предоставляли данные и аналитику для бельгийской сборной, когда та занимала первое место в мировом рейтинге ФИФА. Они разработали программу для Швеции в преддверии Евро-2020. А в середине 2021 года «Ливерпуль» объявил, что тоже будет использовать данные компании. Хотя очень немногие клубы высокого уровня готовы отдать Кнутсону ключи от управления, все больше и больше людей понимают, что им нужно хотя бы прислушаться к тому, что он продает.
Вскоре он надеется продать и другой футбол. Осенью 2021 года он провел в составе футбольной команды Университета Майами, чтобы прислониться к воротам, узнать, как говорят тренеры, и научиться тем же самым передовым методам, которые он разработал для соккера [Так в Америке называется европейский футбол, в который играют ногами, а не руками, прим.пер.]. В конечном итоге Кнутсон хочет развить возможности StatsBomb по предоставлению точных и глубоких данных и консультаций командам американского футбола, как в НФЛ, так и на уровне колледжей. Они также наняли Сета Партноу, бывшего директора по баскетбольным исследованиям в «Милуоки Бакс», чтобы он помог компании однажды выйти и в НБА.
Учитывая, что футбол все еще находится на столь ранней стадии развития, попытка внедрить его в НФЛ, как бы это ни звучало, может показаться тонной лишней, ненужной работы. Но это может оказаться неправдой. По прогнозам Кнутсона, на следующем этапе развития футбола он станет более похожим на американскую его версию: больше организации и больше игры.
«Я разбирал некоторые тактические моменты, связанные с «Манчестер Сити», и смотрел на их небольшую ротацию в полузащите, которую они проводили с [бывшим менеджером] Мануэлем Пеллегрини, — сказал Кнутсон. — Один парень приходил за мячом, либо Давид Сильва, либо Яя Туре, и у них были одна или две небольшие схемы маршрутов, которые они запускали, и они их искали. В противном случае они либо восстановят игру в полузащите, либо Серхио Агуэро будет на удивление хорош в атаке. В этом парне 170 см роста, но он настолько силен, что центральным защитникам было очень сложно его сдвинуть. Если ему удастся прорваться до штрафной, то «Сити» постоянно будет использовать [правого защитника] Пабло Cабалету, который будет делать забегание, а затем оттягивать на себя полузащитников. Я подумал: «Это интересно. Это всего лишь декорация к розыгрышу». В баскетболе он идет к кольцу, у вас есть одна или две пробежки, может быть, вы выводите его на пик энд ролл, может быть, у вас будет трехочковый бросок; это примерно такая же концепция. Думаю, это следующая область. Когда команды перейдут на розыгрыш в финальной трети или его эквивалент, именно это вы начнете наблюдать в следующей волне тактической эволюции. У них у всех будут свои маленькие игровые программы, основанные на этом».
Возможно, это и есть ключ к созданию фонарика, который будет достаточно большим, чтобы видеть почти все. Перестаньте гнаться за динамичным, неструктурированным беспорядком, который в настоящее время составляет 90-минутный футбольный матч, и вместо этого измените способ проведения игры. Сделайте так, чтобы его было легче измерить.
Приглашаю вас в свой телеграм-канал, где переводы книг о футболе, спорте и не только!