Методы скаутинга
Этот пост написан пользователем Sports.ru, начать писать может каждый болельщик (сделать это можно здесь).
Поиск перспективных футболистов — сложный процесс, требующий сочетания разных методов. Лучшие селекционные отделы мира комбинируют аналитический подход, системный видео-просмотр матчей, живой скаутинг, развитую сеть контактов и региональных скаутов чтобы максимально повысить эффективность поиска. Методы поиска юных игроков не прошедших полноценно пубертатный период (детско-юношеский футбол) — это отдельная область, со своими нюансами (например, бразильские клубы выискивают юных талантов прямо в фавелах через локальные связи), поэтому остановимся пока на селекции для профессиональных команд.
Метод 1. Аналитический метод (Дата-драйвен)
Суть метода
Data-driven подход — это когда первичный поиск строится на данных, но ключевое: цифры не заменяют видео-анализ, а структурируют видение и снижают субъективность. Клуб формирует вотч-лист кандидатов используя статистику, метрики физической активности и данные аналитики для глобального поиска игроков. Скауты задают профиль позиции (модельные характеристики) и получают из баз данных список имён потенциально подходящих под заданные критерии — на этом построена система «воронки» поиска. Все эти данные собираются воедино, после чего начинается последовательная фильтрация списка.
Как это работает
На первом этапе клубные скауты-аналитики прочесывают все доступные данные и сначала формируют список наиболее релевантных и доступных рынков. Далее специальные алгоритмы оценивают тысячи игроков по ключевым параметрам — и отсеивают неподходящих. Данные используются не чтобы сразу найти одного лучшего, а чтобы из условных 5 000 игроков выделить примерно 80-100 наиболее подходящих под критерии и внести их в вотч-лист. Далее скауты посредством видео-просмотра, зачастую по нарезкам наиболее важных характеристик, выберут 20-30 самых интересных и составят лонг-лист. И уже этих оставшихся кандидатов скауты просматривают более детально, изучают их матчи и отслеживают выступления самых подходящих из них. Такой подход сильно экономит время и повышает потенциальную глубину отсмотра лучших из отобранных кандидатов.
Аналитические инструменты охватывают даже экзотические рынки, куда раньше скауты могли не доехать. Для этого используется анализ рынков, отслеживается динамика их развития. Например, сборная Эквадора U20 выиграла Кубок Южной Америки в 2019 году и на этом турнире блистали одни из первых звездочек академии Индепендьенте Дель Валле, 1999-2000 годов рождения. Но уже следующее их поколение, игроки 2001-2002 г.р. были еще ярче и явно намечалась тенденция на появление нового топ-рынка, качество подготовки игроков было очень высоким, это сильно бросалось в глаза. Клубы имеющие сильные селекционно-аналитические отделы в состоянии игнорировать сформированные предрассудки о тех или иных рынках и предугадывать такие тенденции, приходить на эти рынки за игроками раньше других. Например, Брайтон с помощью статистического анализа нашел молодого эквадорца Мойзеса Кайседо и купил его всего за €5 млн в 2021 — через пару лет он вырос в звезду, принесшую клубу €116 млн. Да, он стал первым топ-игроком нового поколения Эквадора, но у этого были предпосылки и аналитики клуба вовремя это поняли. Спустя время на сцену вышли и другие выпускники этой академии — Инкапи (Арсенал), Пачо (ПСЖ), Ордоньез (пока Брюгге) и т.д. С момента перехода Кайседо прошло всего 5 лет, но за игроками академии Индепендьенте Дель Валле теперь следят все топ-клубы Европы, начиная с 14 летнего возраста. За 16 летнего Паеса Челси заплатил €10 млн., наступил момент когда этот рынок уже начал перегреваться. Что стоит за ростом эквадорского рынка, помимо значительных инвестиций владельца ведущей академии страны? Системный подход и блестящая работа координатора академии по внедрению корректных модельных характеристик? Сильное влияние приглашенных тренеров из Аргентины и других стран или выстроенная детско-юношеская селекция с региональным скаутингом? Или возможно интернат на 150 мест и топовая инфраструктура на уровне лучших академий мира? Понимать эти причины необходимо, чтобы отслеживать тенденции и это также является важной аналитической работой.
Инструменты
Клубы используют международные платформы (Wyscout, RuStat, Eyeball, SICS, Scoutastic, DribLab, Transferroom и т.д.), внедряют собственные модели и метрики, создают свои платформы для систематизации работы и структурирования хранения данных, для анализа эффективности своих сотрудников. Например, в Севилье в золотую эпоху Мончи параллельно работал целый аналитический отдел, дополняющий работу 15 скаутов. Мончи отмечал, что они планируют трансферную кампанию опираясь на два столпа: традиционный скаутинг и аналитический отдел — данные крайне важны, хотя и не безошибочны. Современные клубы вроде Челси также инвестируют в аналитику: новый владелец аристократов сформировал расширенный отдел скаутинга и отдельную группу дата-аналитиков, провозгласив «современную философию, основанную на данных». Более того, владельцы клубов строят целые мультиклубные сети (например, City Football Group, система клубов Red Bull), чтобы получать данные и просматривать игроков в разных лигах по единой методике — это тоже элемент аналитического подхода к глобальному поиску талантов.
Преимущества аналитического метода
- Охват и эффективность. Компьютерный анализ способен оценить десятки тысяч игроков за минуты, выявляя тех, кто отвечает заданным критериям. Скауты физически не в состоянии просмотреть такое число кандидатов — алгоритмы создают воронку наиболее подходящих талантов без лишних затрат времени. Это особенно важно для клубов с небольшим бюджетом, которым нужно опережать рынок чтобы оставаться конкурентоспособными. Дата-скаутинг позволяет «рыбачить в море, а не в пруду агентов», находя малоизвестных, а потому дешевых игроков до того, как их заметят гранды. Это своего рода промысловая разведка, но вместо гидролокаторов используют аналитические данные — для того чтобы понять где рыбачить, нужно сначала понять где рыбы больше и где она более крупная.
- Объективность отбора. Статистические показатели дают объективную оценку игры: эффективность в действиях с мячом, фитнес-данные для анализа интенсивности и скорости. Это снижает влияние субъективных восприятий конкретного скаута и его когнитивных искажений. Данные помогают обнаружить недооцененных игроков, но выдающихся по ключевым метрикам. Например, алгоритмы могут подсветить защитника в низших лигах с аномальным процентом выигранных дуэлей или плеймейкера с подозрительно высоким показателем обостряющих передач.
- Фильтрация и минимизация рисков. Грамотно настроенная воронка постепенно отсеивает лишних кандидатов. Сначала исключаются игроки, которые не выделяются по эффективности в ключевых показателях, далее не соответствующие стилю команды или слишком дорогие. Затем остаются несколько десятков имен для углубленного перекрестного видео-анализа. Такой многоступенчатый подход снижает риск ошибок: финальный шорт-лист уже многократно проверен по различным параметрам. В результате у клуба повышается процент удачных трансферов.
- Экономия ресурсов и времени скаутов. Аналитический отбор высвобождает скаутам время для более глубокого изучения лучших кандидатов. Пока компьютер сортирует статистику тысяч игроков, эксперты могут сосредоточиться на детальном разборе нескольких десятков наиболее эффективных в своих лигах кандидатов. В Брайтоне всего 7 постоянных скаутов (без учета региональных и внештатных), но они закрывают глобальный поиск, потому что получают от аналитиков готовые «светофоры» по игрокам: красный — нет, жёлтый — наблюдать, зелёный — потенциальная цель для просмотра. За счёт этого не нужен штат сотен скаутов по всем странам — достаточно небольшой, но квалифицированной команды, умеющей работать с данными.
Недостатки
- Ограниченный контекст. Сухие цифры не отражают полностью контекст игры и зачастую завязаны на специфике игры команды или стиля лиги. Статистика не покажет, например, характер игрока, его игровой интеллект, тактическую подготовку, лидерские качества, психологическую устойчивость или влияние на игру его перемещений. Высокие показатели в слабой лиге не гарантируют такого же уровня в топ-чемпионате, многие технические показатели не переносятся в другие лиги в полной мере. Опора только на данные чревата ошибками — обязательно необходима дополнительная проверка глазами скаута. Как признают сами аналитики, «данные — лишь отдельный взгляд, не вся правда. Их ценность, помимо сужения воронки поиска, в том, чтобы или подтвердить впечатление, или заставить присмотреться внимательнее».
- Качество и полнота данных. В реальности сбор данных не идеален. Не все лиги имеют подробную статистику, в некоторых чемпионатах могут отсутствовать метрики физической активности или продвинутая статистика. Данные видеоплатформ иногда значительно разнятся по качеству даже в разных лигах одной страны. Есть и проблема доступности медицинской информации — например, история травм, состояние здоровья игрока не всегда публично доступны, а это важный фактор. Если аналитическая модель недостаточно качественная, клуб может принять решение опираясь на неполную или искаженную информацию. Таким образом, доверять нужно только проверенным источникам данных, иногда смещать границы поисков и постоянно дополнять сухие числа живыми наблюдениями и локальными контактами.
- Риск эффекта «черного ящика». Когда данные становятся главным фильтром, появляется опасность бездумно им верить и следовать. В Брайтоне, к примеру, сами скауты не знают деталей алгоритмов Starlizard, через которые проходят кандидаты. Система выставляет цвет, не объясняя почему игрок отсеян или рекомендован. С одной стороны, это защищает от предвзятости, так как не позволяет скауту опираться на стороннее мнение по игроку, но с другой — может мешать: скаут не понимает, на какие слабости обратить большее внимание при просмотре. Кроме того, модель может игнорировать нестандартных игроков, которые выбиваются из шаблонов (например, игроков с не типичным набором характеристик для своей позиции). Поэтому лучшие клубы стараются не превращать отбор в полностью автоматический: как говорил Мончи, данные — помощник, а не замена интуиции скаута.
- Первичная зависимость от человеческих установок. Любой аналитический поиск начинается с того, что люди задают критерии: какие показатели считать важными, какие пороговые значения поставить, по каким лигам искать. Ошибочно выбранный KPI или предвзятые настройки могут изначально сузить поиск неправильно и выдать не очень качественную выборку. Например, если зациклиться только на статистике голов для нападающего, его касаниях в штрафной или его XG, можно пропустить ценного форварда-созидателя с невысокой результативностью, но большим вкладом в командную игру или игру без мяча. А это может быть просто его текущей ролью в команде, так как по задумке тренера он должен чаще быть задействован в оттяжке, играть между линий, что неизбежно будет формировать его статистический профиль как подыгрывающего форварда, а не завершителя. Поэтому гибкость, развитие и постоянный пересмотр фильтров — обязательная часть дата-метода, чтобы не упустить «нестандартные» таланты и игроков действующих в специфической манере на определенном этапе карьеры.
Выбор модельных характеристик и других критериев поиска — ключевой этап в селекции. Мы ещё вернёмся к их анализу, а пока разберёмся, как работает метод data-driven на практике и кто применяет его наиболее эффективно.