Заметки города Б
Блог
Трибуна

Команда из России придумала метрику оценки вратарей. И презентовала ее топовым аналитикам в Лондоне

Этот пост написан пользователем Sports.ru, начать писать может каждый болельщик (сделать это можно здесь).

От редакции: вы в блоге Кирилла Серых, который работает аналитиком Немецкой футбольной лиги, а здесь делится впечатлениями и открытиями. Подписывайтесь, пишите комментарии и ставьте плюсы, чтобы фактурных и интересных постов было еще больше.

Лондонская конференция компании Statsbomb – одно из главных событий года в мире футбольной аналитики. Люди из клубов, медиа и аналитических компаний обмениваются опытом и делятся прорывными технологиями. Несмотря на то, что там выступают ведущие специалисты топ-клубов, послушать презентации может любой желающий – достаточно купить билет и приехать в начале октября на «Стэмфорд Бридж». В 2019-м я посетил конференцию простым слушателем – заранее сделал визу в Англию, купил билеты, снял жилье на пару дней около стадиона «Челси» и полетел узнавать последние разработки индустрии, а также заводить знакомства. Почитать о докладах прошлогодней конференции и моем общении с главой дата-отдела «Ливерпуля» Ианом Грэмом можно в этом посте, а сейчас расскажу, как я попал на эту конференцию уже докладчиком.

Короткое отступление на два абзаца.

Чуть меньше года я работаю аналитиком данных (data-scientist) в Sportec Solutions (одна из дочерних компаний DFL – Немецкой футбольной лиги, включающей 1 и 2 Бундеслиги). Моя задача: аналитические отчеты для самой лиги, ее 36 команд и немецких сборных, а также разработка и внедрение продвинутых статистик для более широкого зрителя. Если смотрели матчи Бундеслиг, то точно видели плашку Bundesliga Match Facts – 6 статистик (xG, прессинг, профиль передач игрока, скорость игроков, зоны атаки и средние тактические позиции), которые я вместе с коллегами разрабатываю, внедряю и обслуживаю. Их изменения можно смотреть в режиме реального времени на сайте Бундеслиги и в официальном приложении прямо во время матча. 

Инфографика для одного из новых показателей – профиля передач.

Вид в приложении Бундеслиги.

На эту работу я попал, победив в соревновании аналитиков, которое организовали DFB (Немецкая федерация футбола), DFL и «Айнтрахт». Наш прототип новой вратарской метрики признали лучшим среди остальных. Из-за большой загрузки я не успевал доработать идею до финального продукта, и конференция Статсбомба дала возможность продолжить исследование, а также привлечь к нему двух очень талантливых ребят из России. 

Сама конференция состоит из двух площадок. Первая – более прикладная, ориентирована на людей со спортивным прошлым и сотрудников медиа, там делятся опытом главы аналитических отделов и топ-менеджеры больших клубов. В этом году выступали главы аналитических отделов «Ливерпуля», «Аякса», «Лестера» и «Торонто», а также спортивные директора «Лиона», «Лидса», «Лос-Анджелеса» и «Барнсли».

Расписание конференции. Наш доклад – справа посередине.

Вторая площадка ориентирована на исследователей футбольных данных. Попасть спикером в нее может любой желающий, достаточно лишь придумать крутую идею для исследования и убедительно ее описать. Если идея понравится аналитикам Статсбомба, то они бесплатно дадут свои данные для исследования и презентации. Особенность этого года – новый уникальный тип данных StatsBomb 360. Подробнее можно почитать в этом обзоре, но если вкратце – это нечто среднее между event-данными (данные каждого события, происходящего на поле, например, удара, паса, отбора) и трекинг-данными (координаты игроков и мяча, передаваемые с частотой от 10 до 50 кадров в секунду). То есть StatsBomb 360 – это расширенные event-данные, показывающие не только место, где игрок совершил действие (например, обводку), но и где в этот момент находились его партнеры и соперники, попавшие в кадр камеры. Таким образом, аналитик получает больше контекста.

Почему эти данные так важны? Получить трекинговые данные по любому матчу очень сложно – нужно либо иметь специальное оборудование (камеры, микроволновые или GPS-датчики). И если в топ-5 лигах эти данные собираются более-менее централизованно и даже обязательно (у нас в Бундеслиге их собирает компания ChyronHego, устанавливая по 20 камер на каждом стадионе), то получить их в лигах уровня ниже уже гораздо сложнее. Event-данные собираются разными провайдерами уже давно (Opta, Wyscout, StatsBomb, Instat), но дают недостаточный уровень детализации – события на поле не так уж часты, а большие промежутки между ними упускают огромную часть контекста. Поэтому учет позиций всех игроков для каждого из событий и более широкий набор этих событий дает некое промежуточное решение, добавляющее больше информации для анализа большего количества лиг.

Собрать команду через телеграм-канал и поехать в Лондон

За 4 месяца до конференции через свой телеграм-канал я начал собирать команду для доработки и презентации идеи. К моему удивлению, откликнулось очень много людей, среди них были Самер Фатайри и Егор Гумин. По иронии судьбы они тоже связаны с Берлином, где я сейчас живу. Самер возглавлял отдел Data Science в берлинском стартапе Adjust, а сейчас работает с некоторыми европейскими клубами консультантом по data science. Егор – ведущий разработчик в немецком необанке Vivid, основанном выходцами из «Тинькофф банка», а также создатель xglab.pro – платформы продвинутой статистики для футбольных клубов. Кстати, Егор сейчас проводит тестирование своей платформы, записаться и посмотреть ее можно здесь

Мы сформулировали идею и отправили ее на рассмотрение в конце июля, а в начале августа получили от Статсбомба положительный ответ и данные для исследования – по 250 матчей Бундеслиги и Ла Лиги сезона-2020/21.

Видео с презентацией идеи можно посмотреть здесь, а текстовое описание на русском языке - следом по тексту.

В чем суть нашей метрики для вратарей

Там мы развили мою давнюю идею – объективная метрика для оценки вратарей. Можно выделить три основных компонента игры голкиперов.

Игра полевым игроком – участие в билдапе, сопротивление прессингу и тому подобное. 

Игра на высоких мячах (навесы, угловые).

Шот-стоппинг – навык отражения ударов, зависящий от позиции вратаря, его реакции, техники сэйвов.

Первый компонент уже достаточно глубоко исследован с помощью большого количества метрик. Игру на высоких мячах оценить сложнее, так как она требует очень точного измерения антропометрии игрока, так называемой третьей координаты, позволяющей оценивать игрока не как точку на прямоугольном поле, а как объемный объект. Здесь уже важно знать, например, высоту прыжка вратаря и полевых игроков, положение мяча в воздухе, технику сэйва. Компании пока не могут качественно собирать эти данные. Поэтому мы остановились на третьей компоненте – шот-стоппинге. А точнее, на позиционировании вратаря.

Чтобы оценить, насколько хорошо вратарь выбрал позицию, мы пытались ответить на четыре ключевых (по нашему мнению) вопроса.

Вопрос 1: Куда вообще мог пойти вратарь? 

Используя данные StatsBomb 360, мы смотрели время между двумя последовательными событиями (напомню, что это event-данные и они не показывают непрерывное изменение координат всех игроков) и смоделировали 8 направлений вратаря, куда он мог бы переместиться. Поскольку вратарь не знает, в какой именно момент нападающий будет бить, мы рассматривали все события в финальной трети, где есть координаты вратаря. Даже если удара не было, мы проверяли, был ли вратарь готов, если бы следующим действием последовал удар вместо, например, передачи или отбора.

Красные точки вокруг вратаря (синяя точка) – возможные направления его движения, крупная серая точка – бьющий.

Вопрос 2: Когда атакующий игрок решает бить?

Так как вратарь не знает точного момента удара, мы предположили, что удар может быть нанесен в любой момент владения мячом противоположной команды внутри финальной трети (мы не брали совсем уж дальние удары, хотя, конечно, они тоже вероятны).

Вопрос 3: Куда бьет нападающий?

Вратарь изначально не знает ответа на этот вопрос. Поэтому мы упрощенно предположили (только из-за нехватки времени и вычислительных мощностей), что удар может быть нанесен в одну из 6 зон на рисунке ниже. 

Вопрос 4: Как учесть вероятность блокировки удара?

Для этого мы построили отдельную блок-модель, учитывающую траекторию полета мяча в одну из 6 вышеупомянутых точек, а также положения защитников.

В итоге мы считали вероятность гола как: (1 – вероятность блока) * (1 – вероятность сэйва)

Вероятность сэйва мы высчитывали с помощью моей доработанной модели. В ней мы учитывали различные факторы – расстояние от вратаря до мяча, позицию бьющего, прессинг на вратаря и на бьющего и так далее. А также отдельно симулировали, как прыгает вратарь и какие зоны поля и ворот он может покрыть прыжком. 

Теперь, имея вероятности гола для каждого из возможных ударов в каждую из 6 зон, мы берем самую большую вероятность гола как самый опасный из сценариев для вратаря и моделируем возможные перемещения вратаря именно для этого сценария. 

Еще раз суммируем, если вы потерялись.

• Мы берем все события атак. Оставляем только те, которые произошли в финальной трети. Из них берем только те, где известно предыдущее положение вратаря. Для таких событий мы проверяем, что было бы, если бы игрок атаки решил пробить из точки, где он находится (в реальности он мог как пробить, так и отдать пас или пойти в обводку).

• Удар может быть нанесен в одну из 6 точек ворот.

• Для каждой из точек ворот мы считаем вероятность блокировки удара, если атакующий игрок решает бить.

• Затем считаем вероятность гола по формуле PGoal = (1 -PBlock) * (1 – PSave), учитывая реальную позицию вратаря в тот момент и берем максимальную вероятность гола в этом случае как самый худший вариант для вратаря. 

• Затем симулируем 8 возможных направлений движения вратаря и выбираем то, которое дает наименьшую вероятность гола.

• Потом сравниваем вероятность гола для реальной позиции вратаря с симулированной – если она больше, значит, вратарь принял плохое решение, если меньше – то хорошее.

• Чтобы оценить навык позиционирования вратаря, мы складываем все эти разницы вероятностей и делим на количество ударов в течение сезона.

Результаты: ни один из вратарей на протяжении сезона в среднем не принимал решения лучше, чем наша модель. Получились следующие топы по Бундеслиге и Ла Лиге (цифры означают, что вратарь в среднем принимал решения, увеличивающие вероятность гола на х%).

Бундеслига:

Мануэль Нойер («Бавария»): 0.82% 

Петр Гулачи (РБ «Лейпциг»):  0.86%

Тимо Хорн («Кельн»): 1.22%

Ла Лига:

Давид Сория («Хетафе»): 0.81% 

Ян Облак («Атлетико»): 1.2%

Херемиас Ледесма («Кадис»): 1.5%

Конечно же, мы многого не учли – например, вероятность того, что удар пойдет не в створ или что вратарь смещается назад все же медленнее, чем вперед, и много других важных факторов. Но как мы, так и менторы Статсбомба решили, что для полуторамесячного исследования, совмещенного с полноценной работой, этого будет более, чем достаточно.

Зато мы продумали, как этим исследованием могут пользоваться клубы – сделали прототип программы, позволяющей выбирать любой момент матча с одного из двух ракурсов (либо панорамный вид, где видны все игроки, либо тактический вид – вид сверху, оба этих видео даются всем клубам Бундеслиг в течение 12 часов после каждого матча) и показывающей вероятность гола. Также программа позволяет передвигать вратаря и смотреть, как изменилась бы вероятность гола, если бы он занял другую позицию.

Впечатления от поездки и несколько советов тем, кто хочет заниматься аналитикой футбольных данных

С этим исследованием мы и поехали в Лондон. Но, конечно же, не все пошло гладко. Нам нужно было быть в Англии 7 октября, а положительный ответ об отборе получили в начале августа. На сбор документов для визы и ожидания свободного времени для приема в визовом центре ушли еще пара недель, и 30 августа я первым из нас троих подался на визу в Берлине. В итоге я был единственным, кто не получил визу, причем даже не из-за отказа, а из-за того, что заявление просто где-то застряло. Из-за ковида и начала учебного года в университетах объем работы визовых центров увеличился, поэтому мне просто не повезло. Но повезло ребятам – Самер успел приехать ровно в последний возможный день, когда обязательный карантин еще не выпадал на день конференции (получил визу утром и днем уже летел в Лондон), а Егор получил визу самым первым, прилетев за 10 дней до даты конференции. Так что ребята в итоге выступали вдвоем, а я остался в Берлине. Они и расскажут об основных эмоциях от нашего доклада и посещенной конференции. 

Самер Фатайри

Эта конференция была, кажется, лучшей иллюстрацией фразы «будущее наступило, но наступило неравномерно». На одной сцене исследователи показывают свои байесовские методы для определения моделей билдапа клубов Ла Лиги, а на другой среди прочих выступают спортивные директора, большинство из которых не спешат применять продвинутые данные. Простой пример для наглядности: среди клубов Серии А какие-либо работы с данными ведутся всего в 3 клубах из 20 (и если вы думаете, что среди них есть «Интер» и «Ювентус», то ошибаетесь). 

Завершалась конференция телемостом с Дэрилом Мори, человеком, который совершил аналитическую революцию в баскетболе, а сейчас является президентом «Филадельфии». В этот момент, конечно, стало очевидно, что никакой прорыв в футбольном анализе данных пока не наступил, и до американских видов спорта еще расти и расти. Но ощущение, что ты находишься в эпицентре большой зарождающейся идеи, которая в скором поменяет мир, –  очень драйвовое.

Следите за ютубом Статсбомба, там в какой-то момент должны выложить видео выступлений. Многие из них можно уже посмотреть здесь, но надо сперва зарегистрироваться. Моим фаворитом был Ари Мояль из «Лиона», но если вы никогда не видели выступлений, например, де Боде из «Аякса» – срочно смотрите, это космос.

Егор Гумин

Если вы новичок в футбольной аналитике на основе данных, скорее всего, будете работать с этой областью как с черным ящиком. Вы нашли ящик, он закрыт на ключ. Вы видите, какого он цвета, можете предположить, из какого он материала, но что там внутри – кто знает. Можно годами трясти ящик и искать закономерности в том, как он гремит при повороте под определенным углом, но так и не понять, что в нем и как оно работает. Такие конференции дают вам ключ от ящика. Вы понимаете масштаб явления, с которым столкнулись, можете определиться, интересно ли вам в это погружаться и составить план. Начинающие аналитики тратят месяцы и годы на осознание, какие вообще существуют футбольные данные, где их можно получить, какие можно построить метрики, в каких клубах и в каком виде они используются. Здесь же вы увидите самую глубокую часть айсберга – последние достижения в сфере сбора данных, объединенные с самыми актуальными моделями, которые на них базируются. Конечно же вы не сможете все это мгновенно применить, но вы будете понимать, куда стремиться, не потратите время на задачи, которые уже были решены до вас.

Рекомендую всем, кто в СНГ занимается футбольной аналитикой, посмотреть записи докладов StatsBomb 2021 и 2019. Действует как холодный душ. 

Если работать только с той информацией, что доступна на русском языке, может сложиться впечатление, что индустрия движется маленькими шажками и в ней почти ничего не происходит, мало кто занимается исследованиями, а те исследования, которые публикуют, на практике не применить. Но на таких конференциях легко заметить, что то, о чем мечтают аналитики в СНГ (нанять одного человека заниматься разработкой математических моделей – Data Scientist, и купить подписку на event-данныеI), в не самых крупных клубах Европы считается даже не вчерашним, а позавчерашним днем.

После того, как вы изучите материалы конференций и статьи, получите подробное представление о работе с данными в футболе, можно ставить конкретные цели, найти интересную вам актуальную проблему и поработать над ней, а затем отправиться на следующую конференцию лично.

Я слышал много историй о начинающих тренерах или аналитиках, которые отправляли свое портфолио по электронной почте в десятки клубов и не получали не просто ни одного приглашения, а ни одного ответа. Здесь все работает иначе. Сложные темы исследований и офлайн-формат в Лондоне фильтруют случайных людей, поэтому большинство спикеров и участников настроены на общение. Если у вас есть, что показать, аналитики топ-клубов или сотрудники статистических компаний прокомментируют ваши прототипы, а могут даже сказать: «Ого, а мы ведь делаем то же самое, отправь мне свое резюме!». 

Если вы занимаетесь машинным обучением или аналитикой данных и хотите применить эти знания в спорте – смело пишите нам, мы подскажем, с чего начать.

А писать можно сюда:

Телеграм-канал Кирилла Серых

Телеграм-канал Егора Гумина

Фото: globallookpress.com/an Woitas

67 комментариев

Возможно, ваш комментарий носит оскорбительный характер. Будьте вежливы к собеседнику и соблюдайте правила
Нет, ничего не мешает. Талантов есть много на рынке данных, именно схему, которую сделал Блум, сделать будет сложно - у него своя и уникальная система работы с данными. Чтобы делать что-то подобное в РПЛ, надо много денег и ресурсов, либо (что более вероятно и рационально) уметь грамотно использовать готовые решения (коих на рынке масса) и добавлять к ним свои наработки аналитиков. Хотя нет - многим клубам мешает именно то, что они не осознают написанное вами в последнем предложении, или же не хотят осознавать. Но подвижки в России в этом направлении точно есть, скоро, возможно, в одном из клубов будет что-то интересное :)
"Хотя нет - многим клубам мешает именно то, что они не осознают написанное вами"
Так может... кто-то мог бы как раз помочь им это понять? Я имею ввиду, тут ведь не надо много денег, наоборот, по идее это позволит подписывать подходящих за копейки. В сущности, скажем бюджет в 1 млн евро, это для аналитиков весьма неплохо, а для футболиста средней руки это пустяки.
0
0
0
Возможно, ваш комментарий носит оскорбительный характер. Будьте вежливы к собеседнику и соблюдайте правила
Кирилл Серых
Автор
Ответ сНикерс
Почему? По-моему наоборот, для нашей нищей (с точки зрения футбольного мира) лиге очень даже не помешало бы начать не просто покупать в случайном порядке футболистов, которые возможно когда-нибудь что-то покажут, а подбирать недорогих под свою игровую модель. Что именно в наших реалиях может помешать при желании это сделать? Тем более что нанять аналитиков для клуба не так уж дорого, целому штату надо платить меньше, чем одному футболисту средней руки.
Нет, ничего не мешает. Талантов есть много на рынке данных, именно схему, которую сделал Блум, сделать будет сложно - у него своя и уникальная система работы с данными. Чтобы делать что-то подобное в РПЛ, надо много денег и ресурсов, либо (что более вероятно и рационально) уметь грамотно использовать готовые решения (коих на рынке масса) и добавлять к ним свои наработки аналитиков.

Хотя нет - многим клубам мешает именно то, что они не осознают написанное вами в последнем предложении, или же не хотят осознавать. Но подвижки в России в этом направлении точно есть, скоро, возможно, в одном из клубов будет что-то интересное :)
0
0
0
Возможно, ваш комментарий носит оскорбительный характер. Будьте вежливы к собеседнику и соблюдайте правила
Читал, и даже в канал к себе постил :) Хорошая статья и хороший пример, только подобный размах разработать с нуля будет сложно - Блум на это более 10 лет убил с огромным штабом сотрудников. Но идея и концепт рабочие однозначно, мне кажется, сейчас в каждой лиге будет как минимум один (а то и более) подобный клуб, который будет развиваться по такой схеме. Как по мне - кто это первый сделает в РПЛ / ФНЛ (правда, учитывая наши реалии, даже сейчас это пока что могут быть сильно влажные мечты), тот будет большой молодец.
Почему? По-моему наоборот, для нашей нищей (с точки зрения футбольного мира) лиге очень даже не помешало бы начать не просто покупать в случайном порядке футболистов, которые возможно когда-нибудь что-то покажут, а подбирать недорогих под свою игровую модель.

Что именно в наших реалиях может помешать при желании это сделать? Тем более что нанять аналитиков для клуба не так уж дорого, целому штату надо платить меньше, чем одному футболисту средней руки.
0
0
0
Возможно, ваш комментарий носит оскорбительный характер. Будьте вежливы к собеседнику и соблюдайте правила
Кирилл Серых
Автор
Ответ сНикерс
Кирилл, вы не читали эту статью? http s:// www.sports.ru /tribuna/blogs/urbanhymns/2982901.html (пробелы уберите, а то иначе комментарий затирается, ничего не пойму, уже два раза пытаюсь оставить и остается только первое предложение) Суть такова, что люди в Бельгии собрали за копейки (по футбольным меркам) команду и сначала разорвали вторую лигу, а сейчас успешно накручивают высшую. Клуб, который по стоимости был вторым в конца (16 млн евро) идет после 14 туров на первом месте! При этом лига по стоимости вполне сопоставима с нашей (около 850 млн против "наших" 950 млн) и даже топ-клубы по стоимсти рядом (Брюгге 166 млн, Зенит 173 млн). Это все равно что Нижний Новгород после 14 туров шел бы в РПЛ на первом месте, имея лучшую разницу забиты и пропущенных! "Блум решил использовать подобный метод и для подбора игроков. Его программа учитывает не только соотношение цена-качество и перспективы развития карьеры, но и совместимость игроков в рамках одной команды и с точки зрения технического оснащения и игрового стиля, и с точки зрения ментальности" Как думаете, имеет ли смысл разработать что-то подобное у нас и продвинуть в РПЛ?
Читал, и даже в канал к себе постил :) Хорошая статья и хороший пример, только подобный размах разработать с нуля будет сложно - Блум на это более 10 лет убил с огромным штабом сотрудников. Но идея и концепт рабочие однозначно, мне кажется, сейчас в каждой лиге будет как минимум один (а то и более) подобный клуб, который будет развиваться по такой схеме. Как по мне - кто это первый сделает в РПЛ / ФНЛ (правда, учитывая наши реалии, даже сейчас это пока что могут быть сильно влажные мечты), тот будет большой молодец.
0
0
0
Возможно, ваш комментарий носит оскорбительный характер. Будьте вежливы к собеседнику и соблюдайте правила
Цель данных и состоит в том, чтобы как можно более объективно (с помощью математики) проанализировать все сложившиеся обстоятельства (используя доступные данные) и понять, случайно это было или нет. Физика и психология, конечно, важны, и все же первостепенно. Но и их можно оцифровать, просто эти данные никакой клуб никогда не даст в открытый доступ, но статистики и различных методов сбора данных в этих направлениях очень много. Продвинутая статистика (ту, бум которой мы сейчас видим), позволяет более детально, чем просто просмотрев видео, оценить постфактум (пока в основном так, хотя уже есть масса путей собирать и анализировать данные в лайве), что вообще делал игрок на поле, следовал ли он тактическим указаниям и тд и тп. Все это можно использовать как и для скаутинга, так и анализа матча во время / до / после игры, подготовки к сопернику, анализе тренировок. Понятия, как по мне, отчасти устаревшие как минимум по одной простой причине - информации становится все больше, она дает больше дополнительных выводов о том, что происходит на поле, и глупо ей не пользоваться вообще в принципе. Важно только понимать, что, зачем и почему ты считаешь.
Кирилл, вы не читали эту статью?

http s:// www.sports.ru /tribuna/blogs/urbanhymns/2982901.html
(пробелы уберите, а то иначе комментарий затирается, ничего не пойму, уже два раза пытаюсь оставить и остается только первое предложение)

Суть такова, что люди в Бельгии собрали за копейки (по футбольным меркам) команду и сначала разорвали вторую лигу, а сейчас успешно накручивают высшую. Клуб, который по стоимости был вторым в конца (16 млн евро) идет после 14 туров на первом месте!

При этом лига по стоимости вполне сопоставима с нашей (около 850 млн против "наших" 950 млн) и даже топ-клубы по стоимсти рядом (Брюгге 166 млн, Зенит 173 млн).

Это все равно что Нижний Новгород после 14 туров шел бы в РПЛ на первом месте, имея лучшую разницу забиты и пропущенных!

"Блум решил использовать подобный метод и для подбора игроков. Его программа учитывает не только соотношение цена-качество и перспективы развития карьеры, но и совместимость игроков в рамках одной команды и с точки зрения технического оснащения и игрового стиля, и с точки зрения ментальности"

Как думаете, имеет ли смысл разработать что-то подобное у нас и продвинуть в РПЛ?
0
0
0
Возможно, ваш комментарий носит оскорбительный характер. Будьте вежливы к собеседнику и соблюдайте правила
Кирилл Серых
Автор
Ответ сНикерс
Еще вопрос. Много лет назад читал мнение какого-то человека от футбола. Никак не могу вспомнить, кого, то ли скаут то ли агент, но из чуть ли не 80ых. Естественно, иностранец. Так вот у него была, как мне показалось, любопытная позиция. Он утверждал, что многие статистики от футбола, за деревьями не видят леса. Мысль заключалась в том, в футболе слишком много сторонних факторов, которые мешают сделать по-настоящему верное заключение. Например, может показаться, что игрок, забивший гол, сделал все правильно. Но это так далеко не всегда, вполне могли просто сложиться обстоятельства. Если бы мы могли просмотреть 10 тысяч на аналогичных эпизодов, то вполне может быть, что в 90% гол не был бы забит, потому что для гола должны ошибиться и защитники и вратарь. Тогда мы могли бы сказать, что несмотря на забитый гол, игрок поступил скорее неправильно. И собственно так рассматривать можно едва ли не каждый эпизод в игре. А опираться, по мнению специалиста, следовало в первую очередь на физические и психологические данные. Важны общая выносливость (тут само собой), ускорение при беге (чтобы в нужный момент человек мог резко убежать), координация движений (чтобы при ускорении не терял мяч), обзор поля (не только хорошее зрение, но и именно обзорность видеть максимально широко), геометрическое мышление (оно хорошо развито у людей, которые быстро собирают кубик рубика. Казалось бы причем тут футбол, подумал я. Обоснование такое, что люди с хорошим геометрическим мышлением хорошо "видят поле" не только со своей точки, но и как бы с высоты, то есть представляют себе положение на поле всех игроков. Это происходит подсознательно, а потому решение принимается очень быстро и их пасы чаще становятся полезными). Также важная психология: человек должен иметь характер, быть по-спортивному злым, уверенными в себе, где-то даже самоуверенным и мотивированным, желающим доказать всем что он хорош. Самоуверенные чаще добиваются результатов и реже опускают руки после поражений. На это и следует опираться при поиске игроков: когда физические и психологические данные подходят, то если только не произойдет что-то эктраординарное, человек станет хорошим игроком. Эти данные не подводят, тогда как статистика может искажаться по сотне причин. Мнение не мое, просто описываю по памяти что помню. Найти, где я это видел и читал, не могу. А суть вопроса такова: это устаревшие представления о поиске талантов? Сегодня на первый план выходит продвинутая статистика? Или все-таки физика идет на первом месте?
Цель данных и состоит в том, чтобы как можно более объективно (с помощью математики) проанализировать все сложившиеся обстоятельства (используя доступные данные) и понять, случайно это было или нет.

Физика и психология, конечно, важны, и все же первостепенно. Но и их можно оцифровать, просто эти данные никакой клуб никогда не даст в открытый доступ, но статистики и различных методов сбора данных в этих направлениях очень много. Продвинутая статистика (ту, бум которой мы сейчас видим), позволяет более детально, чем просто просмотрев видео, оценить постфактум (пока в основном так, хотя уже есть масса путей собирать и анализировать данные в лайве), что вообще делал игрок на поле, следовал ли он тактическим указаниям и тд и тп. Все это можно использовать как и для скаутинга, так и анализа матча во время / до / после игры, подготовки к сопернику, анализе тренировок.

Понятия, как по мне, отчасти устаревшие как минимум по одной простой причине - информации становится все больше, она дает больше дополнительных выводов о том, что происходит на поле, и глупо ей не пользоваться вообще в принципе. Важно только понимать, что, зачем и почему ты считаешь.
0
0
0
Возможно, ваш комментарий носит оскорбительный характер. Будьте вежливы к собеседнику и соблюдайте правила
Похоже, иногда комменты тупят, действительно. Многое зависит от бизнес-модели клуба и от его размера - например, в том же Сити точно смотрят на стату, но решения принимаются не в первую очередь из-за статистических моделей, так как это все же топ-клуб. А вот в их академии и в дочерних клубах структуры CFG внимания к ней гораздо больше, задачи все-таки разные. Да и не в каждом клубе как: а) есть аналитический отдел б) есть степень доверия к нему со стороны тренерского штаба / руководства
Еще вопрос. Много лет назад читал мнение какого-то человека от футбола. Никак не могу вспомнить, кого, то ли скаут то ли агент, но из чуть ли не 80ых. Естественно, иностранец. Так вот у него была, как мне показалось, любопытная позиция. Он утверждал, что многие статистики от футбола, за деревьями не видят леса. Мысль заключалась в том, в футболе слишком много сторонних факторов, которые мешают сделать по-настоящему верное заключение.

Например, может показаться, что игрок, забивший гол, сделал все правильно. Но это так далеко не всегда, вполне могли просто сложиться обстоятельства. Если бы мы могли просмотреть 10 тысяч на аналогичных эпизодов, то вполне может быть, что в 90% гол не был бы забит, потому что для гола должны ошибиться и защитники и вратарь. Тогда мы могли бы сказать, что несмотря на забитый гол, игрок поступил скорее неправильно. И собственно так рассматривать можно едва ли не каждый эпизод в игре.

А опираться, по мнению специалиста, следовало в первую очередь на физические и психологические данные. Важны общая выносливость (тут само собой), ускорение при беге (чтобы в нужный момент человек мог резко убежать), координация движений (чтобы при ускорении не терял мяч), обзор поля (не только хорошее зрение, но и именно обзорность видеть максимально широко), геометрическое мышление (оно хорошо развито у людей, которые быстро собирают кубик рубика. Казалось бы причем тут футбол, подумал я. Обоснование такое, что люди с хорошим геометрическим мышлением хорошо "видят поле" не только со своей точки, но и как бы с высоты, то есть представляют себе положение на поле всех игроков. Это происходит подсознательно, а потому решение принимается очень быстро и их пасы чаще становятся полезными).

Также важная психология: человек должен иметь характер, быть по-спортивному злым, уверенными в себе, где-то даже самоуверенным и мотивированным, желающим доказать всем что он хорош. Самоуверенные чаще добиваются результатов и реже опускают руки после поражений.

На это и следует опираться при поиске игроков: когда физические и психологические данные подходят, то если только не произойдет что-то эктраординарное, человек станет хорошим игроком. Эти данные не подводят, тогда как статистика может искажаться по сотне причин.

Мнение не мое, просто описываю по памяти что помню. Найти, где я это видел и читал, не могу.

А суть вопроса такова: это устаревшие представления о поиске талантов? Сегодня на первый план выходит продвинутая статистика? Или все-таки физика идет на первом месте?
0
0
0
Возможно, ваш комментарий носит оскорбительный характер. Будьте вежливы к собеседнику и соблюдайте правила
Кирилл Серых
Автор
Ответ Andrew Chajka
Интересная статья, без вопросов. Но есть одно но... Может это и покажется мнением профана (а так и есть), но идея авторов мне видится попыткой изобрести заново велосипед. Потому как тот же fbref (в т.ч. и с участием statsbomb) считает xG пропущенных голов вратарём, его игру на перехвате, при билд-апе и вне штрафной площади. И чем это хуже? Или почему нельзя подвести итог по этим показателям и сделать вывод? Можно. Пускай и на любительском уровне, но это даже я делал, когда оценивал вратарей Ла Лиги по итогам прошлого сезона. Отдельно хочу сказать, что любой нормальный алгоритм хорошо себя показывает в оценке топовых игроков со стабильно высоким уровнем выступлений. Но в этом и его недостаток, т.к. на таких ярких примерах крутость игры вратаря очевидна даже просто при оценке невооружённым глазом у обычных болельщиков. Что по-настоящему ценно - это качественная оценка скиллов молодых и/или малоизвестных игроков в целях скаутинга и трансферов.
Самер уже ответил чуть ниже на этот вопрос, почему недостаточно брать G - xG, да и в принципе и о преимуществе нашего подхода. Конечно можно сделать вывод по нескольким показателям, посчитанным только по ивентам и покрывающим минимум контекста, но в этом и проблема - многое теряется.
Я бы не сказал, что качество алгоритма зависит от того, оцениваются топы или нет, гораздо важнее покрыть большее количество данных (а именно в плане молодых / малоизвестных игроков это проблема - есть только ивенты по неизвестным лигам / молодёжкам, трекинга или альтернативы в виде 360 там нет, или по крайней мере, очень редко в доступе и позволительном ценнике).
0
0
0
Возможно, ваш комментарий носит оскорбительный характер. Будьте вежливы к собеседнику и соблюдайте правила
Ответ Вrin
Для полуторамесячного исследования - очень хорошо, но учесть вероятность того, что мяч пойдёт не в створ - не выглядит сложным, для этого же есть модели?
Чем больше слоев - тем сложнее работать. Мы ведь не только писали статью, но и разрабатывали бэкенд и фронтенд для визуализации позиционирования. С учетом этого дополнительный слой выходит еще дороже. Но задача подъемная, это так
0
0
0
Возможно, ваш комментарий носит оскорбительный характер. Будьте вежливы к собеседнику и соблюдайте правила
Для полуторамесячного исследования - очень хорошо, но учесть вероятность того, что мяч пойдёт не в створ - не выглядит сложным, для этого же есть модели?
0
0
0
Возможно, ваш комментарий носит оскорбительный характер. Будьте вежливы к собеседнику и соблюдайте правила
Интересная статья, без вопросов. Но есть одно но... Может это и покажется мнением профана (а так и есть), но идея авторов мне видится попыткой изобрести заново велосипед. Потому как тот же fbref (в т.ч. и с участием statsbomb) считает xG пропущенных голов вратарём, его игру на перехвате, при билд-апе и вне штрафной площади. И чем это хуже? Или почему нельзя подвести итог по этим показателям и сделать вывод? Можно. Пускай и на любительском уровне, но это даже я делал, когда оценивал вратарей Ла Лиги по итогам прошлого сезона.
Отдельно хочу сказать, что любой нормальный алгоритм хорошо себя показывает в оценке топовых игроков со стабильно высоким уровнем выступлений. Но в этом и его недостаток, т.к. на таких ярких примерах крутость игры вратаря очевидна даже просто при оценке невооружённым глазом у обычных болельщиков. Что по-настоящему ценно - это качественная оценка скиллов молодых и/или малоизвестных игроков в целях скаутинга и трансферов.
0
0
0
Возможно, ваш комментарий носит оскорбительный характер. Будьте вежливы к собеседнику и соблюдайте правила
Ответ сНикерс
"Если работать только с той информацией, что доступна на русском языке, может сложиться впечатление, что индустрия движется маленькими шажками и в ней почти ничего не происходит, но... ...легко заметить, что то, о чем мечтают аналитики в СНГ... ...в не самых крупных клубах Европы считается даже не вчерашним, а позавчерашним днем". Это хорошо, но вопрос, то что считается там сегодняшним и завтрашним днем, это помогает? Было такое что благодаря этим супер-инновационным данным нашли человека, в которого никто не верил, и он оказался неограненным алмазом? Потому что судя по трансферам, "в не самых крупных клубах Европы" ничего не меняется, цены раздуваются и все хотят заполучить талант, но никто не делает ставку на "неограненный ноунейм-алмаз", который очень статистически хорош, если смотреть на продвинутую суперстатистику, потому что иначе и не поймешь, что он так уж хорош.
В Европе тоже все неравномерно, но в высших точках поинтереснее, чем у нас. Интересный пример - Италия. Там дс в футболе только начал развиваться. Уже сейчас можно обратить внимание на "Милан", куда фонд Эллиотт привели отдел из 3 человек 2-3 года назад. С тех пор пришли и подросли в цене на рынке: Тео, Беннасер, Салемакерс, Хауге (который уже продан с плюсом), Томори, Кьер, you name it
0
0
0
Возможно, ваш комментарий носит оскорбительный характер. Будьте вежливы к собеседнику и соблюдайте правила
Кирилл Серых
Автор
Ответ сНикерс
"Если работать только с той информацией, что доступна на русском языке, может сложиться впечатление, что индустрия движется маленькими шажками и в ней почти ничего не происходит, но... ...легко заметить, что то, о чем мечтают аналитики в СНГ... ...в не самых крупных клубах Европы считается даже не вчерашним, а позавчерашним днем". Это хорошо, но вопрос, то что считается там сегодняшним и завтрашним днем, это помогает? Было такое что благодаря этим супер-инновационным данным нашли человека, в которого никто не верил, и он оказался неограненным алмазом? Потому что судя по трансферам, "в не самых крупных клубах Европы" ничего не меняется, цены раздуваются и все хотят заполучить талант, но никто не делает ставку на "неограненный ноунейм-алмаз", который очень статистически хорош, если смотреть на продвинутую суперстатистику, потому что иначе и не поймешь, что он так уж хорош.
Похоже, иногда комменты тупят, действительно. Многое зависит от бизнес-модели клуба и от его размера - например, в том же Сити точно смотрят на стату, но решения принимаются не в первую очередь из-за статистических моделей, так как это все же топ-клуб. А вот в их академии и в дочерних клубах структуры CFG внимания к ней гораздо больше, задачи все-таки разные. Да и не в каждом клубе как:
а) есть аналитический отдел
б) есть степень доверия к нему со стороны тренерского штаба / руководства
0
0
0
Возможно, ваш комментарий носит оскорбительный характер. Будьте вежливы к собеседнику и соблюдайте правила
Самый базовый пример - Фирмино. Грэм считает этот трансфер в принципе идеальным для Ливерпуля. А вообще, например, у Брентфорда вся трансферная политика на анализе данных построена. Они наконец-то вышли в АПЛ, да и по финансовым показателям у них все хорошо, что ещё более важно.
Что-то у меня не то с комментариями. Что ж, посмотрим, посмотрим.
0
0
0
Возможно, ваш комментарий носит оскорбительный характер. Будьте вежливы к собеседнику и соблюдайте правила
"Если работать только с той информацией, что доступна на русском языке, может сложиться впечатление, что индустрия движется маленькими шажками и в ней почти ничего не происходит, но...
...легко заметить, что то, о чем мечтают аналитики в СНГ...
...в не самых крупных клубах Европы считается даже не вчерашним, а позавчерашним днем".

Это хорошо, но вопрос, то что считается там сегодняшним и завтрашним днем, это помогает? Было такое что благодаря этим супер-инновационным данным нашли человека, в которого никто не верил, и он оказался неограненным алмазом?

Потому что судя по трансферам, "в не самых крупных клубах Европы" ничего не меняется, цены раздуваются и все хотят заполучить талант, но никто не делает ставку на "неограненный ноунейм-алмаз", который очень статистически хорош, если смотреть на продвинутую суперстатистику, потому что иначе и не поймешь, что он так уж хорош.
0
0
0
Возможно, ваш комментарий носит оскорбительный характер. Будьте вежливы к собеседнику и соблюдайте правила
Кирилл Серых
Автор
Ответ сНикерс
Комментарий удален
Самый базовый пример - Фирмино. Грэм считает этот трансфер в принципе идеальным для Ливерпуля. А вообще, например, у Брентфорда вся трансферная политика на анализе данных построена. Они наконец-то вышли в АПЛ, да и по финансовым показателям у них все хорошо, что ещё более важно.
0
0
0
Возможно, ваш комментарий носит оскорбительный характер. Будьте вежливы к собеседнику и соблюдайте правила
Комментарий удален
Возможно, ваш комментарий носит оскорбительный характер. Будьте вежливы к собеседнику и соблюдайте правила
Да, именно навык отбивания - это отдельная компонента. Так же, как и школа - мы когда с тренерами вратарей Айнтрахта говорили об этом концепте в том году, они сразу же сказали, что хотели бы иметь возможность менять сценарий поведения вратаря в интерактивном софте руками, так как даже у них есть разные представления о том, когда надо выходить / когда надо оставаться на линии. Потому мы и сделали прототип этого тула, чтобы показать, как этим можно пользоваться на практике. Вообще, очень круто было бы иметь сканнинговые данные - то, что видит вратарь во время игры. Есть некоторые исследования (у того же Аякса), когда на вратарей надевают очки VAR и улавливают то, куда они смотрят, но в реальной игре, конечно, такое невозможно.
Школа немного не про то. Это то, чего учили в возрастах U-xx. И то, что у взрослого вратаря стало условным рефлексом. Самый простой пример - стиль игры на выходах. Вратарь из бывшего СССР скорее всего постарается выбить мяч кулаком, что создаст угрозу подбора опорниками соперника и повторной атаки с ударом. А зарубежный вратарь постарается мяч зафиксировать, где есть риск его потерять. Наверняка в игре на ленточке есть такие же ньюансы, которые будут влиять на соотношение реального вратаря с моделью.
0
-1
-1
Возможно, ваш комментарий носит оскорбительный характер. Будьте вежливы к собеседнику и соблюдайте правила
Ответ МТБ
На очень большую погрешность, на самом деле, ведь есть куча возможных факторов - направление солнца и тени, погода (жара, дождь, снег, ветер), случайные рикошеты, как от частей тела, так и от разных кочек, удар не достаточной силы, который станет пасом, удар очень высокой силы, удар, который идёт не совсем в створ (с отскоком от штангиперекладиныземли). НО это начальная, упрощённая модель, а не готовый идеал
Технический брак. Свалившийся с ноги кросс, который стал голевым ударом. Как самый очевидный пример. Мяч за спиной вратаря, выскочившего играть на выходе, он ничего не успевает сделать.
0
0
0
Возможно, ваш комментарий носит оскорбительный характер. Будьте вежливы к собеседнику и соблюдайте правила
Кирилл Серых
Автор
Ответ МТБ
Ну, на самом деле, тут можно поступить хитро, пока что - 1. Берём го-про, цепляем киперу, собираем данные с тренировок, ну может не со всех, но с какого-то внятного числа. 2. Берём эти же очки, которые VR и даём киперу ряд симуляций, хоть ingame, хоть каких (ну, после некоторого обучения и привыкания. Данные сводим. Понятно, что это тоже фигня с кучей погрешностей, но суть вот в чём - по идее на большой выборке всё равно должны проступить закономерности поведения определённого вратаря. Как он выбирает позицию, как он смотрит, как он видит. Именно большая выборка должна дать ряд закономерностей для тех или иных обстоятельств. В игре, конечно, такого не сделаешь, но, как по мне данные уже достаточно неплохие для прогноза поведения, т.е. если идёт вот такая ситуация, кипер с вероятностью такой-то поступит вот так, с такой вот так.
Да, конечно можно, несмотря на технические сложности - например, чтобы собрать данные, учитывая антропометрию вратаря, нужны специальные камеры или датчики. Сильно сложнее это реализовать на практике - убедить хотя бы одного из вратарей основной команды, что это важно (и сделать так, чтобы он уделил довольно много своего времени на исследование), а также найти на это дело бюджет. В этом плане Аякс - уникальный клуб с очень развитым отделом аналитики / sports science: отделу уже около 10 лет, там давно выстроена система общения с тренерским штабом / аналитиками команд, и у них в принципе бизнес-модель строится на том, чтобы прокачивать таланты и потом продавать их дороже, поэтому исследования такой детализации в их системе сейчас имеют смысл и приветствуются. Но со временем подобных вещей будет больше и больше - данные станут дешевле, а клубы поймут, что чтобы зарабатывать, нужно идти в ногу со временем, в том числе, и с данными.
0
0
0
Возможно, ваш комментарий носит оскорбительный характер. Будьте вежливы к собеседнику и соблюдайте правила
Да, именно навык отбивания - это отдельная компонента. Так же, как и школа - мы когда с тренерами вратарей Айнтрахта говорили об этом концепте в том году, они сразу же сказали, что хотели бы иметь возможность менять сценарий поведения вратаря в интерактивном софте руками, так как даже у них есть разные представления о том, когда надо выходить / когда надо оставаться на линии. Потому мы и сделали прототип этого тула, чтобы показать, как этим можно пользоваться на практике. Вообще, очень круто было бы иметь сканнинговые данные - то, что видит вратарь во время игры. Есть некоторые исследования (у того же Аякса), когда на вратарей надевают очки VAR и улавливают то, куда они смотрят, но в реальной игре, конечно, такое невозможно.
Ну, на самом деле, тут можно поступить хитро, пока что - 1. Берём го-про, цепляем киперу, собираем данные с тренировок, ну может не со всех, но с какого-то внятного числа. 2. Берём эти же очки, которые VR и даём киперу ряд симуляций, хоть ingame, хоть каких (ну, после некоторого обучения и привыкания.

Данные сводим. Понятно, что это тоже фигня с кучей погрешностей, но суть вот в чём - по идее на большой выборке всё равно должны проступить закономерности поведения определённого вратаря. Как он выбирает позицию, как он смотрит, как он видит. Именно большая выборка должна дать ряд закономерностей для тех или иных обстоятельств. В игре, конечно, такого не сделаешь, но, как по мне данные уже достаточно неплохие для прогноза поведения, т.е. если идёт вот такая ситуация, кипер с вероятностью такой-то поступит вот так, с такой вот так.
0
0
0
Возможно, ваш комментарий носит оскорбительный характер. Будьте вежливы к собеседнику и соблюдайте правила
Кирилл Серых
Автор
Ответ Serghi991 S
Я работаю в data science много лет, могу много раскрититиковать в вашей работе и ответах на комментарии. Но наверно просто пожелаю вам развития и роста
Спасибо за пожелание! Если есть желание и время подискутировать - только за: цель этого всего и привить интерес других людей в русскоязычной сфере к сфере футбольного DS, и собрать мнения / критику.
0
-1
-1
Возможно, ваш комментарий носит оскорбительный характер. Будьте вежливы к собеседнику и соблюдайте правила
Кирилл Серых
Автор
Ответ eph
Как считается вероятность блокировки и сейва?
Бустинговые модели с разными наборами переменных.
0
0
0
Возможно, ваш комментарий носит оскорбительный характер. Будьте вежливы к собеседнику и соблюдайте правила
Как считается вероятность блокировки и сейва?
0
0
0
Возможно, ваш комментарий носит оскорбительный характер. Будьте вежливы к собеседнику и соблюдайте правила
Ответ Samer Fatayri
Вы правы, никто не строит xg модель для каждого конкретного вратаря и она строится одна на всех. Скоринговые модели банков на порядок сложнее (состоят из сотен параметров) и точнее моделей xg. Это ведет к тому, что когда оцениваешь вратаря по разнице пропущенных и ожидаемых голов (так, кстати, мало кто делает обычно берут постшот модели - в них учитывается еще и куда мяч прилетел) нужно много наблюдений, чтобы с уверенностью сказать, что вратарь А лучше вратаря Б.
Я работаю в data science много лет, могу много раскрититиковать в вашей работе и ответах на комментарии. Но наверно просто пожелаю вам развития и роста
+2
-1
+1
Возможно, ваш комментарий носит оскорбительный характер. Будьте вежливы к собеседнику и соблюдайте правила
Пожаловаться
  • Спам
  • Оскорбления
  • Расизм
  • Мат
  • Угрозы
Комментарий отправлен, но без доната
При попытке оплаты произошла ошибка
  • Повторить попытку оплаты
  • Оставить комментарий без доната
  • Изменить комментарий
  • Удалить комментарий