Hello
Блог

«Это как Манибол». Система анализа данных, которая помогает Спаллетти в «Роме»

Вадим Лукомский – об инновационной системе, которую Крис Паллотта успешно внедрил в итальянском клубе.

Как стартаперы из Сан-Франциско впечатлили владельцев «Ромы»

alt

6 лет назад Том Ковингтон и Джесси Пакуитт (на фото) встретились, играя в футбол на одном из полей калифорнийского университета. Бывший инженер Honda и аналитик Ford Том в то время работал в компании, разрабатывавшей ультра-эффективные автомобильные двигатели; Джесси был биоинформатиком в университете.

После игры Пакуитт не упустил шанса похвастаться перед новым товарищем программой, которую написал для одного ракового центра. Она позволяла анализировать взаимосвязь между генами и выявлять в них закономерности. По словам Джесси, он устал от постоянных визитов исследователей, которые задавали очень похожие вопросы, а, получая ответы, приходили с новой порцией настолько же предсказуемых вопросов: «Это выхолащивало меня – я просто не мог помочь каждому».

Том неожиданно заинтересовался проектом, но почему-то сразу же начал перебирать в голове варианты применения программы в принципиально иных жизненных ситуациях. Через несколько часов ребята сошлись во мнении, что при грамотном развитии программа сможет превратить любую домохозяйку в исследователя данных. Собственную работу с данными они решили начать со спорта – из-за общего интереса к нему и огромного количества качественной систематизированной информации.

Два года назад Джесси закончил работу над адаптированными к футболу, американскому футболу и бейсболу версиями системы анализа, а начинающие бизнесмены попытались оценить потенциал замысла. Они задались простыми вопросами: способна ли программа дать клубам новую информацию и будет ли эта информация им полезна? Выяснилось, что у клубов MLS (футбол) и NFL (американский футбол) вообще не было доступа к информации, которую генерировала программа. Бейсбольные клубы имели доступ к данным, но анализировали их вручную. Процесс свел Ковингтона и Пакуитт с Крисом Паллоттой, главой инвестиционной компании его семейства, Raptor Capital Management. Сын владельца «Ромы» впечатлился и стал одним из первых инвесторов стартапа, вложив 250 тысяч долларов.

alt

В январе этого года программа была официально презентована под названием Tag.bio. А уже в марте на самой крупной спортивной конференции США в бизнес-школе Sloan отец Криса Паллотты, Джеймс, получил шанс очень выгодно выглядеть на фоне другого VIP-гостя – оперировавшего общими фразами владельца «Арсенала» Стэна Кронке. Паллотта-старший не только показал, что глубоко погружен в спортивную аналитику и знаком с Tag.bio, но даже намекнул, что она сыграла роль в отставке Руди Гарсии: «Проблема Гарсии была в том, что он всегда использовал одну и ту же тактику. Он совсем не уделял внимания анализу данных».

Что такое Tag.bio?

«Это как Манибол», – уверяет Крис Паллотта.

Главная задача Tag.bio – та же, что у изначальной программы Пакуитта, выявление статистических закономерностей и их анализ. Для анализа системе необходим вопрос, сформулированный в рамках одного из ее протоколов. В качестве ответа программа выдает данные и оценку их полезности. Количество протоколов (следовательно, потенциальных вопросов) постоянно увеличивается разработчиками программы.

Команды получают эффективный и простой метод выявления неочевидных статистических тенденций в собственной игре и при изучении соперников. «Но неверный анализ данных может привести к куче ошибочных выводов. Очень важно, чтобы люди знали, что нужно искать», – поясняет Паллотта-младший. По его словам, программа уже сэкономила клубу немало времени и средств: «Это один из первых по-настоящему качественных подходов к автоматизации анализа данных. Полностью его не автоматизировать, но мы уже автоматизировали значительную часть».

Как примерно может выглядеть вариант применения программы в футболе? Хороший пример два года назад на все той же конференции в бизнес-школе Sloan представил Пакуитт. На глазах у коллег он за менее, чем 20 минут, разработал новый статистический показатель – углубленное участие в голах. Он попросил Tag.bio проанализировать степень участия игроков в 5 действиях, предшествующих голу.

Показатель сразу же помог выявить ряд недооцененных игроков – высокое участие в голах, но неожиданно низкие показатели голевых передач и забитых мячей. Но Джесси пошел дальше и показал, как эта простая новая метрика может помочь в первичной подготовке к матчу с «Лос-Анджелес Гэлакси». Например, выяснилось, что степень участия Робби Кина в голах самого опасного на тот момент футболиста лиги Лэндона Донована почти в 5 раз больше, чем у любого другого футболиста. Сдержав одного, обезвреживаешь их связку? Учитывая известность игроков, едва ли самый крутой инсайт, но даже такая процедура может быть полезна при подготовке к менее звездным оппонентам.

alt

Сам показатель, как считает Пакуитт, можно при необходимости сделать еще более полезным: наверняка в футболе как спорте низкой результативности резонно также учитывать участие в явных голевых моментах и попаданиях в каркас; не лишним будет выяснить и насколько оптимально число 5 как количество предшествующий действий и т.д. Это лишь экспресс-пример одного из множества вариантов применения программы, но даже он может быть использован в первичной подготовке к играм и селекции.

Чего ждать от Tag.bio?

Компания сотрудничает далеко не только с «Ромой», но и с командами MLB и NFL, чьи названия не разглашаются. Ковингтон пояснил, что повышенная конфиденциальность – пожелание самих клубов, но заметил: «Они были просто шокированы некоторыми данными о собственной команде и ближайших оппонентах». Пакуитт считает, что система уже доказала пригодность для использования в спорте.

Если все пойдет по плану, то через несколько лет Tag.bio станет любимым приложением всех фанатов Fantasy-лиг, будет генерировать удобные инфографики для болельщиков и СМИ, а автоматизированный анализ станет еще более глубоким. Ближайший приоритет компании – выпуск удобных приложения для iOS и Android. Затем планируется внедрение протоколов для еще большего количества видов спорта и разработка программы, которая смогла бы выдавать основанные на анализе предсказания в онлайн-режиме. А конечной целью остается выход за рамки спорта, в частности разработка новых вариантов применения программы в научных исследованиях – для этих целей уже ищут готовых вложить 1,5 миллиона долларов инвесторов.

Фото: twitter.com/tagbio; Gettyimages.ru/Gonzalo Arroyo Moreno, Stephen Dunn

67 комментариев

Возможно, ваш комментарий нарушает правила, нажмите на «Отправить» повторно, если это не так, или исправьте текст
Чудесный набор общих фраз. Что Спалетти лучше Гария, видно было год назад.
0
0
0
Возможно, ваш комментарий нарушает правила, нажмите на «Отправить» повторно, если это не так, или исправьте текст
Не совсем согласен с оценкой состава и результатов, но тебе наверное виднее. В любом случае это не так уж важно в этом случае, ведь спорить с тем, что с приходом Спалетти результаты стали лучше не получится, а, по словам Паллотты, Гарсия эту часть работы сильно недооценивал, вкладом в текущие успехи они тоже довольны.
Я к тому, что до и во время сезона ставят задачи высокие, которые и близко не выполняются по ходу. Понятно, что говорить можно все, что угодно. А уж тем более владельцы и тренеры могут необъективно оценить состав свой. По мне так по составу "Рома" на третьем месте. После "Наполи" сразу. Конечно не буду спорить по улучшению результатов :)
0
0
0
Возможно, ваш комментарий нарушает правила, нажмите на «Отправить» повторно, если это не так, или исправьте текст
Не совсем так. Эта система не только предшествующие действия считает. Это один из типов вопросов, на которые она автоматически отвечает. Вопросом может быть и например степень продвижения через центр после передач кого-то из футболистов соперника. То есть что-то принципиально иное.
Честно говоря, не очень уловил твою мысль. Условно говоря, если у меня есть массив данных по развитию наиболее опасных атак какой-то команды, то я из него могу выдернуть в том числе и степень влияния/участия того или иного игрока в атаках через ту или иную зону. И в чем принципиальная разница в таком случае?

Опять же, в тексте описаны конкретные примеры - со связкой Кина и Донована - так вот и это моя программа считает автоматически, причем в более расширенном формате.
+1
0
+1
Возможно, ваш комментарий нарушает правила, нажмите на «Отправить» повторно, если это не так, или исправьте текст
Это все круто, но уже который год с далеко не слабым составом "Рома", мягко говоря, обделывается.
Не совсем согласен с оценкой состава и результатов, но тебе наверное виднее. В любом случае это не так уж важно в этом случае, ведь спорить с тем, что с приходом Спалетти результаты стали лучше не получится, а, по словам Паллотты, Гарсия эту часть работы сильно недооценивал, вкладом в текущие успехи они тоже довольны.
+1
0
+1
Возможно, ваш комментарий нарушает правила, нажмите на «Отправить» повторно, если это не так, или исправьте текст
Ответ ichiro51
Когда это она стала "эффективной"?
Когда за нее начали платить немалые деньги, принять в топ-клубе, чьи результаты резко улучшились, например.
0
0
0
Возможно, ваш комментарий нарушает правила, нажмите на «Отправить» повторно, если это не так, или исправьте текст
Ответ neohotnik
В принципе система очень похожа на ту, которую я уже полтора года использую в ИП. С той лишь разницей, что здесь оцениваются только результативные атаки (а значит есть возможность охватить достаточно большое количество команд), а я оцениваю потенциально голевые (соответственно, более глубокий анализ действий одной или нескольких команд). Что касается "предшествующих действий", действительно, доля атак с активным участием 6-7 человек (тут речь, естественно, о передачах, направленных на развитие атаки) очень невелика - для российских команд буквально несколько процентов. Возможно, у условной Барсы будет побольше. Но при этом и условная цифра 5, которой нужно ограничиться, бессмысленна, потому как из этих пяти в ряде случаев две-три будут "мусорными", направленные на контроль, но никак не на развитие. Поэтому не надо отталкиваться от какой-то абстрактной цифры - надо смотреть на логику атаки, выделяя активную фазу. Иначе в таких измерениях погрешность будет неимоверная.
Не совсем так. Эта система не только предшествующие действия считает. Это один из типов вопросов, на которые она автоматически отвечает. Вопросом может быть и например степень продвижения через центр после передач кого-то из футболистов соперника. То есть что-то принципиально иное.
+1
0
+1
Возможно, ваш комментарий нарушает правила, нажмите на «Отправить» повторно, если это не так, или исправьте текст
Пользователь заблокирован
Ответ CamaradaTxe
Слушайте, перестаньте ныть. Во-первых, чуть более примитивными инструментами пользуются уже даже в России (все в высшей лиге). Во-вторых, подобные инструменты уже давно и успешно используются в других видах. И в-третьих, завязывайте вы уже с песней про уникальность и непросчитываемость футбола! Нет в нем ничего принципиально отличного, добрые 90% ситуаций, возникающих в ходе матча на любом участке - стандартные. В конце концов, в футбол играют люди, а люди все одинаковые (да-да, дружок, ты - не уникален), у них есть конкретные физиологические и психологические ограничения. Или вы всерьез думаете, что бозон Хиггса считается, а футбол - не считается? Не смешите, читайте лучше книжки.
Сам-то понял, какую дребедень написал?
0
-1
-1
Возможно, ваш комментарий нарушает правила, нажмите на «Отправить» повторно, если это не так, или исправьте текст
Ответ uncle_franky
Ну так и я знаю, так сказать, принимаю участие в процессе. То, что описано в статье, можно назвать инновационным методом, не доказавшим широко свою эффективность. Который, конечно, гораздо более sophisticated, чем отчеты ттд и пробега футболистов. Но при этом, по сравнению с видеоплатформой, которой пользуются в рфпл, большинство нхл и нба статистики - просто детский сад...
Уважаемый, я не утверждаю, что метод - панацея. Я спорю с тезисом о неприменимости advanced аналитик в футболе в силу его сказочной особенности.

К самому продукту у меня есть главный вопрос: как они выдирают данные? Вы знаете, как технически работают аналитические системы в ПЛ (судя по всему) и прекрасно понимаете, что если у людей есть решение по запросу прорабатывать в автоматическом режиме за 20 минут на массиве 5 матчей стату, то это не просто круто, а очень-очень круто.
0
0
0
Возможно, ваш комментарий нарушает правила, нажмите на «Отправить» повторно, если это не так, или исправьте текст
Ответ CamaradaTxe
Потому что я знаю, чем пользуются клубы ПЛ России и по сравнению с описанным в статье они примитивны. Это не значит, что они плохи, неэффективны и т.д. Они нацелены на решение других задач. Тем не менее, функционал там проще.
Ну так и я знаю, так сказать, принимаю участие в процессе. То, что описано в статье, можно назвать инновационным методом, не доказавшим широко свою эффективность. Который, конечно, гораздо более sophisticated, чем отчеты ттд и пробега футболистов. Но при этом, по сравнению с видеоплатформой, которой пользуются в рфпл, большинство нхл и нба статистики - просто детский сад...
+1
0
+1
Возможно, ваш комментарий нарушает правила, нажмите на «Отправить» повторно, если это не так, или исправьте текст
Пользователь заблокирован
Ответ Berloga
если бейсбол или тот же американский футбол, еще можно как-то обсчитать, т.к. там у каждого игрока в поле есть конкретное задание, а многие комбинации месяцами оттачиваются в тренировках. В футболе такой фокус не пройдет, слишком много критериев, которые заранее не предусмотреть.
нейросети в помощь.
+1
0
+1
Возможно, ваш комментарий нарушает правила, нажмите на «Отправить» повторно, если это не так, или исправьте текст
И что в ней такого уникального, если Рома сейчас в таблице примерно там же, где и год (пять десять лет) назад? В чем инновация то? Она помогла до финала ЛЧ дойти или скудетто взять? В реальности "стартаперы" красивыми и модными словами развели римских дурачков на сотни нефти вот и вся история.Как говорится без лоха и жизнь плоха, пока будут жить дураки думающие, что существует волшебная фича, которая поможет десятикратную разницу в бюджетах отыграть, то таким "стартаперам" на икру всегда хватит денег.
Похоже такая "фича" всё-таки существует, раз "Лестер" и "Ростов" идут в лидирующей группе в своих лигах :) У тренерского штаба Раньери и Бердыева наверняка есть свой подход к сбору и анализу данных о соперниках, следовательно нет ничего невозможного, чтобы этот метод автоматизировать.
0
0
0
Возможно, ваш комментарий нарушает правила, нажмите на «Отправить» повторно, если это не так, или исправьте текст
Пользователь заблокирован
Ответ Berloga
если бейсбол или тот же американский футбол, еще можно как-то обсчитать, т.к. там у каждого игрока в поле есть конкретное задание, а многие комбинации месяцами оттачиваются в тренировках. В футболе такой фокус не пройдет, слишком много критериев, которые заранее не предусмотреть.
Это программа анализирует сыгранные матчи и выводит закономерности
0
0
0
Возможно, ваш комментарий нарушает правила, нажмите на «Отправить» повторно, если это не так, или исправьте текст
Пользователь заблокирован
Не знаю какой там манибол в Роме. Видел их только в ЛЧ с Реалом. Оскорбило, что у Ромы в защите трое игроков были аренды. Даже в шипе не часто встретишь такое нищебродство. Удачная аренда там составляющая игры, но при любом раскладе большинство в защите должно быть штатным. Это аксиома. У Фиорентины было получше, у нее аренды были лишь крайние защитники.
0
-1
-1
Возможно, ваш комментарий нарушает правила, нажмите на «Отправить» повторно, если это не так, или исправьте текст
Пользователь заблокирован
такую прогу любой школьник на турбо паскале сделает
0
-1
-1
Возможно, ваш комментарий нарушает правила, нажмите на «Отправить» повторно, если это не так, или исправьте текст
В принципе система очень похожа на ту, которую я уже полтора года использую в ИП.

С той лишь разницей, что здесь оцениваются только результативные атаки (а значит есть возможность охватить достаточно большое количество команд), а я оцениваю потенциально голевые (соответственно, более глубокий анализ действий одной или нескольких команд).

Что касается "предшествующих действий", действительно, доля атак с активным участием 6-7 человек (тут речь, естественно, о передачах, направленных на развитие атаки) очень невелика - для российских команд буквально несколько процентов. Возможно, у условной Барсы будет побольше.

Но при этом и условная цифра 5, которой нужно ограничиться, бессмысленна, потому как из этих пяти в ряде случаев две-три будут "мусорными", направленные на контроль, но никак не на развитие. Поэтому не надо отталкиваться от какой-то абстрактной цифры - надо смотреть на логику атаки, выделяя активную фазу. Иначе в таких измерениях погрешность будет неимоверная.
+1
0
+1
Возможно, ваш комментарий нарушает правила, нажмите на «Отправить» повторно, если это не так, или исправьте текст
Ответ Berloga
если бейсбол или тот же американский футбол, еще можно как-то обсчитать, т.к. там у каждого игрока в поле есть конкретное задание, а многие комбинации месяцами оттачиваются в тренировках. В футболе такой фокус не пройдет, слишком много критериев, которые заранее не предусмотреть.
хахаха, футбол - одна из самых примитивных в комбинационном смысле командных игр.

что там в нём нельзя просчитать - непонятно.

очень напоминает сказочки любителей шахмат об их неимоверной сложности
+2
-4
-2
Возможно, ваш комментарий нарушает правила, нажмите на «Отправить» повторно, если это не так, или исправьте текст
Ненужной, непонятной и эффективной, во-первых. Во-вторых, этот текст описательный – в нем нет моего отношения к системе.
Когда это она стала "эффективной"?
0
0
0
Возможно, ваш комментарий нарушает правила, нажмите на «Отправить» повторно, если это не так, или исправьте текст
На самом деле у меня по всей этой штуке один вопрос: как они берут данные?

Если есть много-много данных, пригодных к обработке, то дальше логика понятна: задаем правильный вопрос (как и указано) - получаем вероятностный ответ - делаем выводы.
0
0
0
Возможно, ваш комментарий нарушает правила, нажмите на «Отправить» повторно, если это не так, или исправьте текст
Кому интересна тема статистических программ в спорте и ставок с их помощью, найдите в интернете статьи про Харалабоса Вульгариса (на сайте джипситим они точно есть).
0
0
0
Возможно, ваш комментарий нарушает правила, нажмите на «Отправить» повторно, если это не так, или исправьте текст
И что в ней такого уникального, если Рома сейчас в таблице примерно там же, где и год (пять десять лет) назад? В чем инновация то? Она помогла до финала ЛЧ дойти или скудетто взять?

В реальности "стартаперы" красивыми и модными словами развели римских дурачков на сотни нефти вот и вся история.Как говорится без лоха и жизнь плоха, пока будут жить дураки думающие, что существует волшебная фича, которая поможет десятикратную разницу в бюджетах отыграть, то таким "стартаперам" на икру всегда хватит денег.
+4
0
+4
Возможно, ваш комментарий нарушает правила, нажмите на «Отправить» повторно, если это не так, или исправьте текст
Ну и чё, по-мойму тот Манейбол так ничего и не выиграл. А соккер это вам не бейсболка. Здесь, мне кажется, показателен пример пепкиной Баварии в игре с Юве, когда команда с кучей тактических рисунков, когда запахло жареным, скатилась до примитивных забросов в штрафную.
+1
-1
0
Возможно, ваш комментарий нарушает правила, нажмите на «Отправить» повторно, если это не так, или исправьте текст
Ответ Баянист
Думаю, это не проблема. Можно разбить игру на условные фазы, сделать какие-то приближения. Результат, конечно, будет не стопроцентным, но, думаю, и в бейсболе никто не может гарантировать стопроцентную точность расчета
100% точности не бывает вообще. Цель - уменьшить неопределенность (по W. Hubbard - How to Measure Anything: Finding the Value of Intangibles in Business)
0
0
0
Возможно, ваш комментарий нарушает правила, нажмите на «Отправить» повторно, если это не так, или исправьте текст
Пользователь заблокирован
Ответ Berloga
если бейсбол или тот же американский футбол, еще можно как-то обсчитать, т.к. там у каждого игрока в поле есть конкретное задание, а многие комбинации месяцами оттачиваются в тренировках. В футболе такой фокус не пройдет, слишком много критериев, которые заранее не предусмотреть.
В футболе всё не высчитаешь, но вполне можно увидеть закономерности, чем, кстати, уже давно и успешно занимаются. В том же ЛЕстере, например, наглядно показалась, как можно сделать весьма неплохую и стабильную команду не из имён, а из закономерностей, основанных на процентах в статистических данных.
0
-1
-1
Возможно, ваш комментарий нарушает правила, нажмите на «Отправить» повторно, если это не так, или исправьте текст
Пользователь заблокирован
Странно это немного. Классно, что есть ПО, позволяющее быстро оперировать тучей данных и делать выборку, но я не думал, чт она такие моменты не обращают внимание.

Новый статистический показатель... Пффф.. Нет, я, конечно, не гений, не хвастаюсь, но поммнится ещё лет 5-6 назад, сидя в баре, обсуждали с друзьяи схожие мысли - например при анализе паса делали вывод, что пасов может быть 1000, качество их может быть 100%, а толку 0, просто потому, что перекаты назад и поперёк и важно анализировать не общее качество паса, а качество такового в эпизоде, притом не всегда в процентах. Например обостряющие пасы в штрафную с фланга будут изначально иметь меньшее количество и больше процентов брака, но они полезнее для атаки. Или при удержании мяча, важен не процент, важно какое количество подряд, без потерь, способна сделать подряд на участке поля, притом учитывать надо всех участников комбинации и по максимуму задействовать тех, кто к этому сболобен, а на подстраховку убирать тех, кто в этом хуже. Так же есть быстрые выходы из обороны, нагнетание темпа, сбивание темпа. Плюс ещё стоит учитывать не только качество паса, но и качество приёма, т.е. правильность занятой позиции. Говорилось и о том, что есть игроки, у которых не так много результативных действий, но при этом есть много движения, обыгрышей, обострений. Яркий пример на сегодня - Дзагоев, у которого статистика равна статистике Натхо, а пользы заметно больше.

Мне очень странно, что большие клубы так не аккуратно анализировали данные.
+1
-1
0
Возможно, ваш комментарий нарушает правила, нажмите на «Отправить» повторно, если это не так, или исправьте текст
Ответ Kendzu
Дело не совсем в этом. Просто в баскетболе, ам.футболе, бейсболе игра состоит из большого количества похожих друг на друга действий. Такое всегда гораздо удобнее для статистического анализа, чем евр.футбол, в котором очень многие эпизоды в течение нескольких матчей остаются уникальными.
Расскажите, пожалуйста, о каких уникальных эпизодах идет речь?
0
0
0
Возможно, ваш комментарий нарушает правила, нажмите на «Отправить» повторно, если это не так, или исправьте текст
Укажите причину бана
  • Оскорбление
  • Мат
  • Спам
  • Расизм
  • Провокации
  • Угрозы
  • Систематический оффтоп
  • Мульти-аккаунтинг
  • Прочее
Пожаловаться
  • Спам
  • Оскорбления
  • Расизм
  • Мат
  • Угрозы
Комментарий отправлен, но без доната
При попытке оплаты произошла ошибка
  • Повторить попытку оплаты
  • Оставить комментарий без доната
  • Изменить комментарий
  • Удалить комментарий