Что на самом деле значат оценки WhoScored
В последнее время стал все чаще и чаще натыкаться на оценки WhoScored как на почти что универсальный аргумент в спорах, авторитетный источник оценки уровня игроков, инструмент для троллинга и т.д. Если для последнего все средства хороши, то для первых двух целей оценки WhoScored совсем непригодны.
В тексте попытаюсь с примерами из лиги, за которой слежу (АПЛ), растолковать на самом деле очевидные вещи, которые многие упускают – наверняка из-за неохоты вникать в детали и понимать методику этих оценок. По сути, все сказанное также применимо и к рейтингам игроков от Squawka.
Что такое оценка WhoScored? Согласно официальному определению, это «уникальный всеобъемлющий статистический алгоритм, который базируется на более чем 200 статистических показателях, каждый из которых учитывается с различной степенью важности». Точная формула подсчета для игроков каждой из позиций, разумеется, не раскрывается, но ключевые показатели известны. Это те показатели, которые находятся в открытом доступе в отчетах WhoScored к матчам – отборы, перехваты, выносы, обводки, ключевые передачи, удары по воротам, точные навесы плюс результативные действия.
В этом и заключается главная проблема оценки полевых игроков на основе лишь статистических показателей. Все эти показатели засчитываются в оценку как положительные действия, хотя на деле все труднее.
Например, у того, что защитник совершил за матч 5 отборов (при прочих равных отличный показатель) могут быть очень разные причины: 1) он провел неплохой матч, но показатель завышен из-за того, что команда слишком много играла без мяча, была вынуждена чаще его отбирать; 2) он провел не очень хорошую игру, слишком часто пускался в рискованные попытки отобрать мяч, но 5 раз не был за это наказан; 3) он действительно блистательно отыграл в разрушении.
Количество выносов и вовсе напрямую зависит от стиля команды и стиля соперника. У команд, которые больше и глубже обороняются при прочих равных всегда будет больше выносов. Добавим к этому полное игнорирование системой позиционных ошибок – и получим оценку полную изъянов.
Хороший пример проигрыша системы реальности – защитник «Халла» Кертис Дэвис. В январе этого года он потерял место в составе клуба и публично признал правоту этого решения Стива Брюса, хотя был в числе лучших защитников АПЛ по версии WhoScored. Нетрудно догадаться, что стиль «Халла» позволял ему набирать солидное количество выносов, при этом далеко не все его ошибки отмечались системой как результативные, что вело к высокому баллу.
Точно также можно разобрать любой ключевой компонент формулы WhoScored. Могут ли 10 дальних ударов, ни один из которых не завершился голом, считаться положительным показателем? Согласно оценке, могут. Если же учесть контекст, они окажутся ближе к необоснованным потерям мяча, чем к реальной угрозе.
Это на своем опыте осенью сезона 2013/14 познали Эндрос Таунсенд и Натан Редмонд. Благодаря фирменному приему (смещение с фланга-дальний удар) оба лидировали в рейтинге WhoScored в своих командах. Но вскоре Таунсенд потерял место в основе, а Редмонд был переведен на другой фланг, дабы отучить его атаковать так однотипно.
Не хочу перегружать вас однородной информацией, поэтому, если кому-то интересны изъяны остальных стат параметров, можем обсудить в комментариях.
Отдельного разговора заслуживает оценка вратарей.Оценивать их с существующими ныне статистическими показателями труднее, чем игроков любой другой позиции. Самые распространенные из них и играющие важную роль у WhoScored – количество сейвов и процент отраженных ударов – не пригодны для анализа, если мы допускаем, что в мире есть топ-вратари, который стабильно сильнее остальных.
Это неудивительно, так как все удары разные по трудности для вратаря. Сравнение же вратарей по проценту отраженных ударов опирается на предположение, что на дистанции сезона количество трудных и не очень трудных ударов для каждого вратаря более-менее уравновешивается. Но, разумеетсяются, это не так. Процент отраженных ударов слишком сильно колеблется у одних и тех же вратарей от сезона к сезону.
Итого: оценки WhoScored и им подобные – отличный показатель активности и могут быть предельно полезны. Активность нередко равна/близка «лучшести», но это никак не аксиома, следовательно, в корне неправильно упускать контекст и переоценивать важность этой оценки.
Как в бородатом анекдоте: Средняя зарплата в России — это когда 1 человек получает 2 миллиона, а 100 других по 8000р. Тогда в среднем они все получают по 27000р. А теперь простым языком: — У Пети 10 яблок, а у Васи 0. В среднем у обоих по 5 яблок. — Чиновники едят мясо, я — капусту. В среднем мы едим голубцы. — Жена директора колхоза Глаша еб*тся со всеми, а доярка Маша не дает никому, но в среднем они обе бл*ди
Кстати, на Whoscored есть довольно любопытная характеристика сильных и слабых сторон футболиста/команды и их стиля игры. Она учитывает все статистические показатели и делает на их основе вывод. И зачастую он совпадает с тем, что ты видишь на поле.
1. судя по вот этому:
Это неудивительно, так как все удары разные по трудности для вратаря. Сравнение же вратарей по проценту отраженных ударов опирается на предположение, что на дистанции сезона количество трудных и не очень трудных ударов для каждого вратаря более-менее уравновешивается. Но, разумеетсяются, это не так. Процент отраженных ударов слишком сильно колеблется у одних и тех же вратарей от сезона к сезону.
можно сделать очевидный вывод, мол "зачем тогда вообще пытаться анализировать с футбол с помощью цифр, ведь по сути даже в этом примере абсолютно одинаковый по силе и точности удар будет по-разному сложен для двух разных вратарей банально за счет антропометрических данных". но разве статистику и не придумали, чтобы все это хоть как-то стандартизировать?
2. что со статистическими параметрами opta? они претендуют на объективность или нет? я честно говоря ни разу в глаза не видел платного аккаунта этого ресурса и для меня это видится неким сакральным знанием, о котором было бы любопытно узнать подробнее.
2) не статистика
3) пока недоступная статистика. Еще, как минимум, можно учитывать скорость атаки, часть тела, которой наносился удар.
Разумеется, субъективным глазом можно неплохо оценить вратарей, но перевести в статы пока невозможно.
тут просто всю стату автоматом собирают. Ибо матчей очень много.
Плюс статистика не может оперировать таким необъективным априори фактором как "верность решения". Верность решения здесь определяется человеком и не является математическим решением, к сожалению. К тому же часто бывали случаи, когда вратарь поступал не по лекалам, но все равно не допускал гола. И принял неправильное решение и не допустил гола, получается. А что важнее?)
Не стоит такими показателями оперировать в статистике. Необъективно будет.
Посмотрев на оценки игроков Челси, когда Иванович за сезон поставлен выше Терри, а Реми ниже Филипе Луиса - о чем тут спорить?
Опта небезусловный источник даже если нужно посмотреть отдельный показатель для конкретной цели, например точность паса: у защитников это часто большая доля пасов назад вратарю, которая совсем не характеризует его почтиХави.
Статистика по карточкам тоже условна: это не то сколько нарушают а то что свистят, по логике вор не тот кто ворует а тот кто попадается. Показателен матч Челси с Бернли когда Барнс всех оттоптал, а карточки получили Матич и Иванович.
1) по правильности выбора позиции в момент подачи/удара(см.ниже насчет линии центра ворот и удара),
2) Правильности принятия решения, выходить/не выходить из ворот(но для этого нужно принять некую модельную скорость/ускорение для вратаря, чтобы знать на какие мячи он обязан выходить, а на какие нет - но опять же субъективно, потому как кто-то силен на линии, а кто-то на выходе, чтож им теперь не использовать свои козыри?
3) Проценты отбитых ударов можно раскидать по скорости мяча и удаленности от линии соединяющей начальную точку удара и центр ворот, таким образом мы получим деление ударов на простые, средние и сложные. (но опять плюс или минус вратарю если он отбил мяч летящий в штангу или чуть мимо ворот? технически плюс - логически, мяч мог скакнуть на кочке и залететь в ворота, так что минус)
Уровень грамотного подсказа защитникам вообще никак не оценить, а ведь это тоже важнейшая часть работы вратаря.
2. Opta – поставщик статистик. WhoScored пользуется именно их данными.
Сэйв - что ему предшествует? Удар. Какие у него характеристики? Сила, расстояние, откуда наносился, степень опеки при ударе.
Что такое степень опеки при ударе? Это некоторая область, окрестность игрока, бьющего по мячу. Собственно говоря, заполнённость или насыщённость этой окрестности повышает или понижает степень опасности удара, то есть очевидно. что человек. наносящий удар при опеке менее эффективен, чем одиноко стоящий перед вратарём форвард.
Всё это очень легко просчитывается, просто формулы намного сложнее, там должны быть некоторые "веса", коэффициенты понижения и многие другие плюшки, которые показывают объективную в целом картину.
Проблема в том, что кто этим будет заниматься? Это серьёзное математическое исследование и это не просто циферки сложить и поделить.
Не нужно недооценивать математику, без неё мы бы сейчас на пальме сидели бы.
В том дело, что я видел матчи Месси, но не все. Поэтому не решаюсь сравнить его и Азара по дриблингу на уровне собственного мнения. В тексте я использовал факт на основании только статистики. Если по статистике Азар лучший, значит это он уже заслужил определенной похвалы. Разве нет? Лучше ли он Месси? Я не знаю и не берусь судить. Знаю, что есть категория людей, которым "все очевидно". Могу лишь позавидовать точности их глаз.
Опять же я настаиваю на то, что статистика лишь инструмент для подтверждения мнения. Если мнение верное, то поместив статистику в контекст, можно получить его подтверждение. Но я никогда не ставил ее на первое место. Не думаю, что ваше предположение верно по отношению ко мне.
По примеру с защитниками - тоже вырвано из контекста. Если защитник из слабой команды (см. выше про Дэвиса) получил высокую оценку за один матч (и неважно по какой причине) - это еще не говорит о слабости статистики. Если он продолжит бросаться в глупые перехваты - средняя оценка все расставит по своим местам.
Для оценки качества игры важна именно средняя оценка. В ней будет 20% игр против нападающих из топ-4 (Коста, Агуэро, Жиру, Руни) - в таких играх условный Кертис Дэвис получит меньше семи баллов даже если не будет уж очень сильно ошибаться. А если будет - то вообще труба: вес ошибки (со знаком минус) в несколько раз больше веса полезного действия (со знаком плюс).
10 дальних ударов - тоже хороший пример. Среднее количество касаний мяча в подходящей для удара ситуации - как раз около 10 за матч. На оценку эти удары конечно повлияют - но не так как пара удачных ободок, ключевых передач и других, более полезных для команды действий при этих касаниях мяча. А дальше все тот же вопрос - если это один матч так сложился, то на среднюю оценку он сильно не повлияет. Если же это игрок из разряда "получил мяч - х..чь", то один-два залетевших мяча среднюю оценку не вытянут.
Оценка за матч отражает полезность игрока в одном отдельно взятом матче по объективно измеримым показателям, не более того. Средняя оценка - чуть более надежный инструмент сравнения. Но как и любой инструмент ее нужно правильно применять - не надо ждать от нее чудес. Если сейчас Ман Ютд на основании статистики купит Фабиански вместо Де Хеа, то они совершат ошибку не потому что поляк - плохой вратарь, а потому что он не умеет справляться с давлением в топ-клубах. Если Кертис Дэвис играя в Халле станет лучшим защитником Европы по рейтингу - абсолютно не факт, что он заиграет в Барселоне, потому что там от защитника требуются иные качества.
Я уверен, что скауты клубов используют статистику как дополнительный параметр для оценки. Но почти наверняка они строят на основе данных Opta собственные рейтинги, которые учитывают требования тренера к игроку - например, исключая влияние дальних ударов для игрока, от которого требуется играть в пас или даже вводя отрицательный коэффициент за такие удары. А рейтинги Whoscored - это в общем-то массовый продукт, для болельщиков и таких вот диванных экспертов, как мы с вами.
сто лет, сто зим.
Почему сам не пишешь? Когда же когда?
Про качество дриблинга я написал ниже. Если вам будет интересно, почитайте.
Ладно уж, я больше не буду писать о том, как эти статистичесике цифры плохи. Не буду вам морочить голову.)
То, что вы пытались Азара похвалить - я с этим согласен. Я был несогласен лишь с той формулировкой, что он "лучший дриблер". Поймите, я не оголтелый эмоциональный поклонник Месси - я им восхищаюсь вполне спокойно и естественно, так же, как им восхищаются остальные любители и ценители футбола. Просто я, видимо, остро чувствую несправедливость, в том числе и в высказываниях. Азар очень хорош, очень, но - положа руку на сердце, наблюдая его игру и игру Месси, ну никак нельзя сказать, что Азар - лучший дриблер. Ну нет у него тех способностей Месси (которые Месси продолжал проявлять и в этом сезоне), как нет их у любого другого игрока. Только и всего. И вообще, этот вопрос на самом деле настолько не главный, что даже немного неудобно, что обсуждение его стало таким объемным.
Вам я все-таки еще раз посоветую больше полагаться на собственные впечатления. А такое стремление к объективности, разумеется, по умолчанию похвально.
Ну, а по поводу того, как могут выглядеть материалы без использования их авторами статистических данных, вы не совсем правы. Мне, конечно, хотелось бы быть скромнее, но за неимением других более подходящих примеров, могу предложить вам ознакомиться с моим последним текстом:
www.sports.ru/tribuna/blogs/giggsboson/793608.html
Возможно, можно и без статистического анализа обходиться в тексте без фраз вроде "Азар крутой в этом году, еще мне кажется, он неплохо обматывает соперников (не как Месси, но неплохо), *ссылка на видео голов Азара*. PS. завтра обсудим Алексиса Санчеса""
По остальному такое замечание: из ваших рассуждений следует, что выбор идет между массированной плотной обороной и командой, в которой обороняются 4 защитника, а остальные игроки курят в сторонке. Ну ответ, что лучше для атакующей команды в таком выборе, очевиден. Но такого выбора никогда не было и не будет. Если у команды разряженное простанство у своих ворот, следовательно, игроки выше не просто так не на своих позициях. Очень вероятно, что команда высоко и смело прессингует. Следовательно, выбор именно меж тем, преодолевать ли крутой прессинг или вскрывать оборону, которая плотна, но не прессингует тебя. Именно в этой дилемме я выделил Арсенал 09-12 и Барсу примерно те же лет как примеры команд, которым проще, когда соперник не прессингует.
Абсолютно логично, что соперники играли с ними так, а не смелее. Ибо 80% команд просто не способны прессинговать на должном уровне, и получали бы еще больше проблем. Но в целом когда находились смелые и сильные в прессинге команды, им приходилось намного труднее, хотя формально на поле было больше разряженного пространства.
Нет, совсем нельзя. Футбол, за исключением стандартов, динамичная игра, а бейсбол статичная. Поэтому применить можно лишь сам принцип (обращать внимание не только на самые яркие моменты игры футболистов, но и на мелочи), но сами методы не работают вообще. А принцип в футболе настолько расплывчат, что будет намного менее эффективен.
Расстояние, покрытое игроком и командой за матч - это, может быть, единственный показатель, который человек не может увидеть самостоятельно. Больше на ум ни один такой не приходит. Но этот показатель и не принципиален для анализа. Смысл этого показателя можно узнать и из обычных физических тестов. Что вам здесь не ясно?
И я не описываю ни дриблинг, ни какое-то другое объективное понятие словами "магия" и "волшебство". Я сказал, что этими словами их описывают другие люди. Я же несколько сообщений назад сказал конкретно от каких качеств зависит общее качество дриблинга. Я перечислил эти конкретные вещи.
Во-вторых, я же вам написал: второй игрок умеет обводить и на свободном пространстве за счет скорости, и на маленьком участке при плотной защите, а первый - только на свободном пространстве. (Причем, это необязательно про Месси и Бэйла). Так, какой из них - лучший дриблер? Вопрос проще некуда.
Ну, и потом. Обыграть игрока на большом свободном пространстве всегда легче, чем на маленьком. Для этого нужна, в первую очередь, только скорость. Само же умение обвести в этих условиях требуется не самое высшее. И так как подавляющее большинство признанных дриблеров высокой скоростью обладают, у них у всех хороший дриблинг на свободном пространстве. При более же плотной защите значимость скорости бега для обводки (дриблинга) снижается вплоть до 0, а самого умения обвести возрастает вплоть до 100%. Умение это заключается в уме и ловкости, резкости ног, общей координированности тела; чем больше интеллекта в дриблинге, чем более неожиданные для соперника принимаются решения, чем более тонкие и точные, как по времени, так и по пространству, совершаются движения, как с мячом, так и без, чем более ловко и быстро работают ноги дриблера, - тем выше качество дриблинга. Чем грубее, толще, неотесаннее - чем примитивнее - эти движения и работа ног, чем более бесхитростные, ожидаемые решения - тем качество обводки ниже.
Вы правы, подразумевая то, что "качеству" обводки еще не придумали научных определений и еще не научились его измерять в цифрах. Но это не значит, что это понятие необъективно. Это понятие - "качество обводки", объективно есть. И если уж на то пошло, то приблизительно определить уровень обводки того или иного игрока можно и по тому, как часто и в какой степени при его дриблинге говорят о "магии" или "волшебстве". Потому что эти народные понятия о "магии" или "волшебстве" отражают именно те качества обводки (и не только ее), которые я описал.