4 мин.

И снова про статистику

Позавчера я написал в блоге заметку «Лучшее нападение и лучшая защита Кубка УЛЕБ» в которой приводил статистический анализ команд Кубка УЛЕБ по итогам группового турнира. Сегодня

на сайте УНИКСа появилась реакция на мою заметку

за подписью двух Владимиров, Суприянович и Тамбова. Владимиры критикуют мои метод подсчета эффективности действий команд в нападении и защите. Конечно же я не мог не написать свой ответ коллегам.

Наверное имеет смысл сначала сформулировать и пронумеровать все замечания к моему тексту и затем ответить на все по-порядку. Отбросив в сторону мелкие уколки, типа «забивают мячи в футболе, а в баскетболе их забрасывают», я составил следующий список вопрос по существу: 1. Неправильное употребление терминов «атака» и «владение». 2. Неверный подсчет количества владений в матче. 3. Необходимость учета подборов при подсчетах эффективности. 4. Контр-разбор примеров.

Поехали. Действительно, в мои расчеты закралась серьезная ошибка. В формуле должны были использоваться именно владения (как пишут Владимиры «под владением понимается ситуация, при которой продолжается отсчет 24 секунд»), но считал я их не совсем верно. Моя формула была такой: Владение = Броски с игры + Потери + Фолы соперника. Здесь я не учел, что фолы на самом деле бывают разные. Бывают фолы после которых мяч вводится из-за боковой или лицевой линии, а бывают фолы после которых пробиваются штрафные. В первом случае счетчик 24 секунд не сбрасывается и владение продолжается, во втором — владение завершается. На эту ошибку мне указал в комментариях читатель блога rabby на следующий день. Первый мини-вывод: об атаке я не сказал ни слова, речь шла только о владениях, но вот методика подсчета у меня была не верной.

Теперь разберемся, как можно правильно посчитать количество владений. Если в моей формуле с «бросками с игры» и «потерями» все нормально (после них счетчик 24 секунд заканчивает счет — признак конца владения), то с фолами я ошибся. На самом деле в расчетах необходимо учитывать только те фолы, после которых игрок становился на линию штрафных. К сожалению УЛЕБ в своих таблицах не дает такой статистики, поэтому приходится допускать в свои расчеты определенную погрешность. Один из самых, на мой взгляд, простых и точных вариантов — это деление количества пробитых штрафных на 2 с отбрасыванием дробной части. Погрешность в данной ситуации возникает из-за того, что в игре бывают варианты, когда пробивается три штрафных. Но поскольку эти случаи довольно редки, погрешность получается небольшой. Вряд ли она перевалит за 2 владения.

Например в игре 5 раз пробивались пара штрафных и один раз тройка. Это 6 владений. 5×2 + 1×3 = 13 штрафных. Делим 13 на 2 с отбрасыванием остатка, получаем 6. То есть если в игре всего раз пробивалась тройка штрафных, то точность тем не менее будет идеальной. А вот если таких случаев было два, то уже возникает погрешность в единицу. И т.д. Таким образом, чтобы погрешность не превысила 2 владения, необходимо чтобы команда пробивала три штрафных не более 5 раз. Согласитесь, такое бывает очень и очень не часто.

Также обязательно нужно добавить сюда еще одну ситуацию, которая порождает погрешность. Это перехват мяча ногой. В данной ситуации Счетчик 24 секунд начинает считать заново, но по правилам владение получается новое. Опять же приходиться с этим мириться из-за недостатка данных в официальной статистике. Но мириться можно, так как перехваты ногой случаются очень редко. В итоге, если суммировать оба вышеприведенных фактора, имеем погрешность в пределах 3-х владений, что по статистике примерно равно 5%. Согласитесь, с такой неточностью можно жить.

С учетом всего вышесказанного, пример из статьи Владимиров перестает быть неверным. «Предположим, команда проводит атаку и забрасывает мяч. Эффективность действия — 2 очка/1 владение = 2. Та же команда проводит еще одну атаку, во время которой соперник фолит, мяч вводится в игру из-за боковой линии. Эффективность действия — 2 очка/2 владения = 1. Эффективность в два раза ниже». Теперь эффективность обеих команд будет одинаковой, так как по новой формуле фол без пробивания штрафных учтен не будет.

Теперь про подборы. Владимиры привели в своей статье следующий пример. «За определенный игровой отрезок команда совершила 10 бросков, забросила 2 мяча и сделала 6 подборов на чужом щите, соперник за то же время выполнил 4 броска, забросил 1 мяч и не сделал ни одного подбора на чужом щите. Счет 4:2, а эффективность действий по Тимашеву: 4 очка/ 10 бросков = 0.4; 2 очка/ 4 броска = 0.5. А все потому, что Тимашев не учитывает подборы мяча». Здесь абсолютно правильно вычислена эффективность. Первой команде понадобилось целых 10 владений, чтобы набрать 4 очка, тогда как другая команда свои 2 набрала всего за 4 владения. Значит она действует в нападении эффективнее. Что толку с тех 6 лишних подборов, если игроки не могут забросить мяч? Поэтому я продолжаю придерживаться точки зрения, что подборы в подсчете эффективности учитываться не должны.

Ну и, наконец, добрался я до вывода. Ошибки в первоначальной формуле были, так что критика Владимиров была обоснованной. Ошибки мы с читателями блога нашли быстро и я тут-же сделал пересчет статистики. Предлагаю ознакомиться с новыми корректными данными (точность вычислений +/- 5%).

Эффективность нападения sports.ru/images/400403_5.1169155950.3075.gif Эффективность защиты sports.ru/images/400403_31.1169155950.43732.gif

Владимиру Тамбову и Владимиру Суприяновичу я благодарен за интерес к моей заметке. Писать ответ было интересно. Статья «Осторожно, статистика!» заканчивается словами: «Безусловно, статистика нужна, важна, но не надо вводить ее в абсолют». С этим я согласен. Моя заметка просто позволяет посмотреть на статистику несколько под другим углом, что всегда интересно. На абсолют, конечно, никто не претендовал.