28 июня 1930, 20:03 5 мин.

Формула Зала Славы НБА, часть 1: статистика

Автор

2 k

Чтобы определить, кто же будет попадать в Зал Славы НБА, мне нужно было доработать формулу, которая использовалась в прошлый раз. Тогда я прямым текстом говорил: «Я примерно прикинул, сколько «весит» каждый показатель на примере нескольких великих игроков».

Ну куда такое годится? Если уж поставил цель – взять не субъективные критерии, а вывести формулу на основе наград и статистики, то уж надо действовать до конца и вес всех этих показателей рассчитать точно.

* * *

Чтобы не считать каждый перехват, каждый промазанный штрафной, каждый трехочковый бросок в полуфинале конференции и так далее, я пользуюсь агрегированной статистикой – которая уже сама учитывает всю стандартную статистику игрока, его команды и лиги в целом. Но какой из множества «продвинутых» статистических показателей взять?

PER Джона Холлинджера популярен, использует всю статистику игрока, считается с 1951 года (мне, впрочем, нужно минимум с 1949), неплохо отделяет суперзвезд от средних игроков, но при этом считает поминутную пользу – поэтому игрок, сыгравший одну игру на хорошем уровне, получит больше баллов, чем тот, кто играл средне, но зато весь сезон. Мне же нужна такая статистика, которая бы накапливалась.

Wins Produced главного оппонента Холлинджера – Дэвида Берри – накапливается. Берри получает довольно много похвалы от любителей саберметрики, однако рассчитаны Wins Produced лишь с 1987 года, а мне это совсем не подходит. Кроме того, метрика Берри поощряет эффективных, полезных, но сугубо ролевых баскетболистов, и 3&D-игроки по ней могут получить намного больше баллов, чем игроки вроде ДеМара ДеРозана, а ДеАндре Джордан кажется в два раза круче Блэйка Гриффина.

Серьезно, вы верите, что состав Рубио-Корвер-Ариза-Фарид-Робин Лопез принесет 60 побед? А судя по Wins Produced, так оно и выйдет.

Рейтинги защитной и атакующей эффективности Дина Оливера – отличная вещь. Но она не накапливается и больше отражает командную игру, чем индивидуальную полезность (что не удивительно, ведь Дин в своих работах делает упор именно на командную статистику).

Наконец, есть Win Shares Джастина Кубатко с моего любимого сайта Basketball-Reference.com. Удобный доступ к статистике по WS как за один сезон, так и за несколько (и вообще за всю карьеру), расчет показателей с 1946 года (включая АБА), все данные за плейофф, маленькая среднеквадратичная ошибка от общего числа побед команды. А главный недостаток в сравнении с другими методиками – сильная зависимость от игры всей команды (а особенно от пропущенных ею очков): так, игрок, который всеми силами в одиночку тянет беспробудно убогую команду к 10 победам в сезоне, получит меньше Win Shares, чем шестой по силе игрок победителя регулярки. А может и вообще получить отрицательный показатель Win Shares.

В общем, как и в прошлый раз, я остановился именно на Win Shares – как на самой удобной метрике. Всё равно ни одна из методик не может быть объективной, и уровень косячности у них примерно равный. Единственное условие – никаких отрицательных Win Shares. Даже играя не очень хорошо, игрок не может ухудшить своё наследие, поэтому в случае отрицательных WS (в том числе при переходе из одной команды в другую), я считаю их равными 0.

* * *

Баскетболисты играют в регулярке, в первом раунде плей-офф, в полуфиналах и финалах конференций, побеждают и проигрывают в Финалах. И ценность побед в каждом случае разная. Поэтому мне предстояло еще оценить, насколько Win Shares в плей-офф круче Win Shares в регулярке, и как WS победителя Финала сопоставить с WS игрока, вылетевшего в первом раунде.

Я пришел к такому выводу: ценность победы тем выше, чем меньше соперников выступает на данной стадии. Так, если сейчас за WS в сезоне 2014/15 давать 1 балл, то за WS в победном Финале – уже 30 (по числу команд). Проигравшие в Финале игроки должны получать 15 (30:2 – на этой стадии играет две команды) баллов, команды, выбывшие в финале конференции – 7,5, в полуфинале конференции – 3,75, а в первом раунде (где играет 16 команд) – 1,875 (что равняется 30:16).

В сезоне 68/69, например, плейоффные WS чемпиона давали 14 баллов (WS регулярки я стандартно беру за 1 балл в своей методике).

Но на этом расчет не оканчивается. В прошлый раз меня беспокоил тот факт, что для условного Данкана-2014 я считаю WS всех игр плей-офф по «ставке» победителя финала. И его WS за первый раунд во много раз ценнее WS за первый раунд условного Эла Джефферсона – хотя в тот момент они играют на одной стадии. Поскольку разделить WS по раундам плей-офф невозможно, я решил делать скидку на предыдущие раунды.

Я пытался объяснить это словами, но у меня ничего не вышло. Решил таблицей – использован пример, когда в НБА 30 команд, как сейчас:

Так, выходит, что ценность WS в каждом раунде становится меньше на 1/3 суммарной ценности WS всех предыдущих раундов.

* * *

Но и на этом не конец. Как я уже говорил, я использую не текущие коэффициенты, а средние коэффициенты. Eсли в сезоне 1949/50 ценность WS у финалиста НБА равна условным 5 баллам, а в сезоне 1950/51 – 7, то в 1951 году я буду брать среднюю ценность за всю историю НБА, т.е. 6 баллов за 1 WS в плей-офф – и умножать на неё все накопленные в финалах WS игрока за карьеру.

Пример: в плейофф-50 игрок-финалист заработал 2 WS, таким образом, он получит 2*5=10 баллов. А в плейофф-51 он снова вышел в Финал и заработал за весь ПО 1 балл, значит, его рейтинг – (2+1)*6=18 (общее число WS за карьеру на этой стадии, умноженное на средний коэффициент).

* * *

Не серчайте, если ничего не поняли. Всё-таки эти подготовительные записи – больше для самого меня, чтобы через много лет я понимал, как именно я выводил эту формулу. В следующем посте я расскажу о второй части формулы – о наградах. Заморочек будет еще больше...

16 комментариев

По дате

Лучшие

Актуальные

С диалогами

Павел Хрусталев

29 июня 2014, 15:54

Идея, конечно, просто блеск. Я тоже люблю, когда все упорядочено и фундаментально.
Но, блин, уже восемь лет как гуманитарий( прошли те времена, когда я учился в ФМЛе. Ничего не понимаю. Спор про Копе и Лепрона-то будет вообще?
Сейчас перечитаю еще раз.

Gudwin!

29 июня 2014, 14:24

1. "ценность победы тем выше, чем больше соперников выступает на данной стадии" мне кажется, чем меньше соперников, иначе самой ценной была бы регулярка
2. "Так, выходит, что ценность WS в каждом раунде становится меньше на 1/3 суммарной ценности WS всех предыдущих раундов" Вроде таблицу и пример с Данканом немного понял, но вот эта фраза какая-то запутанная
3. "в сезоне 1949/50 ценность WS у финалиста НБА равна 5, а в сезоне 1950/51 - 7" Цифры условные? Потому что в сезоне 1949/50 было больше команд
4. Как будут считаться средние коэффициенты, учитывая что в одних сезонах было 3 раунда плэй-офф, а в других 4?
5. На basketball-reference.com в сезоне 1952/53 у Энди Филлипа нет данных по WS. Что ты делаешь в таком случае? Может, есть еще какой-нибудь сайт со статистикой?

29 июня 2014, 15:31

Ответ Роман Сприкут

1. Да, описка. Поправил. 2. Это арифметический итог расчета. Ценность WS за полуфинал конфы была 3,75, стала 3,125 - это минус-0,625, треть от 1,875 (ценность первого раунда). И так далее. 3. Условные, конечно. Подписал, чтобы было более ясно. 4. Средние будут считаться по всей истории НБА. В те годы, когда раундов было меньше, этот средний показатель будет снижаться. Я могу показать коэффициенты, они уже мною рассчитаны, в отличие от практически всего остального: http://img-fotki.yandex.ru/get/9821/13451272.c/0_f4018_fd78d56b_orig 5. Я, конечно же, столкнулся с этой проблемой. Не только у Филлипа в 52/53, но еще по некоторым сезонам нет данных у Фауста, Селви, Сколари, Барнхорста, Боба Харрисона... я даже писал Нилу Пэйну пару лет назад в связи с этим и он объяснил, что у некоторых игроков нет данных в те сезоны, когда они переходили из одной команды в другую - потому что есть только общая статистика за сезон, но нет раздельной по командам. Что ж, теперь я поступаю так - разбиваю всю статистику на равные доли за игру и умножаю на число игр (т.е. если всего у Филлипа 434 подбора и 57 игр за Пистонз, а 13 за Уорриорз, то подборы считаются как 353 за Пистонз и 81 за Уорриорз). А потом по методике Кубатко расчитал WS. У Филлипа получилось 6,6 за этот сезон. Ближе приблизить это к реальности никак уж нельзя.

Спасибо за ответы!
Еще вопрос по 4 пункту: получается в сезонах 75-83 коэффициент за второй раунд ниже, чем за первый. Как-то несправедливо)

29 июня 2014, 15:58

Ответ Павел Хрусталев

Ой вей, нескоро ещё будет этот спор, пока жди спора про Дольфа Шейза и Эда Маколи.(((

oliveirae

29 июня 2014, 00:22

>Так, если сейчас за WS в сезоне 2014/15 давать 1 балл, то за WS в победном Финале - уже 30 (по числу команд). Проигравшие в Финале игроки должны получать 15 (30:2 - на этой стадии играет две команды) баллов...
В сезоне 68/69, например, плейоффные WS чемпиона давали 14 баллов (WS регулярки я стандартно беру за 1 балл в своей методике).

Тогда уж и количество очков за индивидуальные награды должно скалироваться в зависимости от количества игроков в лиге :)

29 июня 2014, 01:50

Не получается у меня на ночь привести хорошие аргументы, но я думал над этим, конечно, и пришел к выводу, что ценность попадания в All-NBA или получения награды MVP не зависит от числа игроков. Ведь сам пул кандидатов на эти награды ограничен топовыми игроками, и не имеет значения, сколько в лиге игроков "второго эшелона", которым не попасть на Матч Звезд. Чуть сложнее с попаданиями на МВЗ как раз - ведь в 50-е и 60-е была квота - но тем не менее, можно считать, что туда попадали всегда самые сливки - и тут неверно считать, что Биллу Расселлу приходилось опережать каких-нибудь Элов Бьянки в гонке за награды.

Просто - я, конечно, понимаю, что система твоя и критерии тоже, и в любом случае я отношусь к ней с уважением, - если бы я делал подобную аналитику, то ценность чемпиона в 60-х была равна ценности чемпиона в 2010-х, равно как ценность МВП в 60-х и сейчас была равной.

>Ведь сам пул кандидатов на эти награды ограничен топовыми игроками, и не имеет значения, сколько в лиге игроков "второго эшелона", которым не попасть на Матч Звезд.

Возможно, спорное утверждение: но ведь и количество реальных контендеров-то (не как Клипперс, которые вроде как в этом статусе уже который год, но при этом даже за второй раунд перебраться не могут) ежегодно невелико и остается на примерно одинаковом уровне.

29 июня 2014, 02:51

Так погоди - в конечном итоге-то ценность будет равной - я же считать эту ценность буду по среднему коэффициенту, не по коэффициенту одного сезона. Если сейчас составить общий рейтинг, то баллы Билла Расселла будут считаться по той же ставке, что и баллы Норриса Коула.

Значит, в итоге я ничего не понял :(

29 июня 2014, 15:12

Ответ Gudwin!

29 июня 2014, 16:25

Огромное спасибо за внимательность и помощь. Конечно, от этого сами результаты не сильно бы поменяются (вылетевшие в первом раунде игроки набирают от силы 1 WS, даже если их зовут Трейси Мак-Грэйди или Уилт Чемберлен, а значит в их общем рейтинге максимум треть балла вычтется, да и то редко) - но даже если где-то кто-то кого-то из-за этого опередил всего на 1 строчку, это может изменить рисунок Зала.

Зомби-дитя

29 июня 2014, 01:10

"Серьезно, вы верите, что состав Рубио-Корвер-Ариза-Фарид-Робин Лопез принесет 60 побед? А судя по Wins Produced, так оно и выйдет."

А вот возможно!