Формула Зала Славы НБА, часть 1: статистика
Чтобы определить, кто же будет попадать в Зал Славы НБА, мне нужно было доработать формулу, которая использовалась в прошлый раз. Тогда я прямым текстом говорил: «Я примерно прикинул, сколько «весит» каждый показатель на примере нескольких великих игроков».
Ну куда такое годится? Если уж поставил цель – взять не субъективные критерии, а вывести формулу на основе наград и статистики, то уж надо действовать до конца и вес всех этих показателей рассчитать точно.
* * *
Чтобы не считать каждый перехват, каждый промазанный штрафной, каждый трехочковый бросок в полуфинале конференции и так далее, я пользуюсь агрегированной статистикой – которая уже сама учитывает всю стандартную статистику игрока, его команды и лиги в целом. Но какой из множества «продвинутых» статистических показателей взять?
PER Джона Холлинджера популярен, использует всю статистику игрока, считается с 1951 года (мне, впрочем, нужно минимум с 1949), неплохо отделяет суперзвезд от средних игроков, но при этом считает поминутную пользу – поэтому игрок, сыгравший одну игру на хорошем уровне, получит больше баллов, чем тот, кто играл средне, но зато весь сезон. Мне же нужна такая статистика, которая бы накапливалась.
Wins Produced главного оппонента Холлинджера – Дэвида Берри – накапливается. Берри получает довольно много похвалы от любителей саберметрики, однако рассчитаны Wins Produced лишь с 1987 года, а мне это совсем не подходит. Кроме того, метрика Берри поощряет эффективных, полезных, но сугубо ролевых баскетболистов, и 3&D-игроки по ней могут получить намного больше баллов, чем игроки вроде ДеМара ДеРозана, а ДеАндре Джордан кажется в два раза круче Блэйка Гриффина.
Серьезно, вы верите, что состав Рубио-Корвер-Ариза-Фарид-Робин Лопез принесет 60 побед? А судя по Wins Produced, так оно и выйдет.
Рейтинги защитной и атакующей эффективности Дина Оливера – отличная вещь. Но она не накапливается и больше отражает командную игру, чем индивидуальную полезность (что не удивительно, ведь Дин в своих работах делает упор именно на командную статистику).
Наконец, есть Win Shares Джастина Кубатко с моего любимого сайта Basketball-Reference.com. Удобный доступ к статистике по WS как за один сезон, так и за несколько (и вообще за всю карьеру), расчет показателей с 1946 года (включая АБА), все данные за плейофф, маленькая среднеквадратичная ошибка от общего числа побед команды. А главный недостаток в сравнении с другими методиками – сильная зависимость от игры всей команды (а особенно от пропущенных ею очков): так, игрок, который всеми силами в одиночку тянет беспробудно убогую команду к 10 победам в сезоне, получит меньше Win Shares, чем шестой по силе игрок победителя регулярки. А может и вообще получить отрицательный показатель Win Shares.
В общем, как и в прошлый раз, я остановился именно на Win Shares – как на самой удобной метрике. Всё равно ни одна из методик не может быть объективной, и уровень косячности у них примерно равный. Единственное условие – никаких отрицательных Win Shares. Даже играя не очень хорошо, игрок не может ухудшить своё наследие, поэтому в случае отрицательных WS (в том числе при переходе из одной команды в другую), я считаю их равными 0.
* * *
Баскетболисты играют в регулярке, в первом раунде плей-офф, в полуфиналах и финалах конференций, побеждают и проигрывают в Финалах. И ценность побед в каждом случае разная. Поэтому мне предстояло еще оценить, насколько Win Shares в плей-офф круче Win Shares в регулярке, и как WS победителя Финала сопоставить с WS игрока, вылетевшего в первом раунде.
Я пришел к такому выводу: ценность победы тем выше, чем меньше соперников выступает на данной стадии. Так, если сейчас за WS в сезоне 2014/15 давать 1 балл, то за WS в победном Финале – уже 30 (по числу команд). Проигравшие в Финале игроки должны получать 15 (30:2 – на этой стадии играет две команды) баллов, команды, выбывшие в финале конференции – 7,5, в полуфинале конференции – 3,75, а в первом раунде (где играет 16 команд) – 1,875 (что равняется 30:16).
В сезоне 68/69, например, плейоффные WS чемпиона давали 14 баллов (WS регулярки я стандартно беру за 1 балл в своей методике).
Но на этом расчет не оканчивается. В прошлый раз меня беспокоил тот факт, что для условного Данкана-2014 я считаю WS всех игр плей-офф по «ставке» победителя финала. И его WS за первый раунд во много раз ценнее WS за первый раунд условного Эла Джефферсона – хотя в тот момент они играют на одной стадии. Поскольку разделить WS по раундам плей-офф невозможно, я решил делать скидку на предыдущие раунды.
Я пытался объяснить это словами, но у меня ничего не вышло. Решил таблицей – использован пример, когда в НБА 30 команд, как сейчас:
Так, выходит, что ценность WS в каждом раунде становится меньше на 1/3 суммарной ценности WS всех предыдущих раундов.
* * *
Но и на этом не конец. Как я уже говорил, я использую не текущие коэффициенты, а средние коэффициенты. Eсли в сезоне 1949/50 ценность WS у финалиста НБА равна условным 5 баллам, а в сезоне 1950/51 – 7, то в 1951 году я буду брать среднюю ценность за всю историю НБА, т.е. 6 баллов за 1 WS в плей-офф – и умножать на неё все накопленные в финалах WS игрока за карьеру.
Пример: в плейофф-50 игрок-финалист заработал 2 WS, таким образом, он получит 2*5=10 баллов. А в плейофф-51 он снова вышел в Финал и заработал за весь ПО 1 балл, значит, его рейтинг – (2+1)*6=18 (общее число WS за карьеру на этой стадии, умноженное на средний коэффициент).
* * *
Не серчайте, если ничего не поняли. Всё-таки эти подготовительные записи – больше для самого меня, чтобы через много лет я понимал, как именно я выводил эту формулу. В следующем посте я расскажу о второй части формулы – о наградах. Заморочек будет еще больше...
Но, блин, уже восемь лет как гуманитарий( прошли те времена, когда я учился в ФМЛе. Ничего не понимаю. Спор про Копе и Лепрона-то будет вообще?
Сейчас перечитаю еще раз.
2. "Так, выходит, что ценность WS в каждом раунде становится меньше на 1/3 суммарной ценности WS всех предыдущих раундов" Вроде таблицу и пример с Данканом немного понял, но вот эта фраза какая-то запутанная
3. "в сезоне 1949/50 ценность WS у финалиста НБА равна 5, а в сезоне 1950/51 - 7" Цифры условные? Потому что в сезоне 1949/50 было больше команд
4. Как будут считаться средние коэффициенты, учитывая что в одних сезонах было 3 раунда плэй-офф, а в других 4?
5. На basketball-reference.com в сезоне 1952/53 у Энди Филлипа нет данных по WS. Что ты делаешь в таком случае? Может, есть еще какой-нибудь сайт со статистикой?
Еще вопрос по 4 пункту: получается в сезонах 75-83 коэффициент за второй раунд ниже, чем за первый. Как-то несправедливо)
В сезоне 68/69, например, плейоффные WS чемпиона давали 14 баллов (WS регулярки я стандартно беру за 1 балл в своей методике).
Тогда уж и количество очков за индивидуальные награды должно скалироваться в зависимости от количества игроков в лиге :)
>Ведь сам пул кандидатов на эти награды ограничен топовыми игроками, и не имеет значения, сколько в лиге игроков "второго эшелона", которым не попасть на Матч Звезд.
Возможно, спорное утверждение: но ведь и количество реальных контендеров-то (не как Клипперс, которые вроде как в этом статусе уже который год, но при этом даже за второй раунд перебраться не могут) ежегодно невелико и остается на примерно одинаковом уровне.
2. Это арифметический итог расчета. Ценность WS за полуфинал конфы была 3,75, стала 3,125 - это минус-0,625, треть от 1,875 (ценность первого раунда). И так далее.
3. Условные, конечно. Подписал, чтобы было более ясно.
4. Средние будут считаться по всей истории НБА. В те годы, когда раундов было меньше, этот средний показатель будет снижаться. Я могу показать коэффициенты, они уже мною рассчитаны, в отличие от практически всего остального: http://img-fotki.yandex.ru/get/9821/13451272.c/0_f4018_fd78d56b_orig
5. Я, конечно же, столкнулся с этой проблемой. Не только у Филлипа в 52/53, но еще по некоторым сезонам нет данных у Фауста, Селви, Сколари, Барнхорста, Боба Харрисона... я даже писал Нилу Пэйну пару лет назад в связи с этим и он объяснил, что у некоторых игроков нет данных в те сезоны, когда они переходили из одной команды в другую - потому что есть только общая статистика за сезон, но нет раздельной по командам.
Что ж, теперь я поступаю так - разбиваю всю статистику на равные доли за игру и умножаю на число игр (т.е. если всего у Филлипа 434 подбора и 57 игр за Пистонз, а 13 за Уорриорз, то подборы считаются как 353 за Пистонз и 81 за Уорриорз). А потом по методике Кубатко расчитал WS. У Филлипа получилось 6,6 за этот сезон. Ближе приблизить это к реальности никак уж нельзя.
А вот возможно!
Чуть сложнее с попаданиями на МВЗ как раз - ведь в 50-е и 60-е была квота - но тем не менее, можно считать, что туда попадали всегда самые сливки - и тут неверно считать, что Биллу Расселлу приходилось опережать каких-нибудь Элов Бьянки в гонке за награды.
Конечно, я допустил промашку - не учитывал ценность первого раунда в те сезоны, когда его не было - а нужно было просто его учитывать по базовой стоимости, стоимости регулярки (1 балл).
Вот таким должен получаться первый раунд: http://img-fotki.yandex.ru/get/9512/13451272.c/0_f401a_3551cc3d_orig (естественно, все остальные раунды были высчитаны нормально).
И если вдруг когда-нибудь будет еще один раунд, то я буду рассчитывать его ценность с учетом того, что с 1950 по 20ХХ годы ценность этого нового раунда была равна 1 (не 0, не пустому значению, а именно базовому, "регулярному").
А если наоборот - раунды сократят - то ценность первого раунда будет уменьшаться с учетом того же расчета, что ценность неиграемого раунда равна ценности регулярного сезона.
Вин Шарес очень сильно зависит от судейства в концовках, а тем более в ПО, где сами знаете что происходит, и вы думаете, что это покажет "объективно" лучшего?
Модный нынче RPM можно взять.
И да, на каком месте Тимак с Вилтом? Если Микол Жордон как всегда на первом, то будет слишком уныло и вообще не тру.