15 мин.

Саберметрика. Часть 9. Теории и мифы. Штрафы

В прошлом выпуске цикла мы с вами узнали, что в клатч-ситуациях игроки играют без каких-либо серьёзных изменений по сравнению с их карьерными нормами. Но это не значит, что игроки ведут себя одинаково вообще во всех внутриигровых ситуациях. В некоторых ситуациях они получают достаточно существенные штрафы к своему качеству игрока, и именно об этих штрафах мы поговорим в этой части.

Часть 1. Введение

Часть 2. Краткая история

Часть 3. Базовые принципы. Run expectancy. Win expectancy. Linear weights

Часть 4. Базовые принципы. Побочные факторы, учитывающиеся при оценке игроков

Часть 5. Базовые принципы. Выборка. Сплиты и платуны

Часть 6. Базовые принципы. Регрессия. Прогностические системы

Часть 7. Теории и мифы. DIPS

Часть 8. Теории и мифы. Клатч

* * * * *

Испокон веков по поводу внутриигрового прогноза на игру стартового питчера существовало две абсолютно противоположных (и, тем не менее, применяемых чуть ли не в одном абзаце) аксиомы. Первая гласила, что питчер со временем устаёт и по ходу игры играет всё хуже и хуже, вторая же, напротив, убеждала, что в начале игры питчер ещё не поймал свой ритм, поэтому по ходу игры играет всё лучше и лучше. Возможно, поэтому, а возможно, и просто из-за того, что это казалось логичным, менеджеры по ходу игры при прочих равных (усталость питчера (по его словам), количество брошенных питчей, доступность топ-реливеров и т.д.) неизменно оценивают своего стартёра по его перфомансу. И если при плохой игре стартёра всё логично безо всяких слов - нужно снимать, пока не изгадил игру полностью - то слишком часто решение оставлять на горке питчера, который до момента "Х" бросал очень хорошо, выходило менеджерам боком. Достаточно вспомнить ещё не стёршийся из памяти болельщиков NLDS 2014 года, когда лучший питчер современности Клэйтон Кёршо в первых шести иннингах обоих игр выдал в сумме один ран, тогда как в седьмых иннингах обоих игр выдал в сумме 11 ранов, заработав при этом в сумме только 2 аута.

Впрочем, для саберметриков это не стало большой неожиданностью. Ещё в "The Book" авторы доказали существование штрафа, который носит название "Times Through Order Penalty", или, сокращённо, ТТОР (частенько можно увидеть также сокращение ТТТО, которое просто выделяет самый важный кусок - "Third Time Through Order"). Если дать краткое определение теории ТТОР, то оно прозвучит как-то так - "при каждом последующем противостоянии бэттера с питчером, бэттер имеет всё больший перевес над питчером, причём это не зависит от качества питчера, количества брошенных им питчей или количества питчей в его арсенале". Как бы ни странно это звучало, но эти выводы подкреплены фактами, и оспорить их попросту невозможно.

Митчел Лихтман, один из соавторов "The Book", начал рассмотрение этого вопроса с очень простого теста. Он взял базу данных с 1999 по 2002 год, разбил её на проходы через лайнап, после чего посчитал wOBA против всех питчеров, исключив все банты и намеренные уоки, искажающие картину, а также выходы на биту питчеров. Получилось вот что:

Этого было бы, по моему скромному мнению, вполне достаточно - вроде бы очевидно, что лучше всего питчер бросает во время первого прохода через лайнап, после чего его перфоманс заметно ухудшается с каждым последующим проходом через лайнап, и выборка более чем значительная, чтобы не считать это обычным рэндомом.

(Что касается четвёртого прохода через лайнап, который вроде бы выбивается из общей картины, то там, во-первых, слишком малое количество бэттеров (позже, в тесте более серьёзной базы данных с 2000 по 2012 год, Лихтман это подтвердил - wOBA по проходам через лайнап получилась .340/.350/.359/.359), а во-вторых, там дело существенно портит девятый иннинг, в котором стартёры бросают практически исключительно только при большом перевесе в счёте (иначе выходит клоузер), а в блоуаутах проигрывающая сторона уже не так сильно напрягается.)

Но, как вы понимаете, Лихтман на этом не остановился. Он высчитал "ожидаемую wOBA" с учётом среднего качества питчеров и противостоявших им бэттеров, получив во всех случаях практически одинаковый результат - .353 в 1, 2 и 4 проходе через лайнап и .354 в 3 проходе через лайнап. То есть, дело явно не в качестве противостоявших питчерам бэттеров (часто ведь в концовках игр идут замены). Да, и что ещё достаточно интересное Лихтман почерпнул из этого теста - эти .353/.354 пункта "ожидаемой wOBA" практически тождественны реальному перфомансу питчеров при втором проходе через лайнап (.354). То бишь - при втором проходе через лайнап питчеры бросают соответственно своему "реальному таланту", при первом проходе через лайнап бросают лучше, а при третьем и четвёртом - хуже.

Это сподвигло Лихтмана на ещё один уточняющий тест, и он разделил первый проход через лайнап на первый иннинг и остальные иннинги. Получилось .336 в первом иннинге и .344 в остальных. "Да что ж такое-то с этим первым иннингом?" - подумал Лихтман, и ради любопытства разделил эту статистику на питчеров хозяев и гостей:

После этого Лихтман так же разделил на "хозяев-гостей" и другие проходы через лайнап, и оказалось, что в дальнейшем никакого серьёзного дисбалланса нет. Однозначного заключения насчёт того, почему у хиттеров гостей возникают такие проблемы именно в первом иннинге, Лихтман не дал, но предположил (и я, к слову, абсолютно уверен, что так оно и есть), что всё дело в том же эффекте, который и определяет два других штрафа, о которых ниже.

* * * * *

Несмотря на то, что эти тесты с более чем достаточной статистической выборкой уже кое о чём говорят, они не дают ответа на самый важный вопрос. Питчеры ведь отличаются друг от друга, как снежинки, и вполне возможно, что для одних питчеров ТТОР существует, а для других - нет. Самым важным тестом по данному вопросу, конечно же, было разделение питчеров на хороших и плохих - к примеру, ТТОР плохих питчеров может быть настолько сильно выраженным, что маскирует под собой отсутствие такового для сильных даже в такой большой базе данных (тут и далее данные из более позднего исследования Лихтмана, с базой данных 2000-2012 годов). Без лишних разговоров представляю вам результаты, полученные MGL (никнейм Лихтмана, состоящий из его инициалов):

Небольшая разница между разбивкой на проходы по лайнапам есть, но, в конце концов, между первым и третьим проходом через лайнап лучшие стартёры теряют 20 пунктов wOBA, а худшие - 21 пункт. Какой итог? Правильно - будь ты хоть Клэйтон Кёршо, а будь ты хоть Рики Ноласко, а к третьему проходу через лайнап ты аналогично теряешь в своем качестве.

Но, может, это всё объясняется простой усталостью питчеров к концу игры (т.е., большим количеством брошенных питчей)? Логично же предположить, что у большинства питчеров к третьему проходу через лайнап уже накапливается много питчей, а под конец этого прохода питч каунт уже переваливает за соточку, поэтому и результаты искажаются? Ведь в таком случае менеджеры всё делают правильно, а все вычисления Лихтмана являются только пылью в глаза.

Увы, скептиков придётся огорчить - Лихтман просчитал и это. Чтобы сделать это более чем наглядно, он не только разделил питчеров по низкому и высокому питч каунту перед началом каждого прохода через лайнап (простой путь), а ещё и выбрал противостояния "питчер-бэттер", которые при первом проходе через лайнап длились либо 2 питча и менее, либо 5 питчей и более, и посмотрел, как бэттеры отбивали против этих питчеров в следующих выходах на биту (сложный путь). Вот результаты:

Пока вы не можете поверить в то, что более чем явно показано в первой таблице (ТТОР абсолютно независимо от количества брошенных питчей), я всё-таки постараюсь обратить ваше внимание на вторую таблицу, которая намного более интересна. Ведь доказать, то, чего нет - только первый шаг к полному ответу на вопрос, тогда как куда более важно доказать то, что есть, и именно это прерогатива второй таблицы. Обратите внимание на второй проход через лайнап - бэттеры, которые увидели в первом выходе на биту 1 или 2 питча, отбивают с wOBA .350, тогда как бэттеры, которые увидели в первом выходе на биту 5+ питчей, отбивают с wOBA .365. 15 пунктов - это огромная разница, и, что характерно, в дальнейших "встречах" бэттера с питчером разница нивелируется (потому что бэттеру уже "достаточно" тех питчей, которые он увидел в первом и втором противостоянии с питчером). Бинго!

Если вы сейчас предположите, что это не конец, вы будете правы. Увидев такой шокирующий результат, Лихтман абсолютно логично попробовал разобраться в том, влияет ли на ТТОР количество питчей в репертуаре питчера. Он сделал это более чем дотошно, но я не буду забивать читателям головы кучей таблиц (я и так их тут намалевал больше, чем изначально планировал) - тот, кто хочет прочитать эту часть ресёрча Лихтмана, может сделать это на его сайте. Скажу только, что MGL получил вполне ожидаемые результаты - чем больше у питчера разных качественных (т.е., которые он применяет часто) питчей, тем меньше его ТТОР.

В конце концов, выводы Лихтмана составили полновесную теорию ТТОР, которая, несмотря на свою изначально кажущуюся нелогичность, в итоге подтверждает многое из того, что интуитивно было известно уже давно (прямо как с DIPS). Бэттеры с каждым новым противостоянием против питчера отбивают всё лучше и лучше, и это связано не с качеством питчера и не с его усталостью, а лишь с тем, насколько бэттер "ознакомился" с ним за предыдущие выходы на биту (а это, в свою очередь, зависит от того, сколько питчей бэттер увидел в предыдущих выходах на биту, и сколько функционирующих питчей есть у питчера). Косвенно эта теория также отмечает два всем известных факта, связанных с реливерами: 1). свежий реливер в большинстве случаев бросает лучше уставшего стартёра (но не из-за физической "свежести" и "усталости", а из-за того, что стартёр проходит через лайнап уже в 3-4 раз, и поэтому бросает хуже своего истинного качества, а реливер проходит только в 1 раз, и поэтому бросает лучше своего истинного качества); 2). реливерами чаще всего становятся питчеры, у которых только 1 или 2 качественных питча, тогда как стартёрам нужно хотя бы 3 (потому что чем больше качественных питчей, тем меньше ТТОР).

К сожалению, пока что эта теория остаётся только теорией. В том плане, что несмотря на её известность широким массам уже достаточно долгое время, пользуются ей менеджеры крайне редко, продолжая полагаться на количество питчей и то, как питчер бросал до определённого момента. И если по ходу сезона зачастую этой теорией пользоваться сложно по причине побочных факторов, то в постсезоне, когда есть куча свободных дней для отдыха буллпена, а ставки велики как никогда, практически ни один стартёр не должен идти на третий проход через лайнап, потому что его ожидаемый перфоманс будет хуже ожидаемого перфоманса свежего миддл реливера.

* * * * *

Рассмотрение второго важного штрафа, незнакомого широкой публике, мы начнём с того, что ненадолго вернёмся ко второй табличке, иллюстрировавшей ТТОР - той самой, где первый проход через лайнап разделяется на 1 иннинг и 2-3 иннинг. Несмотря на то, что вроде бы в 1 иннинге отбивают лучшие хиттеры обоих клубов (чаще всего 1-4 слот), во 2-3 иннинге бэттеры отбивают лучше, чем в первом. Более того - гости отбивают не просто хуже хозяев (что логично из-за универсального для всех видов спорта "хозбонуса"), а намного хуже, и плюс при этом их разница между первым иннингом и остальными иннингами намного больше, чем у хозяев. После таблички я заметил, что, несмотря на то, что сам Лихтман высказал только предположения насчёт этого феномена, мне кажется, что главное его предположение как раз и является реальным положением вещей. А предполагал Лихтман то, что это эффект, аналогичный штрафу DH-ей и пинч-хиттеров.

Ещё в "The Book" (конечно же!) Энди Долфин в части, которая рассматривала перфоманс игроков в различные моменты игр (бОльшая часть была посвящена клатчу), мимоходом коснулся темы потери в перфомансе пинч-хиттеров и DH-ей. Для этого он взял все выходы на биту пинч-хиттеров с 2000 по 2004 год и сравнил их с перфомансом тех же игроков в играх, которые они стартовали. Для того, чтобы по максимуму отмежевать исход от платунных перевесов, Долфин, как и в вычислении клатч-скилла, убрал перфоманс игроков против реливеров-левшей. Получилось у него вот что:

Как видим, разница получается огромной - целых 34 пункта wOBA, или 10%. Также Долфин похожим путём нашёл штраф, которому подвергаются DH-и, и который составил 17 пунктов wOBA, или 5%. Проэкзаменировав эти штрафы на "индивидуальность", Долфин нашёл, что штраф пинч-хиттеров не зависит от личности хиттера, а вот штраф для DH-ей варьируется от игрока к игроку. В итоге авторы заключили, что штраф пинч-хиттеров и DH-ей возникает от того, что игрокам, которые не играют в поле, сложнее сосредоточиться на хиттинге, чем тем, которые постоянно в игре. Это более чем логично - пинч-хиттеры ведь сразу без подготовки лезут в бой, а DH-и всё-таки пару раз видят питчера в игре, вот и отбивают немного лучше. Да и та самая табличка из ТТОР подтверждает - гости, которые в первом иннинге выходят отбивать, не играя в защите, имеют гораздо более сильный штраф при отбивании в первом иннинге по сравнению с 2-3 иннингами, чем хозяева.

На этом Долфин и компания завершили рассмотрение этого момента, так как в "The Book" и без этого было что рассматривать. Но это не значит, что исследования на эту тему прекратились. Сам Долфин спустя некоторое время написал для Baseball Prospectus более чем обширную статью, в которой на примере сезона 2005 года рассмотрел пинч-хиттинг в целом, и выяснил, что несмотря на то, что из-за PH-штрафа пинч-хиттеры отбивают хуже (wOBA .304), чем игроки, которых эти пинч-хиттеры заменяют (wOBA .322), с учётом множества факторов (замены питчеров, платунные перевесы и т.д.) выход пинч-хиттера в большинстве случаев является оправданным шагом. Просто польза от пинч-хиттинга не такая большая, как кажется, потому что без учёта PH-штрафа эти пинч-хиттеры должны были бы отбивать с wOBA .329. Исследователь Том Тресс чуть позже вычислил штрафы для DH-ей и PH-ов по своему методу, и заключил, что PH-штраф составляет 9% (почти как и в "The Book"), а DH-штраф составляет 11% (вдвое больше, чем в "The Book"). Но всё-таки на данный момент самым полным является недавнее исследование Митчела Лихтмана.

Лихтман взял базу данных с 1998 по 2012 год, исключил все игры Интерлиги, потом выбрал всех игроков, выходивших DH-ами в каждом сезоне, взял их статистику как DH-ей и как полевых игроков, нормализировал эту статистику с учётом качества противостоявших им питчеров и платунных перевесов, после чего высчитал DH-штраф. Но высчитал он его не просто так, а с помощью "дельта"-метода, важной частью которого является не среднее арифметическое всех показателей, а среднее арифметическое взвешенное. То есть, если у игрока в одном сезоне было 100 выходов на биту как DH-а с wOBA .320 и 200 выходов на биту как не-DH-а с wOBA .330, то его DH-штраф будет не просто разницей .330 минус .320.

В общем, провёл Лихтман своё вычисление, разделив игроков на две группы - тех, у кого в сезоне было больше выходов на биту в качестве DH-а, и тех, у кого в сезоне было больше выходов на биту в качестве полевого игрока. Итог - одинаковый DH-штраф в 14 пунктов wOBA, и с учётом довольно большой выборки можно с уверенностью утверждать, что этот DH-штраф точно находится в промежутке 7-21 пункта. Как видим, найденное Лихтманом значение весьма близко к тому, что Долфин нашёл в "The Book" простейшим методом. И стоило так напрягаться? Впрочем, наверное, всё же стоило, так как простейшие методы обычно больше всего критикуют.

С PH-штрафом Лихтман поступил немного иначе - он применил тот же метод, но разделил свой сэмпл на противостояния против стартовых питчеров и реливеров, исключив 9 и более поздние иннинги (не совсем понятно, почему - наверное, потому, что эти иннинги часто являются неполными). PH-штраф против стартёров вполне логично (потому что игроки стартового лайнапа получают бонус ещё и от ТТОР, а против реливеров и игроки стартового состава, и пинч-хиттеры по этому фактору находятся в одинаковых условиях) оказался больше PH-штрафа против реливеров - 20 пунктов против 13 пунктов wOBA. Вот тут результаты довольно серьёзно разошлись с результатами в "The Book", но поитогу суперточные значения в этой ситуации (так же, как и при ТТОР) не особо и нужны - куда важнее знать, что этот феномен существует, и то, что он существенный.

* * * * *

Ну и напоследок хочу вас ознакомить с мелкими штрафами, которые Лихтман, поигравшись с базой данных, выложил на суд общественности. Сразу предупрежу, что во всех случаях статистическая выборка не была большой, так что эти результаты не могут считаться аксиомой. Так, чисто "for fun":

- В дневных играх, которые проходят на следующий день после ночных игр, игроки отбивают хуже на 6.2 пункта wOBA;

- Полевые игроки, отыгравшие в поле первую игру даблхедера, во второй игре отбивают хуже на 8.1 пункта wOBA;

- Игроки, отыгравшие минимум 8 игр подряд, отбивают хуже на 4 пункта wOBA (и чем меньше игр подряд, тем меньше штраф);

- Игроки, имевшие день отдыха перед игрой, отбивают лучше на 0.1 пункт wOBA;

- Игроки, которые должны лететь на выездную игру, в последней домашней игре отбивают хуже на 1.6 пункта wOBA.