Саберметрика. Часть 7. Теории и мифы. DIPS

7 февраля 2015, 12:18 10 мин.

Автор

Прежде чем цикл перейдёт в ту фазу, которая, наверное, больше всего интересует читателей - разъяснение различных статистик - считаю, что нужно познакомить читателей с несколькими вещами, которые, пусть и не являются базовыми принципами саберметрики, но уже стали весьма важными её компонентами. Если объединить их в одну группу (что я и сделал), то их можно назвать теориями, которые опровергают древние мифы. Некоторые с натяжкой являются теориями, некоторые опровергают не такие уж и закоренелые мифы, но тем не менее, что-то общее у них есть.

Первая из таких теорий - теория DIPS. Расшифровывается DIPS как "Defence Independent Pitching Statistics", т.е., точнее было бы отбросить последнее слово и оставить только DIP, но теория разрабатывалась вместе со статистиками, и поэтому аббревиатура всегда используется вместе с "S". Мы, правда, о статистиках поговорим позже, когда этому придёт время, так что статья может показаться вам не слишком полной, но не переживайте - так оно и было задумано.

Часть 1. Введение

Часть 2. Краткая история

Часть 3. Базовые принципы. Run expectancy. Win expectancy. Linear weights

Часть 4. Базовые принципы. Побочные факторы, учитывающиеся при оценке игроков

Часть 5. Базовые принципы. Выборка. Сплиты и платуны

Часть 6. Базовые принципы. Регрессия. Прогностические системы

* * * * *

Когда в январе 2001 года чикагский студент Роберт МакКрекен по кличке "Ворос" опубликовал свою новаторскую статью в Baseball Prospectus, он начал её словами "Мне говорят, что я сошёл с ума". Главный вывод статьи, которая совершила прорыв в саберметрике, был коротким, но на первый взгляд казался полностью неправдоподобным: "Умение предотвращать хиты при выбитых в поле мячах одинаково или практически одинаково для всех питчеров". То есть, другими словами - будь ты хоть Педро Мартинес, будь ты хоть Арон Селе, если ты позволил бэттеру отбить мяч в поле, у вас практически одинаковые шансы выдать хит или сделать аут. "Третьими" словами - у питчера нет никакого контроля над ситуацией после того, как бита встретится с мячом и тот останется в поле, поэтому игру питчера следует оценивать исключительно по тем показателям, которые не зависят от действий защитников. Такие заключения 14 лет назад действительно выглядели как полная ересь - как так, ведь топовые питчеры выдают слабый контакт, который филдерам легче превратить в аут, а слабые питчеры выдают лайнер за лайнером, за которыми попробуй угнаться?

Хотя на самом деле такая реакция консервативной общественности была достаточно странной, ведь главный традиционный питчерский показатель, ERA, кроме всего прочего, был введён для того, чтобы разграничить раны, которые выдал питчер из-за своего плохого перфоманса, и раны, которые ему "помогла" выдать защита. То, что ERA делает это примитивно и однобоко (зачастую ошибки весьма субъективное мнение скорера, не говоря уже о том, что после ошибки скорер часто должен восстанавливать иннинг как ему кажется, он бы развился без ошибки, и т.д.) - вопрос десятый, главное, что делает. И тем не менее, DIPS была встречена в штыки даже некоторыми членами развивающегося саберсообщества. Не слишком помогло и то, что МакКрекен в своей статье только расписывал итоги исследования, о принципах которого рассказал только поверхностно.

Тем не менее, все аналитики поспешили проверить заключения МакКрекена, выбирая любые возможные углы, которые бы позволили подтвердить или опровергнуть эти тезисы. В конце концов оказалось, что МакКрекен не прав на все 100%, но общая его идея подтвердилась и была дополнена по принципу "с миру по нитке". Через два года МакКрекен получил должность в аналитическом отделе Бостон Ред Сокс, ещё через 2 года был уволен (не смог найти что-то новое касательно DIPS), и сейчас работает аналитиком в соккере, но тем не менее, теория DIPS, дополненная мелкими нюансами, плотно укоренилась в важной нише саберметрики.

* * * * *

Итак, что является "столбом" DIPS? Питчеры могут контролировать только три показателя, которые как раз и являются независимыми от защиты - страйкауты, уоки и хоум-раны. Конечно, иной раз третий страйк уходит от кэтчера и раннер добирается до первой базы, а хоум-ран защитник может "украсть", но это бывает так редко, что этим можно пренебречь. Также через некоторое время после статьи МакКрекена ресёрчеры обнаружили, что умение инициировать инфилд папфлаи тоже является независимым от защиты, и является реальным, но в основных статистиках DIPS оно не учитывается (хотя учитывается в WAR по версии Fangraphs, где инфилд папауты считают наравне со страйкаутами). Всё, что происходит на поле помимо этих трёх исходов выхода на биту, входит в статистику, называемую BABIP (Batting Average on Balls In Play), которая показывает, какой процент мячей, выбитых в поле, стали хитами (подробнее о BABIP и её применении - вместе с другими DIPS-статистиками), и которая как раз и является показателем, который питчеры не могут контролировать.

Почему так получается? "На пальцах" эта концепция настолько проста, что даже удивительно, что она пришла в голову обычному студенту, а не кому-то из "зубров" саберметрики, которых в начале 2000-х уже насчитывалось не так и мало. Ресёрчеры Том Танго, Эрик Аллен и Арвин Су после публикации результатов МакКрекена пошли даже дальше - они провели сложную серию расчётов, дабы определить хотя бы приблизительную долю каждой из переменных величин, которая может повлиять на участь мяча, отбитого в поле, и эти результаты я приведу после описания каждой из этих величин.

Во-первых, любой, кто когда-нибудь смотрел бейсбол, отлично знает, что любой, даже самый быстрый лайнер может прилететь прямо в руки филдеру, а любой слабый дрибблер, десять раз отбившись от газона, может просочиться в дырку между шортстопом и третьим бейсменом (для иллюстрации (спасибо сайту Fangraphs) вот вам две гифки с участием Дастина Педройи, где сначала явный хит становится аутом, а потом явный аут становится хитом). Это чистое везение/невезение. Танго сотоварищи определили, что влияние такого чистого везения на участь мяча, отбитого в поле, составляет 44%.

Во-вторых, нельзя не учитывать качество защиты, которая окружает питчера. Ошибки, как я уже говорил (и как повторюсь ещё не один раз в этом цикле) - часто бывают субъективным решением скорера, и, тем не менее, их пытались отмежевать от оценки работы питчера ещё тогда, когда многие саберметрики даже не появились на этот свет. К тому же, ошибки, даже если бы в их определении не было человеческого фактора - это не единственное влияние защиты на работу питчера, есть просто мячи, которые плохой защитник не может поймать/сыграть, а хороший может. Для наглядности давайте посмотрим на сравнение сыгранных (зелёные точки) и несыгранных (красные точки) мячей в 2014 Андрелтона Симмонса и Дерека Джитера:

В аутфилде это видно даже нагляднее - вот подобные чарты Джеки Брэдли в 2014 и Шин-Су Чу в 2013, когда он играл центрфилдера:

Как думаете, у какого питчера будет больше выданных хитов - у того, который при прочих равных имеет за своей спиной Симмонса или JBJ, или у того, который имеет за своей спиной Джитера или Чу? Думаю, ответ тоже очевиден, и ошибки тут попросту ни при чём. Танго сотоварищи отвели защитникам долю влияния на участь мяча, отбитого в поле, 17%.

В-третьих, конечно же, на участь мяча, отбитого в поле, влияет стадион и его особенности. На "Фенуэй Парке" есть "Грин Монстр", превращающий лёгкие флайболы в даблы, на "Корс Филд" - разрежённый воздух, позволяющий мячам лететь дальше, обманывая филдеров, на "Петко Парк" есть огроменный аутфилд, затрудняющий аутфилдерам ловлю мячей, на "О.ко Колизее" есть большая зона фаула, помогающая ловить больше фаул папфлаев, и т.д., и т.п. Всё это, по исследованию Танго сотоварищи, влияет на участь мячей, отбитых в поле, на 11%.

* * * * *

Если вы внимательно читаете и не имеете проблем с математикой, вам понятно, что 44%+17%+11% не равно 100%. Действительно, остаётся ещё 28%, за которые, по мнению исследования Танго, Аллена и Су, ответственным является питчер. Тут недоверчивому читателю полагается воскликнуть: "И какого лешего я тут читаю о теории, по которой питчер не контролирует участь мячей, отбитых в поле, когда через пару абзацев становится известно, что он таки контролирует? И что, если только на 28%? А если цифры ресёрчеров не точные, и питчер на самом деле влияет больше?"

Но дело в том, что даже знание того, что питчер влияет на участь отбитых в поле мячей только на 28%, а не на 100% (за исключением ошибок, как в ERA) - это уже большой прорыв в понимании оценки перфоманса питчера. Огромный. Плюс, что намного важнее, эти 28% следует понимать немного не так категорично, как обычную цифру. Да, есть особенности, которые помогают питчерам уменьшать вероятность хитов при отбитых в поле мячах, но это определяется профилем игрока. Питчеры, которые инициируют лёгкий контакт, лимитируют BABIP из-за того, что чем легче отбит мяч, тем легче его сыграть - это наклболлеры, за счёт непредсказуемости питча, а также "finesse"-левши (питчеры, у которых слабый фастбол, но сильные контроль, комманд и брейкинг болы - Джейми Мойер, Марк Бёрли и т.д.). Экстремальные флайбол-питчеры лимитируют BABIP чисто из-за того, что флайболы реже превращаются в хиты (не-хоум-раны), чем граундболы, а также из-за того, что, как правило, они умеют инициировать большое количество инфилд папфлаев, которые хитами практически вообще не становятся.

И тем не менее, хоть питчеры за счёт своего репертуара хоть как-то и могут влиять на участь отбитых в поле мячей, это мало коррелируется с их качеством. Экстремальным флайболлером может быть Джош Беккетт в период своего расцвета, а может быть Крис Янг. Finesse-левшой может быть как Том Глэвин, так и Крис Капуано. Карьерный BABIP Клиффа Ли - .298, карьерный BABIP Джейми Райта - .302. Карьерный BABIP Нолана Райана .265, карьерный BABIP некоего Герма Вехмайера - .262. И так далее.

Ещё одной серьёзной проблемой в традиционной оценке питчера (т.е., по количеству выданных ранов) является то, что этот самый BABIP является страшно непредсказуемой статистикой из года в год даже для одного и того же питчера в одной и той же команде. BABIP Педро Мартинеса в 1999 году составил .325, BABIP Педро Мартинеса в 2000 году составил .237 (а потом .310, а потом .274). BABIP Ю Дарвиша в 2013 году составил .264, BABIP Ю Дарвиша в 2014 году составил .334. Кит Вулнер и Дэйн Перри в своей статье для книги "Baseball Between The Numbers: Why Everything You Know About The Game is Wrong" определили корреляцию некоторых питчерских показателей из года в год, и пришли к таким цифрам (корреляция "0" = нет корреляции, корреляция "1" = идеальная корреляция): BABIP - .272, хоум-раны по отношению к противостоявшим им бэттерам - .470, уоки по отношению к противостоявшим им бэттерам - .676, страйкауты по отношению к противостоявшим им бэттерам - .790, процент граундболов - .807 (процент граундболов учитывается во многих прогностических DIPS-статистиках, о которых, повторюсь, позже). То есть, предсказать BABIP очень малореально, даже имея серьёзную базу данных, тогда как хоум-раны и, особенно уоки со страйкаутами - очень даже реально.

* * * * *

Вот вам и вся суть теории DIPS - более сильные питчеры выдают меньше ранов не за счёт того, что у них есть мифическое умение лимитировать хиты, а из-за реальных умений, которые они могут контролировать - умение инициировать свинги "вхолостую" (страйкауты), умение контролировать зону страйка (лимитирование уоков) и умение бросать мяч туда, куда нужно (избегание "горячих" зон бэттера, а значит, и хоум-ранов). И пусть Ворос МакКрекен изначально не был прав в своих заключениях на все 100%, но, тем не менее, он заслуженно встал в один ряд с великими саберметриками за свой переворот в понимании и оценке глобальной части игры.

саберметрика

я, конечно, не знаю как высчитывались проценты, но разве области "везения" и "хорошей защиты" не должны пересекаться, и в то же время области "везения" и "фактора стадиона" также не должны пересекаться? Я говорю о том, что 44% нельзя складывать с 17% и 11 %, т.к. второй и третий компонент пересекаются в каких-то моментах с первым компонентом?

8 февраля 2015, 01:20

Ответkali-yuga

В твоих словах есть смысл, но тут разговор не совсем об этом.
Представь себе - есть лайнер, который на определённой скорости летит в аутфилд.

Если он летит прямо на аутфилдера, которому даже полшага делать не нужно или прямо в дыру между аутфилдерами, где его никто не сможет поймать - это удача.
Если его можно было бы поймать, но он ударяется в "Грин Монстра" - это стадион.
Если он летит так, что хороший защитник может его поймать, а плохой не может - это защита.

Тут ничего не пересекается, и именно в таком ключе рассматривали эти варианты Танго сотоварищи. Точной методики расчёта я тоже не знаю, но это, собственно, и не особо важно - пусть будут цифры 40-20-10-30 или 30-30-30-10 или 50-20-15-15 или как-то ещё, это ничего в глобальном плане не изменит. Чисто иллюстрация, никто же не утверждает, что это 100% правильный ресёрч и 100% верное заключение.

kgbaseball

8 февраля 2015, 09:02

поддерживаю, спасибо! лично я давно и сразу воспринял теорию Вороса, и мне кажется ничего крамольного в ней нет.но по сути у меня два комментария:1-как и предыдущий пользователь немного не доверяю порядку цифр (процентов влияния). И оказалось что правильно делаю-они достигнуты опытным путем/наблюдениями/вычислениями?Там есть еще пространство для управления-когда шифты или просто опыт или чутье переставляют защитников и линии (русскоязычный термин того что называешь лайнерами) попадают прямо в руки?
и 2-ты знаком с кем лично и наблюдал ли вживую работу скореров во время игры?ты прав что вопрос 10-й и они все же делают иногда ошибки "(зачастую ошибки весьма субъективное мнение скорера, не говоря уже о том, что после ошибки скорер часто должен восстанавливать иннинг как ему кажется, он бы развился без ошибки, и т.д.)", но в целом руководствуются правилами игры разделом 10 и своим немалым опытом. Наверное встречаются и среди них самовлюбленные идиоты но вообще-то я не видел более серьезных людей на работе чем скореры и пилоты.Т.е. пост про то что ERA пусть и архаичная задумка, но даже на сей момент ничего тупого и отсталого нет-попытка опереться на то что уже произошло, в реальности.
ЗЫ: и еще, не понял вот тут оборота про суть игры питчера "был введён для того, чтобы разграничить раны, которые выдал питчер из-за своего плохого перфоманса, и раны, которые ему "помогла" выдать защита." А есть раны которые питчер пропускает в силу противостояния сильным бьющим? С плохим перфомансом в МЛБ не играют, там максимум показывают. и та же защита упирается и ложится костьми что не "помочь ранами" а наоборот предотвратить их. В этом же и смысл игры защиты?

8 февраля 2015, 15:04

Ответkgbaseball

1. Они были достигнуты путём очень сложного вычисления, но больше конкретизировать не могу - в статье, откуда я их взял, описанию метода был посвящён только один абзац, переполненный статтерминами настолько, что я практически нифига не понял :) Но, как я уже сказал - цифры это просто иллюстрация, вряд ли даже сам Танго считает, что они 100% правильные, иначе в FIP добавил бы какой-то коэффициентик, отвечающий за эти 28%.
2. Я ничего против конкретно скореров не имею - они добросовестно делают свою работу, но их работа дурацкая и бессмысленная, плюс человеческий фактор присутствует в любом случае, так как есть спорные моменты насчёт ошибок.
3. Так это сейчас защита так ложится костьми, и ошибок мало, и вообще уровень очень высокий, а когда ERA вводили, тогда и перчаток нормальных не было, не говоря уже про уровень защиты. Вот и ввели ERA, чтобы убрать фактор этих многочисленных ошибок.

8 февраля 2015, 20:16

Ответnavarra

спасибо за дипломатию, полемизировать долго не буду.
скажу что от себя бы поставил на везение 25%, влияние качества защиты (с грамотным управлением)-40%, внешние факторы(поле и пр.)-10%, оставшиеся 25%-влияние самого питчера(особенно как защитника).
Сам я только одного скорера МЛБ знаю близко, и он наверное самая одиозная фигура и именно славится своим чудным определением. Но это где-то 0,1% от всех решений. Так остальные то гораздо академичнее, т.е. погрешность очень незначительна. упоминают Танго сотоварищи-правда, факт имеет место, но это уже точно менее влияние ветра во время игры.А вот наш давний спор про виртуальное интерполирование событий игры тут как раз и находит свое законное место, в ERA.Так что тогдашнее упрямое непонимание теперь получило объяснение, для меня ИМХО.
и про п.3-я не поддержу, извини. Я из тех кто уверен что нынешнее киевское Динамо по всем статьям проиграет составу 80-х. Пару блогов ниже видел скаутскую карточку Эрни Бенкса, сам писал про Тони Гвина-хорошие игроки были всегда.Ловушки/щитки/маски лучше-факт. Сам не раз наблюдал как в матче МЛБ ктото сачкует, но это все видят, понимают и пытаются перебороть., и так было всегда.
В целом же поддержу насчет подсчета и использования BABIP-за несколько лет действительно легко считать(в отличие от других статистических саберметрик) но и трудно прогнозировать.

9 февраля 2015, 23:38

как то криво и притянуто все вопросы поставлены, обычно журналисты так умеют, нагнетая и в поиске жареных фактов.
Я признаю существование например мяса, но есть его или нет,-решу сам и потом могу сам же изменить свое решение. сама идея учитывать и сравнивать чисто питчерские показатели-хороша. показатель FIP мне понятен, но смущает некая эмпирическая константа FIP = ((13*HR)+(3*(BB+HBP))-(2*K))/IP + constant и коэффициенты при показателях. И потому я использую BABIP. Судить что оптимально для оценки игроков МЛБ-мне это не нужно, тут я потребитель.
при всем уважении к создателям "новой" волны статистики, я считаю ссылки на человеческий фактор у скрореров детским лепетом, т.е. вообще недостойной упоминания погрешностью. а вот гневное ожесточение при реализации самой идеи "экстраполирования" при подсчете ERA,т.е.отталкивания от реально произошедших событий-теперь у меня в голове нашло реальное объяснение.понятно!

10 февраля 2015, 00:16

Прицепились вы к этому "человеческому фактору". Если поискать, можно легко найти десятки спорных ситуаций 50/50 (ошибка/хит), которые решают скореры путём "пальцем в небо". И это уже человеческий фактор.

10 февраля 2015, 07:37

там в правилах все описано и эта ситуация 50/50 тоже. скореры обычно все по правилам делают. а можно про константу и коэффициенты свое видение выложить? что человеческий фактор я уже свой вывод сделал

Комментарии