Moneyball. Как математика изменила самую популярную спортивную лигу в мире | страница 67



Джеймс был эстетом. Но он был еще и прагматиком: если он натыкался на поломку, у него возникало желание ее починить. Но починить он мог только такую неисправность, для которой у него хватало инструментов. Значимость статистического анализа зависела от размеров выборки: чем больше выборка, с которой работал аналитик, с тем большей уверенностью он мог делать определенные выводы. Можно с меньшей уверенностью сказать об отбивающем правше, который из десяти выходов на биту против питчера-левши отбивал мяч два раза, что вероятность его отбивания против питчера-левши 20 %, чем если он выходил на биту против питчера-левши 1000 раз и отбил мяч 200 раз. Статистика по нападению, доступная Джеймсу в 1978 году, была достаточно всеобъемлющей и позволила делать осмысленные выводы. Огрехи в анализе статистики нападения можно было исправить. Огрехи в статистике защиты исправить было нельзя, потому что, как Джеймс объяснял в своей первой книге, для правильной, осмысленной оценки защиты не хватало данных. Питчерскую статистику не нужно было исправлять. Или, по крайней мере, так считал Джеймс.

В 1979 году в третьем, теперь ежегодном, издании «Краткого очерка о бейсболе» Джеймс писал: «Отбивающий должен оцениваться по тому, насколько успешно он добивается своей цели – а именно занимает новые базы. В голове не укладывается, когда думаешь, сколько путаницы возникает вокруг такого простого понятия. Я считаю непостижимым то, что, перечисляя результаты нападения, лига ставит в начале – этим подчеркивая важность – не ту команду, которая совершила большее количество пробежек, а ту, у которой самый высокий процент отбивания. Но ведь очевидно, что цель нападения вовсе не в высоком проценте отбивания». Так как очевидного в этом факте было немного, по крайней мере для людей, управлявших бейсбольным миром, Джеймс почуял в этом большие возможности. Какие очки приносили пробежки? «Мы не знаем, сколько пробежек между базами осуществляет каждый игрок нападения, – писал Джеймс, – но знаем, сколько таких пробежек есть у каждой команды»[54].

Джеймс решил построить модель, по которой можно будет предсказать, сколько пробежек заработает команда, если известно количество прогулок, хитов, украденных баз и т. д. Чтобы создать эту модель, Джеймс выуживал показатели, например, игр «Ред Сокс» в 1975 году. (Благодаря Генри Чедвику показатели прогулок для отдельных игроков сложно было найти в 1975 году, зато показатели прогулок, заработанных командой, были доступны.) Джеймс также мог узнать, сколько пробежек в тот год осуществила команда. Ему оставалось определить, насколько важную роль в конечном счете сыграли отдельные действия игроков «Ред Сокс» на поле и базах – иначе говоря, определить отдельный вес заработанных аутов, прогулок, украденных баз, хитов на первую, вторую базу и т. д. Конечно, решал Джеймс эту задачу без особой элегантности, использовавшийся им подход не имел под собой никакой научно-теоретической основы. Он заключался в том, чтобы перебирать разные сочетания показателей с правой стороны равенства, пока они не давали в сумме количество пробежек команды, стоявшее с левой стороны. Первая версия формулы, которую Джеймс назвал «Пройденные базы», выглядела следующим образом: