Analyzing pitch sequence with sabermetrics? Not a good idea.

前幾天談的跑壘策略之後,最近The Baseball Analysts上另一篇Joe Sheehan的文章也吸引了我的注意,之前他已經對不同的變數來分析過投手使用速球比例的變化情形,這篇有點算是這系列文章的一個小relay,這些內容滿有意思,不過Sheehan這篇文章的標題"predicting pitches"和他在結尾部分提到的一段話我有些意見:

"If Josh Beckett is throwing 70% fastballs in a 0&0 count while other Josh Beckett-types (pitchers with three pitches and a similar quality fastball) are throwing 60% fastballs in that count, that could be very valuable. Those numbers are for illustration, but a discrepancy like that would be important"

配球這東西,是永遠沒有辦法用數據去分析的,為什麼呢?原因很簡單,一個小原因是在各種分析中常見的問題:變數過多導致樣本數永遠不足。不過比起真正的原因,這個問題根本不重要,之所以讓配球無法被數字所分析的原因是:在配球當中最重要的兩個和幾個次要變數是沒有辦法用數據呈現出來的,period。

先引用一段我好幾年前談配球的文裡的其中一段:
「在配球時可以供作參考的東西不少,一些基本的如投打的實力,投手和打者的優缺點,場上的情況(比分、局數、出局數、球數、跑者數等等),打者的型態、打擊心態及攻擊慾望,該隊的攻擊策略,之前遇到這名打者的配球策略和結果,面對前幾位打者或是前一輪的配球策略,但最為重要的一個配球依據則是這個打席裡前幾球對打者擊球心態造成的影響來做出因應,除了這些基本因素之外,甚至今天的場地狀況、風向,自己球隊的守備狀況等等有時候也都可能可以列入考量。而配球要配得好捕手一定要先掌握住最重要的一項因素是現在這位打者對現在這個投手的各種球路的掌握度,這是配球裡最為重要的一個大原則,其他各項配球參考因素都是以這個原則為基準來配合的。」

我前面提到配球中無法以數據呈現的兩個最重要的因素,就是這段話裡提到的"最重要的一個配球依據"和"配球中最重要的一個大原則",也就是這個打席裡前幾球對打者擊球心態的影響和打者對投手各種球路的掌握度。而其他的次要因素中,目前投手對各球路的掌握狀況、之前遇到該打者的配球、面對前幾位或前一輪的配球內容等等也是數據所無法呈現的。再引用一段另外一篇我談配球的文

「當一個打席開始之後,我們要開始配球之前,這些基本的原則和基調當然要掌握到,但這些只不過是背景知識,是一個大框架,你要做的動作雖然的確是被限制在這個大框架之中,但你真正要對之做出因應的,是來自於即時的資訊,而這些資訊從哪裡來呢?當然是從對手身上來的。」

所以不論數據分析做得再怎麼精細徹底,都不可能真正分析到所謂的配球。因為數據分析的變數只能分析到投打對決的背景基調,但配球真正的精髓,也就是從對方打者身上洩漏出來的即時資訊,卻是數據無法掌握的。而Sheehan所謂的"that could be very valuable",我不確定他是以什麼角度來說的,但應該是以球場上應對這些投手的角度出發的,若是如此,那這句話是錯的。如我前面提到的原因,投手下一球是速球的機率並不是光靠這些基調來決定,所以光由這些基調分析出來的結果是沒有任何意義的。除此之外,即使我們忽略這一點假設結果是有意義的,但一個投手在一個概略的情況下丟速球的機率是60%還是70%,有些時候對當時站在打擊區裡的打者是沒有多大意義的,這是所謂的"打者的兩難",除非你有辦法"確定"投手要丟什麼球,或者還有本錢去猜,否則50%、60%、70%其實對打者來說沒有這麼大的實際效用。在配球裡面,最嚴重的配球錯誤有兩種,一是配了絕對不該配的球,二是沒有配一定要配的球。第一種基本上就是被打者猜到配球或者當打者已經顯示出他在等待某球路時仍然配了給他,而第二種則是在一些狀況下,你只要這樣配的話,有時候是幾乎一定會抓到打者,最了不起是被擦棒,或者是抓到的機會很高而且還有壞球空間同時沒抓到也不會被打等等,而之所以會有前者這種幾乎一定會抓到的狀況有時候就是來自於這種打者的兩難。舉個簡單的例子,有時候打者明知投手丟外角變化球來吊他的機會不小,但是如果他不準備好攻擊速球而遇到速球的話那一樣是挫賽,所以他還是得做好打速球的準備,此時一個夠好的變化球仍然可以引誘到他,這種狀況我們在許多打者身上都可以日復一日年復一年的看到,如果你是長期Braves fan,我想你腦海中已經浮現出某個名字了。

因為這些原因,雖然Sheehan的這系列文章相當有趣,後續的文章也值得繼續看下去,不過sabermetrics跟"predicting pitches"之間,仍然是有一道無法跨越的鴻溝存在的。

    全站熱搜

    andrenomo 發表在 痞客邦 留言(0) 人氣()