因為有人問到這個問題,來談一下參雜了太多變數的防守和防守數據。

由於棒球是個太過於複雜且精細的運動,雖然Sabermetrics已經相當發達,還是有許多地方是有很大的進步空間,尤其以防守的優劣最是難以評斷。現在也越來越多人開始對一些防守數據有認識,不過有些人在使用這些數據的時候會給人太過於相信這些數據的感覺,不是說防守數據沒有用,但是我們必須要知道,這些數據當中其實是有很多因素都可能導致結果的偏差,數字呈現的結果可以給我們一個參考,某些狀況下也的確可以幫助我們判斷一些球員的防守優劣,但是我們還是必須要記得防守數據的的準確性是比較低的。這裡我稍微談一下防守數據之所以不夠可靠的一些原因:

1.投手與防守的交互作用
投手和防守之間的關係一直以來都是sabermetrics最頭痛的一個問題,一個球是出局還是安打,投手和防守的能力都有可能產生影響,同樣的一顆落地的外野飛球或者穿越的內野滾地,如果投手讓這球被擊出的強勁程度降低一些或者改由一個守備範圍較大的野手來守都可能讓這球變成出局。因此究竟一個球會形成安打,我們分別要把多少責任歸咎給投手和野手,是無法認定的一個問題。雖然一些play by play資料紀錄的精細程度已經越來越高,但是仍然不可能做到把所有的參數都記錄到最仔細,目前的紀錄大概只將一個球非成高飛球、平飛球、內野飛球、滾地球等型態,再加以紀錄每個球的方向、距離、強勁程度(強、中、弱)等等,但是靠這些參數我們並不能準確地得到每個球的守備難易度,而只是一個近似值,即使透過了各項校正,例如打者的handedness、球場校正、出局和跑者狀況等,仍然有一些因素是我們沒辦法考慮進去的,例如當時的天候環境(風向、風速、草長、泥土硬度等),而且有許多球的結果其實並不單純是守備員能力和play困難度的函數,棒球場上有太多特別的狀況會發生,像球打到壘包,守備員受到跑者、觀眾或其他野手的影響,野手心理上的選擇差別(例如抓哪個壘包或是否cut等),跑壘者心理上的選擇差別(是否推進、如何滑壘等),都是會影響一個play結果的因素,有時候一個較好的防守反而會導致較糟的結果,反之亦然,也有可能是一個精彩的跑壘讓一個精彩的守備白費了或者反過來,但是這些東西在數據上是顯現不出來的,因此防守數據並不能有效反映出每一個守備play的難易程度。

2.守備的人為因素
常看比賽的球迷應該都對Williams(Bonds、Giambi、Ortiz、whatever)-shift相當熟悉,這當然是一種比較極端的守備陣式,但其他的打者打擊時,野手的站位仍然會依照打者的習性不同而有所調整,最基本的就是左右打者的站位差異,這只要自己有打過一定程度以上的球隊的話應該都會有經驗。也就是說,即使是同樣的一個球,由Big Papi打出來的和由Sheffield打出來的守備困難度是有很大差別的。但這個守備站位的調整,有時候是來自野手自己的判斷,有時是來自教練團的指示,也就是說這並不完全是野手本身的能力,但是這部分在數據上也是沒有辦法將之做出區分的。另外影響守備好壞的另一個因素就是防守者的first jump,因此我們會說防守最重要的不是最後一步而是第一步,而一個好的野手不只是有好的第一時間判斷和起步,還會在球被打出之前預先啟動,而這個預先啟動是根據投手要投的球來決定的,而如果投手的控球不好而沒能夠準確地投出原本預期的球可能會導致野手的預先起步產生反效果,這也是另一個野手本身無法掌控的因素。而除了守備的站位和起步之外,野手之間的互動也是影響數據的一個因素,一個球被打出去之後,可能只有一個野手有機會來處理這個球,但也可能同時有兩三位野手都有機會來處理,例如一個角度很高的中右外野高飛球,就是中外野手和右外野手都可以來接,許多德州安打都是同時有三到四名野手都有機會來處理,在這些同時有多人都可能處理的情況下,最後仍然也只能有一個人直接來對這個球做出守備,假設是一個很難接的球,而有機會處理這個球的兩個人中,只有一個人有足夠的技術來接這球,那麼如果由他來接這球並成功接到,那另一個人守備能力的不足就被掩蓋過去了,但是如果最後是由另一個人來接卻沒有接到,那麼這名守備較好的野手的數據就可能被拖累了,或者球隊上存在這像Nap Lajoie這樣的ball hogger也可能會對數據產生一定的影響。

3.樣本數的不足
這部分也是防守數據上不小的一個問題,由於每個球場的形狀、氣候、環境都不相同,自然對守備的難易度也有影響,但是即使當我們在談打擊的球場效應,將所有的play集合起來時,都不算是非常足夠的sample size,更何況在看防守的球場效應時,我們還必須將每個守備位置給分開,更別提上面提過同樣需要校正的左右打、出局、跑者數等,如果把這些因素都分開,那麼我們剩下的樣本數根本不代表多大的意義了。而且在同一個球場的同一個位置上,有將近一半的時候都是由同一位選手來防守(主隊的該位置先發選手),也就是在我們的樣本中,有很大的一個比例都是來自於同樣的一個樣本來源,這同樣可能會讓我們的數字產生偏差。而當我們在看個人的防守表現時,由於樣本數的問題,運氣的好壞也可能對數字有相當大的影響,這些也都是影響防守數據準確性的一個因素。

4.投、捕的防守
防守數據已經夠不準確了,投手和捕手這兩個位置的防守數據更是很難有太大的意義,先說捕手,的確我們可以看捕手的狙殺能力,但是也不要忘了捕手的狙殺能力會受到投手相當大程度的影響,另外由於狙殺數據也與捕手所面對的跑者能力有關,所以這部分也和其他許多的投打數據一樣也可能會受到不平衡賽程的影響。而且捕手狙殺能力雖然是他防守好壞的一環,但不是全部,一個捕手接補投球、阻擋壞球、接補回傳球、處理短打球乃至於引導投手和配球等等也都是捕手防守能力好壞的一部份,但是這些東西不但也都會受到其他野手和跑者能力的影響,數字上也很難做出有效的表達。而投手也是一樣,一年下來投手要處理的球樣本數非常地小,而投手所要處理的球的困難度更難去加以量化,因為投手是距離打擊區最近的一個位置,他不像其他野手有一定的反應時間來改變自己的守備位置和方式,只能夠做出一個立即的反應而已。一個打在投手丘前反彈和打在投手丘斜坡上反彈的的球,處理的困難度是有很大差別的,同樣的,一個反彈球如果彈跳得比投手跳起來的高度稍微再高一點,就從不難處理的球變成投手不可能接到的球了。因此這兩個位置的守備數據,比起其他位置來說更難以準確反應守備員的能力。

因此,守備數據不是不能用,他們仍然具有一定的參考價值,只是不論我們使用怎樣的防守數據或者做出什麼樣的結論時,都必須要記得一件事:They could be wrong.

arrow
arrow
    全站熱搜

    andrenomo 發表在 痞客邦 留言(5) 人氣()