棒球和數據是分不開的,看棒球不可能不用到統計數字,數據能夠告訴我們許多事情,尤其在衡量過去的表現和貢獻時,數據是非常有用的一項工具,我們可以透過數據的比較知道去年球季誰比較有資格拿到MVP或賽揚獎,或者對球隊拿下冠軍貢獻最高的球員是哪些人。不過我們希望數字能夠告訴我們的不只有這些,我們想知道的事情太多了,也透過不斷地研究和分析來學習怎樣讓數字可以告訴我們更多我們想知道的東西,也因此出現了所謂的sabermetrics。sabermetrics發展到今天已經有一定的成就,我們也可以用各種各樣的數據和方法來評估各項球員的表現、貢獻、和能力,隨手一抓我就可以抓出一些大部分人連聽都沒聽過,更遑論懂得怎麼去使用的數據。但是一直以來我們最想要做到卻也一直是最難以做到的一件事,就是利用過去來預測未來。即使在統計和數據如此發達的今天,即使透過了各式各樣的研究和分析,我們對於球員未來表現的預測能力依然非常差勁。如果有人告訴你他有一套方法可以準確地分析並且預測出球員未來的表現,如果他不是來自未來或者另一個星球,那他肯定是在唬爛。

為什麼預測未來會是這麼困難的一項工作呢?第一,棒球是人在打的,而人是會改變的。隨著年紀、經驗、經歷、際遇、環境的改變,一個球員的體力、體能、身體狀況、技術、觀念、心態、運氣…等等都是不斷在變化的,這些變化都是讓我們無法掌握球員未來表現的原因。第二,既然有這麼多不斷變化的因素,我們如果想要有一定準確性地去預測未來,可以透過幾個方法,找出一些完全或幾乎是隨機性的因素(如運氣),將之排除在外,同時找出一些比較不容易變化的因素(如長打能力)作為預測的基準,並且將比較有跡可尋,也就是變化比較有系統性的因素(如年齡),並且找出其對結果的影響,來對結果作修正。

第一點是無法克服的問題,也不用多加討論。而第二點就是現在sabermetrics界不斷嘗試要做到的,怎樣從數據中分辨出哪些是具有重複性的球員的「能力」?而哪些則僅是球員本身對其不具有影響力的「外在因素」或者「運氣」?許多對棒球充滿熱情而且富有智慧的前輩已經在這方面做了許多深入的研究,也提出了相當多廣為人知的結論。但sabermetrics界大老Bill James日前發表的一篇文章—”Underestimating the fog(PDF)”—卻指出了相當重要的一點,我們不能把我們所得到的東西過份引伸,如果我們找不到某樣事物存在的證據,並不代表他不存在。這篇文章的標題來自於文章末端他所使用的一個譬喻:有一個守衛向霧氣之中眺望,試圖找尋有無敵人的蹤跡,他看了很久一段時間都沒有發現敵人的蹤跡,所以他去拿了一具相當明亮的探照燈照向霧中,結果仍然沒有看到敵人,因此他回報說外面沒有敵人。

儘管在直覺上,如果外面有敵人,拿強力探照燈照向霧中應該可以看到敵人的蹤影,但問題是,你很可能低估了這片濃霧,雖然你覺得你的探照燈夠強,但是實際上這片霧卻遠比你想像地來得更濃,濃到即使真的有敵人在那,你的燈光也沒辦法照到他。這就是我們現在所處的情形,種種研究分析的工具和方法就是我們的探照燈,而球場上各種因素的隨機性和變異性就是這場霧。許多我們沒發現的東西不代表他不存在,這就是為什麼我們在評估模式的適合度時,所能得到的結果僅是我們有或沒有足夠的證據來拒絕這個模式。如果沒有足夠的證據來拒絕這個模式不代表其為真,只是代表了我們沒有足夠的證據證明其為假而已。目前許多在年與年間的相關研究中我們找不到重複性和一致性的東西,都被視為「運氣」而不是球員的「能力」,但事實上卻未必如此。

Bill James在他的文章中舉出了九點過去我們透過這些研究和分析方法所結論出並不存在的東西,但這些結論不見得是真理,有可能只是因為我們所使用的探照燈不夠好而無法穿越重重的濃霧來找到他的存在而已, James在文章中也對這些結論分別提出了他個人的看法,下面是他所提到的九點結論和我的一些看法:

1.關鍵時刻打擊能力不存在
過去我們看過許多人透過了各種方法來分析和檢視,得到的結果就是我們找不到有所謂具有關鍵打擊能力的打者存在。但是事實上,或許關鍵打者並不是不存在,只是我們所使用的方法找不到他們而已。在研究關鍵打擊能力時,我們目前的研究成果受到一些很重要的限制:(1)具有關鍵打擊能力的打者數量可能不多。(2)所謂的關鍵打席的界定及其樣本數的貧乏。其中關鍵打者及關鍵打席在數量上的缺乏都會使得我們在年與年間的相關分析結果上被其他無關及外在因素的變異而完全給淡化,也就是我們想找到的訊息完全給淹沒在大量無關的隨機變數之中了。James也認為這一點目前仍是個open question,我們必須要找到更好的方法來研究這個課題。

2.投手沒有在防止失分外贏球的能力
這一點由於受到外在隨機因素更大的影響,樣本數更小,所以我不認為在這一點上我們能透過研究告訴我們什麼,我個人的意見跟James差不多,或許投手有少許在防止失分外贏球的能力,但即使有也是相對來說極低的。

3.球隊沒有贏得比分接近比賽的能力
同2.。

4.捕手沒有改善投手表現的能力
我並不同意這項說法,而我們現在所使用的方法完全找不到捕手有改善投手表現能力這一點我認為是很正常的現象,首先在研究中有許多投捕搭檔僅有不到50局的搭配局數,在這樣少的局數中,投手的ERA受到隨機因素的變異太大了,根本不是什麼太具參考價值的樣本數。此外投捕之間有其特性的配合,適合搭配A投手的捕手可能跟B投手搭配就沒那麼適合。因此一開始我就沒有真正相信過這項說法。當然了,我也不是說捕手確實有改善投手表現的能力,只是我們目前還不能否定他而已。

5.投手不能控制被打安打的比例
當年Voros McCracken在Defensive Independent Pitching Stats這篇文章中提出的$H、BABIP、以及最後的DIPS理論,讓許多人都感到相當驚訝,投手對於被打進場內的球沒有太多控制能力,這個新觀念對大部分人來說在直觀上是相當難以接受的,但在看了McCracken及他人各種相關的分析和研究後,相信許多人(包括我在內)也開始越來越接受這樣的一個說法,不過這當中還有許多因素是我們尚無法掌握的,我們已經發現的確是有部分投手是具有將其BABIP控制在較低水準的能力。而且BABIP目前也僅能應用在一些偏離中央較多的樣本,來預測其往中央靠近時有較大的準確性,其他的部分還有賴更多的研究來發現。

6.球隊不能在盜壘之外靠跑壘來增進得分效率
這一點我沒有太多概念,但我想多多少少還是有的。

7.打者面對左右投手的打擊能力差別沒有個別的差異
這部分我以前也曾經談過,當時我也提到了這樣的狀況:” 有些右打者應該是存在 比一般人更高或更低的platoon ratio的,但問題是要如何去鑑別出這些打者來或 者要定出這些subgroup的criterion是很不容易做到的,所以這個理論我想跟DIPS是差不多的,it'll work, but not all that well”,當時我就覺得其實在這些研究當中勢必還有我們沒有掌握到的部分,而且也同樣有樣本數不夠的問題,我也一直都不太敢underestimate the fog。

8.打者沒有所謂的高低潮
I just don't buy it.

9.打者對前一棒次沒有所謂的保護作用
我不太敢肯定或否定這一點,我想後面的打者如果從Albert Pujols換成Christian Guzman,那勢必會有些差別的,只是這個差別的程度和會以怎樣的形式顯示出來我就不太敢肯定了,不過通常一名打者後面打者的能力很少會出現上面這一組這麼大的差別,更是很難找到一定的樣本數來分析,因此其實這一點我想不是很容易得出有意義的結論,也不會具有太大的實際應用價值。

總結來說,面對眼前的濃霧,我們應該要保持戒慎恐懼的心理,不能因為拿了探照燈照了幾下沒看到就認為外面沒有敵人,我們應該繼續尋找更強力的燈來搜尋,直到我們有充足的理由相信敵人真的不存在為止。James的這篇文章我認為相當有意義,後來在在BTN上有兩篇文章討論到了一些與Underestimating the fog相關的主題,James後來也對這兩篇文章的作者做出了一篇叫做”Mapping the fog”的回應,其中一名作者Phil Birnbaum也回覆了James的回應,相關的內容在這裡,有興趣的人可以自行閱讀。

arrow
arrow
    全站熱搜

    andrenomo 發表在 痞客邦 留言(0) 人氣()