Still a long way to go. @ The Tornado

在sabermetrics的研究中，防守一直是最難以準確衡量的一環，不過一些數據分析的結果和Rafael Palmeiro都告訴我們，從scouting的角度來評價防守跟statistical analysis同樣有相當大的問題存在，許多sabermetricians也仍然努力試圖在這方面有所突破，不過從目前的狀態來看，我們還有相當長的一段路要走。

仔細看看現有的各種fielding metrics，當中的每一種我們都可以瞭解他背後的涵義和理論的基礎，但是不論是哪一種方法，在我們每提出一個這個方法會work的理由的同時，我們至少可以找出五個這個方法不能令人滿意的原因。在現今的防守評價方法中，沒有一種方法能夠真正stand out from others，我們必須要透過不同方法的交叉組合和比對參考，才比較可能得到較為接近事實的結論，而即使在不同方法的結果之間出現不錯的一致性，這些方法背後理論基礎的缺陷和限制又不得不使我們懷疑這個一致結果的正確性。

我先用幾個例子來看看如果我們試著透過數據分析來判斷守備優劣可能會得到的結果，假設現在是2002年冬天，我們要判斷以下這12名中外野手的防守優劣：Beltran、Cameron、Edmonds、Finley、Hunter、Jones、Kotsay、Lofton、Long、Singleton、Wilson、Williams。當時我們手上所擁有的只有三項數據：BP的rate、ESPN的ZR、以及Mitchel Lichtman(MGL)的UZR162，由於考量到這些fielding metrics的精確性問題，我們不理會實際的數值，只考慮相對的關係，也就是我們只看這12名球員各項數據的排名，我們會得到這樣的結果：

Player	Rate	ZR	UZR
CB	5	1	4
MC	6	2	1
JE	2	4	3
SF	4	5	6
TH	9	3	9
AJ	1	6	6
MK	8	9	2
KL	3	7	10
TL	7	11	12
CS	10	8	5
PW	12	10	8
BW	11	12	11

(CB for Carlos Beltran, and so forth.)

三項數據都告訴我們Williams是個糟糕的防守者，Wilson和Long也好不到哪裡去，Edmonds似乎是個不錯的防守者，然後呢？Beltran、Cameron、和Jones當中誰比較好？他們和Edmonds或者Finley比起來呢？Kotsay、Long、Wilson當中孰優孰劣？Hunter、Edmonds、Cameron、Jones等人是否真的deserve他們的金手套？這些問題的答案似乎不容易決定，如果我們把界限再放寬一點，把每兩個名次編一為組，給予A~F的等級，結果會變成這樣：

2002	Rate	ZR	UZR
CB	C	A	B
MC	C	A	A
JE	A	B	B
SF	B	C	C
TH	E	B	E
AJ	A	C	C
MK	D	E	A
KL	B	D	E
TL	D	F	F
CS	E	D	C
PW	F	E	D
BW	F	F	F

當中我們可以發現，即使我們把界限放到這麼寬，在三項數據中都得到同樣評等的僅有Williams。而有兩項數據達成共識的共有5人，其中僅有2人的第三項數據的評等跟達成共識的兩項只相差一等，也就是說，12個人裡面有9個人這三項數據的結果並沒有很好的一致性，我們也僅能比較出差距較大的球員之間的優劣，上面的問題當中有許多仍然是我們沒辦法回答的。

或許只看一年的數據不足以給我們足夠的資訊，也或許這一年的數據當中有什麼特別的問題存在，所以我們也來看一下他們前一年的表現：

2001	Rate	ZR	UZR
CB	A	C	E
MC	C	B	B
JE	E	E	F
SF	D	F	D
TH	A	C	C
AJ	B	D	B
MK	D	D	C
KL	F	A	A
TL	E	B	E
CS	A	A	A
PW	C	F	F
BW	E	E	D

That seems even more confusing. 2001年同樣是上面那4個人獲得金手套，但從表中的結果看來，Edmonds似乎應該把獎座交出來，而Singleton才是當中最好的防守者？Kenny Lofton在ZR和UZR中表現很好，但在Rate當中卻是墊底？Terrence Long的Rate跟UZR都不太理想，但ZR好像還滿喜歡他的？另一個跟之前同樣的問題，Beltran、Cameron、和Jones到底誰比較好？

OK，我們再往前一年，並且把這一年沒有守多少CF的Kotsay換成Cruz以補滿12人：

2000	Rate	ZR	UZR
CB	C	B	C
MC	C	C	C
JE	C	C	D
SF	E	F	E
TH	A	B	D
AJ	A	D	B
JC	E	D	F
KL	A	A	A
TL	F	A	A
CS	B	E	B
PW	E	F	F
BW	D	E	E

雖然這當中仍然有一些結果的不一致或者無法回答的問題，不過把三年合在一起看的話，我們可以觀察到一些現象並或許做出一些推論，例如2001年時34歲的Lofton可能稍有退步，不過可能不至於到像Rate所顯示的這麼嚴重，2002年時他可能又退步了一些。此外不知道是什麼原因，ZR總是比較不喜歡Jones而Rate則對他比較友善，UZR則介於兩者之間。2000和2001年時Edmonds可能身體還沒有完全恢復健康，也或許跟他還在熟悉Busch Stadium的環境有關，只是可能性比較不高。Williams則一直都是個糟糕的防守者，2000年的金手套多半只是他過去防守reputation的殘存效應。從這當中我們有時候就必須透過更進一步和更仔細的分析，來瞭解我們所想要知道的問題的答案。

從上面的例子中應該可以體會到，在評價守備上面，the more we know, the better we know. 如果只使用單一數據來作為判斷的依據的話勢必會產生一些問題，必須要透過不同數據間甚至不同時間點間數據的互相比對參考比較才比較有機會得到比較接近事實的結論。而現在已經不是2002年，防守數據也有了不少發展，我們接著以2003年的例子來看看，當有了更多的數據之後，能不能對我們有所幫助，我們一樣以中外野手為對象，除了一開始的12名球員當中扣掉已經比較沒有在守CF的Cameron、Singleton、Long外，再加上Bradley、Dye、Matos、Patterson、Pierre、Roberts、Wells，一共16人，一樣按照排名分組給予A~F的評等：

2003	Rate	PMR	ZR	UZR	+/-	Rng
CB	B	B	A	C	E	A
MB	D	B	C	B	D	C
JD	C	C	B	B	A	C
JE	A	C	B	D	C	A
SF	E	F	F	F	E	F
TH	C	B	A	C	B	B
AJ	B	A	E	B	A	C
MK	A	A	C	A	D	B
KL	B	E	D	C	C	D
LM	B	D	D	D	B	B
CP	E	E	D	E	D	F
JP	D	D	E	E	C	D
DR	D	C	C	A	B	E
VW	E	E	B	C	E	E
PW	F	D	F	E	F	E
BW	E	F	E	F	F	C

PMR:Probability Model of Range
+/-:Plus/Minus System
Rng:A number in the Fielding Bible, it's not the relative RF and the author didn't really explain what it is, so it's listed just for a referral

的確在有更多數據的幫助之下，我們可以透過更多的交互參考比對之下，去判斷數據呈現結果的合理性，例如所有的數據都告訴我們Jones是很好的中外野手，但ZR卻認為他是很差勁的防守者，這讓我們有理由相信在Jones身上，ZR對他的判斷是「歪掉」了的，而同樣的情形也發生Beltran的+/-系統身上。Hunter的評等則讓我們可以滿放心地說他是很不錯的一個中外野手，而Wells雖然ZR和UZR都說他是不錯的防守者，但是其他四項數據卻都一致認為他還離其他人有一段距離。Kotsay在2003及隔年所得到的良好防守評等或許可以將之視為這兩年當他在場上的時候，背傷的疼痛情形和帶來的影響可能比起去年來較不嚴重的旁證。至於Finley、Wilson、和Williams三個人的評等則讓我們相信他們是這些中外野手當中最歡樂的丸子三兄弟，另外Patterson雖然有很好的速度和防守評價，但當時還生澀的他很可能其實在防守上還有著較大的缺陷導致他並沒能夠表現出和他天賦相對的成績，使得他的評等可以讓他混在丸子兄弟中不會被人發覺。

雖然更多的數據讓我們可以更能夠透過相互的參考比對來幫助我們的判斷，進而增加我們得到接近事實的結論的機會，但是即使不同數據間有著很好的一致性，我們也不能就此武斷地認定是事實，畢竟如之前提過的，這些方法背後的缺陷和限制讓我們必須要懷疑結果的正確性，不過不同數據間的一致性的確是一個不錯的指引方向。只是未來我們在這方面追求的方向，還是在model的邏輯合理性以及考慮因素的完備性上面，例如在考慮外野手的守備範圍上，雖然batted ball type是一個很好的出發點，但我認為最理想的參數組合是方向、距離、以及飛行時間。因此在防守分析的驗證上，另外一個可能會被採用的方式是相數據呈現的結果與scouting的結果或者球員的reputation做比對，例如Tangotiger就在他的網站上了做了類似民意調查形式的球員防守能力意見調查，我們也可以將這項資料加入作為另一個參考比對的項目之一，但我想比較好的方法是將這類資訊放在分析之外來作為與分析結果的檢驗和比對，用以探究分析結果的合理性，而不要用這類資訊來直接影響我們分析的結果。另外之前雖然我們單純只是在試圖尋找不同數據之間的一致性，但其實這樣的作法是不夠好的，因為每種方法的優劣並不相同，例如我們幾乎可以滿肯定的認為UZR會是比ZR來得更好的一個fielding metrics，因此我們在考慮時應該比較傾向於以UZR的結果為基準，ZR僅作為輔助。同樣地，在更多方法出現之後，我們也必須盡量去探究各種方法之間的優缺點，來尋找更好的思考和處理方式，讓我們能夠準確更有效地看待這些數字。下面是2005年一些中外野手的防守數據，前面沒出現過的包括了Clark、Rowand、Sizemore等3人：

2005	Rate	ZR	+/-	Rng	PMR	Fan
CB	B	D	C	B	C	D
BC	A	C	D	A	B	E
JE	A	D	D	C	A	B
SF	D	F	F	A	F	F
TH	C	C	B	C	D	A
AJ	E	E	A	D	A	B
MK	C	F	D	E	E	A
CP	C	B	E	F	C	D
JP	F	D	E	F	E	E
AR	B	A	A	B	B	C
GS	C	B	B	D	D	D
VW	D	A	C	E	D	C
BW	F	E	F	D	F	F

Fan:The scouting report by the fans

最後，不論是這裡所談論的或者許多其他地方的防守數據分析，我們現在希望掌握的大致上僅止於守備範圍這一個環節而已，我們還必須要考慮到一個野手替球隊救下的每一個球其價值未必是相同的，例如一個中外野手沒接到他身前的飛球多半只是一支一壘安打，但如果他沒接到他身後的飛球則通常至少損失兩個壘包以上，同樣的情形也適用在一三壘手錯失的是壘線邊的球還是偏內野中間側的球上面。另外守備不只有接球，傳球也是防守重要的一環，此外正如同目前我們難以將投球和守備的表現加以分離一般，野手的防守表現好壞和隊友的表現好壞以及對方跑壘員的速度或策略也一樣是密不可分的，加上球場上一些戰術對守備造成的影響，都是我們在解決評價守備這個課題上的重重障礙，雖然這當中有一部份的議題已經有人在著手研究和試圖解決，也已經有了不少成果，但因為在各個環節之間都還有相當的缺陷，因此在整個守備評價的數據分析這條路上，我們的的確確還有很長的一段路要走。即使在評價防守這方面，數據分析的成果永遠沒辦法做到接近我們對打擊成績的瞭解程度，但仍然是相當有趣且值得研究的一個環節。

andrenomo

The Tornado

andrenomo 發表在痞客邦留言(11) 人氣()

E-mail轉寄

The Tornado

Andre's baseball blog

Still a long way to go.

歷史上的今天

留言列表

近期文章

最新迴響

熱門文章

文章分類

文章彙整

部落格文章搜尋

誰來我家

我的連結

ベースボールリーンクス

參觀人氣

QR Code

新聞交換(RSS)

The Tornado

Andre's baseball blog

Still a long way to go.

歷史上的今天

留言列表

近期文章

最新迴響

熱門文章

文章分類

文章彙整

部落格文章搜尋

誰來我家

我的連結

ベースボール リーンクス

參觀人氣

QR Code

新聞交換(RSS)

ベースボールリーンクス