About James' young talent inventory.

留言版有人問到這篇文章,其實我前兩天也稍微瀏覽過一下,不過沒有很仔細看,打算之後比較閒的時候再來看看,因為這只是一篇娛樂用的文章,並不是值得花時間鑽研的東西。這篇文章所使用的東西看起來是James放在他的Handbook 2008裡的新玩意,但是要知道寫書是要拿來賣的,所以必須要迎合一般大眾讀者,王力宏出片也是得弄幾首迎合主流的東西放主打,James的這個新玩意就像他以前的那些預測生涯成就的Bill James' favorite toys(or something like that)一樣,只是趣味性的東西,而這個young talent inventory可能也是為了賣書所想出來的新玩意,不然Handbook都沒有新內容那老客戶說不定興趣就沒那麼高了,當然不是說他這個東西很糟,對於一般對sabermetrics或者MLB不夠熟悉的球迷來說,這些東西還是值得看看來增進自己對MLB的認知的。

這一份新秀名單,我們可以把他當作一份大聯盟新勢力和其潛力的觀察名單,但其實排名本身並不具有多大的意義。至於為什麼排名不具有太大的意義,是因為James採用的方法本身就沒有太巨大的意義,不過再重申一遍,所謂的沒有太大意義是從stathead的實用角度出發,這份名單和文章或許是空閒時間值得一讀的有趣東西,但是把他放到sabermetrics的世界裡或者當成預測未來的依據,那就是垃圾一篇,因為第一,James採用的計算樣本(我不確定不過)好像是今年的成績,而一般對sabermetrics有概念的人應該都知道,單一年成績的用處可以用來評估該年選手的貢獻,但是用來預測未來的話代表的是什麼意義。撇開這一點,James計算選手價值的方法是RC加速度調整,如果對sabermetrics有興趣的人可以自己先想想問題出在哪再繼續往下看,用RC來表示選手的打擊貢獻總量當然問題不大,但是產率呢?如果是一個mid-season called up的rookie或者是搬東西被砸傷還是又洗澡滑倒之類而因傷缺陣容但並非injury-prone的球員那就會被underrated,另外用速度來近似一個選手的跑壘和守備貢獻,這是一個極端粗略的作法,當然這兩個東西本來就是我們無法準確評估的,只是用速度來粗估多半是個比現有方法更粗糙因此結果也多半更差的方法,不過剛好最近Michael Lichtman也在THT上討論這個相關議題,有興趣可以去看看。至於用speed score評估速度的問題那就不提了,因為目前這也大概是評估速度最好的方式了。除了用速度來推估守、跑價值的不準確性之外,忽略守位差異的問題(當然從另一個角度來說也可以當作守位差異也透過速度推估的部分處理過了,不過either way都一樣是大問題)那就更不用提了,目前為止提到的每一點都足以讓這個排名失去在sabermetrics上的意義,更何況全部放在一起。另外James用球隊的R/G和RA/G來做context調整倒是讓我不知道意義在哪,真的要說的話或許是該球員對該球隊的價值比重,至於這個作法有沒有意義和是否適當就看他原本想看的東西是什麼,我直觀上想不出來不過也不打算繼續想就是(如果有人知道或看過更詳細的內容的話歡迎提供指教)。最後一點則是James採用33歲作為計算基準,我不知道他為什麼選33不過我猜多半沒有啥特別理由,就只是他主觀認定的一個計算點而已,選用這個門檻本身沒有什麼大問題但同時也沒有什麼大意義,因為其目的就只是要給選手的age一個加分權重的計算基準點而已。

所以看這篇文章的時候,不能從sabermetrics的角度出發,就當作一篇有趣的棒球文章來讀就好,也不用太去鑽研計較他的方法,這對Bill James來說只是寫來玩玩的,並不是他的work。Namely, it's not a sabermetrics-caliber article, just enjoy it.

全站熱搜

andrenomo 發表在 痞客邦 留言(1) 人氣()