Would things even out at current sample size?

以前我簡單談過一些為什麼守備數據可能不夠準確的原因,這裡我再談一些場上會導致一個play所產生的數據與實際守備員表現好壞產生落差的可能狀況:

1)守備佈陣
這點之前也提過,面對不同的打者或者不同的出局跑者數時,守備上會有不同的佈陣,例如當遊擊為了抓雙殺站得比較靠近或遇到打跑時去cover二壘時如果打者擊出原本正向遊擊或略偏三壘方向的滾地球,這原本可能只是一個平平無奇的滾地球就成了一支安打,該遊擊手在數據上也會被嚴重地懲罰,相反地如果打者這時打出正向二壘壘包或略偏遊擊的滾地球,可能就變成了一支雙殺打,這時他就會在數據上大大被獎勵,而受到獎懲的程度甚至會比完成一個高難度play還高出不少。而防守佈陣有時是野手自己的調整有時是來自教練團,這也是一個影響變因。

2)跑者影響
這一點有相當多的可能,基本的如一安一壘跑者衝三壘或飛球接殺跑者推進,跑者是否推進會受到出局數、比數、局數、本身速度等不同因素的影響,如果因為局勢的影響讓跑者或指導員決定冒險推進,而守備員完成了這個不那麼難的長傳刺殺,就會得到比跑者不冒險更多的獎勵,此外這種在看臂力的時候,一個深遠飛球和一個淺短飛球,一個滾地球和一彈跳或三彈跳平飛球,一個普通飛球和外旋飛球在數據上的結果都是相同的,但每個球在處理上難度都是不同的。另外內野手在處理球時如果剛好跑者在自己身邊,也會影響到處理的難度,這點在數據上也是不會顯示出來的。另一個可能狀況是跑者在一壘,打者擊出右邊滾地或低飛安打,跑者有時可能會因為閃避安打球而必須煞車或做出躲避的動作,這也可能會讓跑者失去了繼續推進的可能性,但這時野手就會因跟守備能力無關的因素而得到獎勵。同樣的狀況也發生在正向野手的強勁平飛安打或有可能被接到的軟飛球安打出現時,跑者必須hold住等確定落地再起跑,此時多推進的可能性就會大幅降低,野手也會因此而得到獎勵。另外基本的跑者速度也是,一模一樣的球一模一樣的處理,可能因為跑者的速度差異而有截然不同的結果,一個野手完美處理但Ichiro快一步半抵達的遊擊滾地安打換成McCann去跑的話野手可能在沒抓穩球而double clutch之後還把McCann刺殺在兩步之前。另外跑者滑倒啦、看錯啦、誤判啦、該滑壘不滑壘啦之類也都是影響因素之一。

3)接觸球時的守備難度
一個剛彈起來和彈到最高的球,一個野手必須向遠離傳球方向移動和接近的球,一個自己一個人接的球和兩三個人搶接的球,一個普通彈跳和不規則彈跳,在處理難度上都是有很大的差別的,但在數據上卻幾乎都是一樣的,因此完成或錯失一個位置類似但處理難度不同的球,在數據上得到的獎勵和懲罰是相同的。

4)野手人為決定
有時候因為受到情勢影響,例如比賽後段比數的領先落後和分數差,會導致野手有時必須要去做難度比較高的選擇,例如不殺輕易可處理的擊球跑壘員而冒險
去殺先頭跑者,這時如果沒能完成play,守備員就會被嚴重懲罰,而即使成功完成這個高難度play,守備員也僅能獲得跟刺殺擊球跑壘員一樣低程度的獎勵。

5)反彈影響
球場上不時都會看到投手試圖接球但最後僅僅碰到球但沒接到而改變了球的行進路線,而觸碰的方式也很多,可能是用手套、空手、迴旋踢或者被爆頭、爆卡撐等等,類似的狀況在二、三遊身上也可能看到,而球被改變後的行進路線就決定了後續處理的難度,可能是往無人地帶彈走的不可能處理球也可能是正彈向另一個守備員的簡單必死球,但在數據上這都是一樣的。

6)投手守備
球場上有一些球是僅有投手有機會處理的球,昨天在勇士釀酒人的比賽中就有出現一個,這些球一旦越過投手就會因為過於軟弱而形成必然的安打,但如果投手
成功處理掉的話後面的二壘或遊擊手就會因此而避免被懲罰。

7)燈光、陽光影響
這在球場上也不時能夠看到,當野手因為燈光、陽光影響而失去球的話,就會被極端嚴重的懲罰,可能多抓了兩個高難度的球都補不回來,但如果是一個有第二個野手也有機會處理的球而他並沒有失去球的視線的話,就又可以拯救第一野手不受到這個嚴重懲罰了。

8)撲接影響
一個失敗的撲接可能會讓球隊多損失好幾個壘包,但這額外的損失在數據上也不會顯現出來,所以假設有一個瘋狂撲球者每次有機會都狂撲,他可能會多接到幾顆球但是卻讓球隊承受更巨大的損失,但他的數據卻會比一個一般的防守者更好。

9)多人可能處理play
這在上面有提過一下,一個超過一個野手能處理的球,則各野手的守備數據會因為隊友的守備能力優劣而受到額外的獎勵或懲罰。

10)合作play和蝴蝶效應
這也是相當重要的一點,也跟第三點接球難度有點類似,球的位置或狀況的極小差異會造成處理難度上很大的差異,同時隊友的能力也會造成影響。最基本的例子就是一壘手的接球能力優劣會讓一些原本是失誤的球變成刺殺或者反過來,另外像雙殺時二壘傳遊擊傳到的位置如果是讓遊擊手必須喪失原本重心才接得到的球就會讓他進行後續play的難度大幅增加,或者在傳球者需要等待接球者進壘補位的狀況時,如果補位者不能夠比跑者提前到位,傳球者就必須提前傳出並計算力道,這時候出現差錯的機會就大得多,也就是需要多人完成的play當中,每一個人處理或動作的結果都會影響到後續或其他人處理球的難度。同樣的狀況在外野長傳殺跑者或者捕手狙殺盜壘者時也一樣,傳球位置的微小差異可能就是成與敗的差別,同樣的play一個胸部高度的傳球可能就是safe,一個膝蓋高度的傳球就是觸殺,甚至一個一彈跳也是觸殺,但一個膝蓋高度或一彈跳但打到跑者的球則也殺不到,或者偏左一點是觸殺但偏右一點卻是safe等等,但對外野常傳來說,傳球者在傳球之前目標都只是接球者手套附近那一塊面積的區域,並不會也不可能去想要打哪個點,最後的結果除了最準命中紅心的傳球以外都是random的結果,但是這些random的結果假設在程度一樣的狀況下卻會因為random的方向而導致不同的結果,但數據上這些都是看不到的,野手也會因此而受到這些跟守備能力無關或甚至傳越好數據反而難看的因素而受到懲罰或獎勵。

11)彈跳高度和軟弱度
高彈跳的高度是決定該play能否完成的重要因素,但彈10公尺和15公尺高的球在數據上都是一樣的。同樣的一個略微軟弱的滾地球和非常軟弱的滾地球也是能否殺到跑者的關鍵,但這兩者在數據上也是相同的。

12)雙殺與否
有些狀況會因為野手的處理好或不好而導致是否成功雙殺,可能是其中一人bobble或double clutch了一下或沒傳好之類各種原因,但雙殺不成的野手在turn balls into outs上並不會因此而受到懲罰,因為這個play仍然是一個有人出局的play,而成功的野手也不會因此得到獎勵,因為殺兩個還是一樣是完成守備。雖然在對二遊特別計算雙殺的時候會有些許影響,但計算雙殺能力的方法比普通守備數據本身問題更大,仍然無法顯示出場上真正的處理難度和情況,而其他野手則連這一點都不受影響。

13)額外選擇
在一些壘上有跑者的狀況下,野手會有額外的可能可以選擇,例如打到三遊間的滾地球,如果一壘或二壘有跑者向前推進的話,這在壘上無人時原本會是支內野安打的球就轉變成了野手選擇。或是一些平飛球野手勉強或飛撲去接沒接到但擋下,如果壘上無人那一樣會是一支內野安打,但如果壘上有需要強迫進壘的跑者時,跑者會因為必須確定球沒被接殺才能前進,這時候安打也會變成一個簡單的野手選擇。

14)環境因素
球場、風向、風速、溫度、濕度、泥土的乾濕、草皮的長短、日光的強度、方向等都有可能對很多play造成各種可能的影響,但數據上當然是不可能看得到這些東西,即使看得到也看得不清楚。

這是目前我一時能夠想到的一些可能狀況,也由於這種種因素有時候會有表現和數據結果不成正比甚至相反的狀況,加上守備和投手和球場都有交互作用,但一個野手有一半的時間都是在同樣的球場同樣的pitching staff之後工作,另外對手能力和球場的影響在採用不平衡賽程之後也產生了更大的影響,至於各個球隊、分區的投手能力、跑者速度都是年年在改變的,是否維持均衡或出現特別強或弱的分區沒有特別研究我們也無從得知。同時數據分析我們之所以希望有夠大的樣本數就是希望當中的noise能夠even out,但是這種種因素本身或者彼此之間在現有的樣本數之下能夠even out多少我們不得而知,這是我無法對守備數據有太大信任的原因之一,當然如果你認為這些東西在一季的樣本下有足夠的機會even out那你就可以對守備數據有較高的信心,但由於以一季的樣本數來說,多或少完成兩個play就會對整體績效排名造成不小的變動,因此除非是躺再平也可能中槍的某SS那樣不管左看右看上看下看橫看豎看,所有advanced數據都說他一樣糟的這種各系統間一致性非常好的case以外,我暫時是仍持懷疑態度的。但是所謂對守備數據或對pfx data對球路分類後的進一步分析結果的不信任並不代表他們沒有用,只是在看到任何結果或使用任何結果時,都要記住這個結果很有可能與實際情形有所出入,並不是看都不看就丟掉,只是在使用上要格外謹慎和保留。另外還有一個地方可以提一下的就是數據本身的可信度,BIS、Stats等公司究竟把他們的觀測員訓練到自己本身和彼此之間擁有多好的一致性我們也不知道,不過這一點我倒是願意對他們採取信任的態度,所以比較重要的還是noise的問題,而我們現有的守備數據計算方式並無法有效降低這些noise的影響,以外野飛球來說,如果要評估野手的防守績效,那最好的數據是球的用飛行時間和落地點,如果是要評估野手本身的防守能力,那就應該用飛行時間和野手初始位置和球落地點距離,但目前我們僅有球的落地點位置一項數據而已,或許未來有一天我們可以得到飛行時間這項數據,那就可以大大改善外野手range評估的準確度,但對內野手來說我暫時也想不出有什麼好方法了。

Therefore, on evaluating fielding, though we're on the right track, I think that we are not close enough yet.

全站熱搜

andrenomo 發表在 痞客邦 留言(5) 人氣()