Statistiche sabermetriche
- Bhemont
- Rookie
- Messaggi: 784
- Iscritto il: 10/10/2014, 23:27
- MLB Team: St.Louis Cardinals
- 22
- 114
Re: Statistiche sabermetriche
Mi è venuta in mente sta cosa oggi... chiedo agli esperti se
a) è fattibile
b) è utile
Visto che Statcast riesce a tracciare il percorso/parabola delle flyball, si potrebbe effettuare un analisi che permetta di dire su un HR o un flyout in quanti dei 30 ballparks quella battuta sarebbe stata HR?
praticamente applicare un park adjustment piu accurato agli HR
a) è fattibile
b) è utile
Visto che Statcast riesce a tracciare il percorso/parabola delle flyball, si potrebbe effettuare un analisi che permetta di dire su un HR o un flyout in quanti dei 30 ballparks quella battuta sarebbe stata HR?
praticamente applicare un park adjustment piu accurato agli HR
-
- Hero Member
- Messaggi: 27484
- Iscritto il: 09/11/2006, 14:40
- MLB Team: New York Yankees
- NFL Team: St. Louis Rams
- NBA Team: Los Angeles Lakers
- Località: Brianza
- 13844
- 9850
Re: Statistiche sabermetriche
Sull'utilità non ne ho idea, ma la fattibilità mi sembra immediata(e piuttosto semplice da implementare): basta mettere la traiettoria su un campo cartesiano e vedere la distanza e in seguito vedere se questa distanza eccede o no le dimensioni dei ballpark.
- Bhemont
- Rookie
- Messaggi: 784
- Iscritto il: 10/10/2014, 23:27
- MLB Team: St.Louis Cardinals
- 22
- 114
Re: Statistiche sabermetriche
Wolviesix ha scritto:Sull'utilità non ne ho idea, ma la fattibilità mi sembra immediata(e piuttosto semplice da implementare): basta mettere la traiettoria su un campo cartesiano e vedere la distanza e in seguito vedere se questa distanza eccede o no le dimensioni dei ballpark.
Quello si, il dubbio sulla fattibilità riguarda piu i dati di Statcast, quanto siano accurati e se davvero traccino la palla lungo tutta la traiettoria perchè non bisogna considerare solo la distanza ma anche l'altezza della parabola (che poi parabola non è visto che c'è lo spin che impatta non poco).
- louis
- Senior
- Messaggi: 1210
- Iscritto il: 18/10/2007, 10:39
- Località: Lodi
- 11
Re: Statistiche sabermetriche
Bisognerebbe tenere conto anche dell'altezza del muro, o no?
-
- Hero Member
- Messaggi: 14686
- Iscritto il: 10/01/2007, 12:06
- 56
- 905
- Contatta:
Re: Statistiche sabermetriche
a livello puramente tecnico credo sia una cosa fattibile...
peraltro non escluderei che ci siano squadre che già abbiano sviluppato simulazioni e programmi software del genere...
ci sono una bella quantità di dati che hanno le squadre in più rispetto ai già forniti siti web...
nella NBA,per esempio,diverse squadre utilizzano un software che calcola con precisione la traiettoria ideale della parabola di tiro...al fine di capire se e come sbagliano i tiratori e poi migliorare il tutto con i membri dello staff tecnico specializzati nel tiro del giocatori
peraltro non escluderei che ci siano squadre che già abbiano sviluppato simulazioni e programmi software del genere...
ci sono una bella quantità di dati che hanno le squadre in più rispetto ai già forniti siti web...
nella NBA,per esempio,diverse squadre utilizzano un software che calcola con precisione la traiettoria ideale della parabola di tiro...al fine di capire se e come sbagliano i tiratori e poi migliorare il tutto con i membri dello staff tecnico specializzati nel tiro del giocatori
- Bhemont
- Rookie
- Messaggi: 784
- Iscritto il: 10/10/2014, 23:27
- MLB Team: St.Louis Cardinals
- 22
- 114
Re: Statistiche sabermetriche
il mio dubbio era più sull'utilità infatti...
per esempio sulla FIP avrebbe un discreto impatto penso
per esempio sulla FIP avrebbe un discreto impatto penso
- louis
- Senior
- Messaggi: 1210
- Iscritto il: 18/10/2007, 10:39
- Località: Lodi
- 11
Re: Statistiche sabermetriche
Per la FIP si dovrebbe anche considerare la zona di foul, perchè incide sui KBhemont ha scritto: per esempio sulla FIP avrebbe un discreto impatto penso
- Bhemont
- Rookie
- Messaggi: 784
- Iscritto il: 10/10/2014, 23:27
- MLB Team: St.Louis Cardinals
- 22
- 114
Re: Statistiche sabermetriche
louis ha scritto:Per la FIP si dovrebbe anche considerare la zona di foul, perchè incide sui KBhemont ha scritto: per esempio sulla FIP avrebbe un discreto impatto penso
Quello però inizia a diventare complicato.... devi allora tenere conto di:
- range di chi potrebbe fare la presa
- se uno va out su un flyball in zona di foul ma in un altro campo avrebbe continuato il turno, non sai come sarebbe finito
- louis
- Senior
- Messaggi: 1210
- Iscritto il: 18/10/2007, 10:39
- Località: Lodi
- 11
Re: Statistiche sabermetriche
Bhemont ha scritto:
- se uno va out su un flyball in zona di foul ma in un altro campo avrebbe continuato il turno, non sai come sarebbe finito
beh una probabilità in più di fare K (anzichè F5 o F3), anche perchè lo carichi di uno strike in più.
vero anche che tieni viva la possibilità di una BB o un HR (che ti peggiorano la FIP)
- Bhemont
- Rookie
- Messaggi: 784
- Iscritto il: 10/10/2014, 23:27
- MLB Team: St.Louis Cardinals
- 22
- 114
Re: Statistiche sabermetriche
louis ha scritto:Bhemont ha scritto:
- se uno va out su un flyball in zona di foul ma in un altro campo avrebbe continuato il turno, non sai come sarebbe finito
beh una probabilità in più di fare K (anzichè F5 o F3), anche perchè lo carichi di uno strike in più.
vero anche che tieni viva la possibilità di una BB o un HR (che ti peggiorano la FIP)
Il punto è che cmq in questo casodevi simulare affidandoti alla probabilità di K, BB o HR nella prosecuzione della PA anzichè affidarti a fatti reali.
-
- Hero Member
- Messaggi: 14586
- Iscritto il: 12/12/2005, 23:05
- 6
- 181
- Contatta:
Re: Statistiche sabermetriche
Bhemont ha scritto: Visto che Statcast riesce a tracciare il percorso/parabola delle flyball, si potrebbe effettuare un analisi che permetta di dire su un HR o un flyout in quanti dei 30 ballparks quella battuta sarebbe stata HR?
praticamente applicare un park adjustment piu accurato agli HR
Certo. Hit Tracker Online lo fa e lo fa da anni. Ovviamente lo fa con molta più accuratezza ora che ci sono questi dati.
Loro ti pubblicano la "distanza reale", e poi standardizzano anche il risultato (valutano quale sarebbe stata la distanza percorsa a 70 gradi Fahrenheit, senza vento ed al livello del mare) e poi, con l'overlay degli altri stadi, ti dicono in quanti campi sarebbe uscita. Se scrolli verso il basso, c'è la lista di tutti i fuoricampo della stagione, e l'ultima cifra a destra (# Parks) dice in quali campi sarebbe andata fuori.
Molti escono in tutti e 30 i campi, ovviamente. Alcuni in molti meno. Per altri ancora troverai persino "0": vuol dire che, in condizioni "normali", senza vento ed al livello del mare, quella palla non sarebbe uscita da nessuna parte. Ergo, se è uscita, vuol dire che è stato per fattori atmosferici particolari in un campo magari a sua volta particolare.
Se non sbaglio valutano tutto... quindi per fare un esempio con Fenway: una palla che va velocissima a sinistra, ma non si alza troppo, è considerata un "no HR", mentre una flyball alta, anche se non troppo lunga, è considerata HR, proprio perché col muro è così. Il muro toglie dei fuoricampo (trasformandoli in doppi), ma regala anche doppi (soprattutto questi ultimi) e qualche HR su quelli che invece sarebbero flyout in altri campi.
- Bhemont
- Rookie
- Messaggi: 784
- Iscritto il: 10/10/2014, 23:27
- MLB Team: St.Louis Cardinals
- 22
- 114
Re: Statistiche sabermetriche
rene144 ha scritto:Bhemont ha scritto: Visto che Statcast riesce a tracciare il percorso/parabola delle flyball, si potrebbe effettuare un analisi che permetta di dire su un HR o un flyout in quanti dei 30 ballparks quella battuta sarebbe stata HR?
praticamente applicare un park adjustment piu accurato agli HR
Certo. Hit Tracker Online lo fa e lo fa da anni. Ovviamente lo fa con molta più accuratezza ora che ci sono questi dati.
Loro ti pubblicano la "distanza reale", e poi standardizzano anche il risultato (valutano quale sarebbe stata la distanza percorsa a 70 gradi Fahrenheit, senza vento ed al livello del mare) e poi, con l'overlay degli altri stadi, ti dicono in quanti campi sarebbe uscita. Se scrolli verso il basso, c'è la lista di tutti i fuoricampo della stagione, e l'ultima cifra a destra (# Parks) dice in quali campi sarebbe andata fuori.
Molti escono in tutti e 30 i campi, ovviamente. Alcuni in molti meno. Per altri ancora troverai persino "0": vuol dire che, in condizioni "normali", senza vento ed al livello del mare, quella palla non sarebbe uscita da nessuna parte. Ergo, se è uscita, vuol dire che è stato per fattori atmosferici particolari in un campo magari a sua volta particolare.
Se non sbaglio valutano tutto... quindi per fare un esempio con Fenway: una palla che va velocissima a sinistra, ma non si alza troppo, è considerata un "no HR", mentre una flyball alta, anche se non troppo lunga, è considerata HR, proprio perché col muro è così. Il muro toglie dei fuoricampo (trasformandoli in doppi), ma regala anche doppi (soprattutto questi ultimi) e qualche HR su quelli che invece sarebbero flyout in altri campi.
Bel lavoro!
Però è solo una faccia della medaglia, ossia gli HR. I flyout che in alcuni Ballpark sarebbero stati HR qui non vengono trattati.
Ora mi resta il dubbio sull'utilità, sai come vengano poi usati questa dati?
-
- Hero Member
- Messaggi: 14586
- Iscritto il: 12/12/2005, 23:05
- 6
- 181
- Contatta:
Re: Statistiche sabermetriche
Bhemont ha scritto: Però è solo una faccia della medaglia, ossia gli HR. I flyout che in alcuni Ballpark sarebbero stati HR qui non vengono trattati.
No, infatti, perché il sito è nato tracciando solo gli HR, visto che quelli potevano essere individuati in base al punto di arrivo. Ora ci sono altri dati con StatCast e magari faranno altri. O magari no, perché a molti interessano solo gli HR.
Ora mi resta il dubbio sull'utilità, sai come vengano poi usati questa dati?
I Diamondbacks tanti anni fa presero Kelly Johnson dopo una brutta stagione ad Atlanta dopo aver analizzato che tanti suoi flyout sarebbero diventati HR, e traducendo il suo rendimento da campo a campo. Potete vedere voi stessi le statistiche del primo anno in Arizona...
Ogni squadra lavora per conto suo, quindi è difficile dire cosa facciano le 30 squadre.
-
- Hero Member
- Messaggi: 14586
- Iscritto il: 12/12/2005, 23:05
- 6
- 181
- Contatta:
Re: Statistiche sabermetriche
markmig ha scritto: Quando mi dimostrano che se il sample e' abbastanza ampio non
esiste la "clutchness" (stesso BA in Regular e Playoff) io posso anche
cambiare idea (anche se preferito' sempre Ortiz alla battuta nei
playoff)
Perfetto, allora credici anche per le altre statistiche, perché nel lungo termine è così. Dopo quante PA si stabilizza la BABIP? Dopo quante si stabilizza la BA/RISP?
Per esempio sappiamo che la K% di un battitore tenda a stabilizzarsi molto in fretta, addirittura dopo 60 PA è già piuttosto affidabile.
La BABIP? Servono 820 palle in gioco (non PA, ma palle in gioco!), ossia più di una stagione completa. Ergo, non si stabilizza mai a livello di squadra. Sei preda piuttosto della casualità. Per i lanciatori è persino peggio. Puoi leggere qui.
E' frustrante, perché tutti vorremmo razionalizzare certe cose. Ma ci sono certe cose che sono prede del caso e basta. Tu puoi controllare certi fattori, ma non altri, nel corso della tua carriera. In ogni caso è chiaro che i battitori, almeno sulla BABIP, abbiano un controllo molto superiore rispetto ai lanciatori (come si vede dal link, più del doppio).
Tu dici:
Ma se nel 2015 i Red Sox hanno la peggiore BABIP in attacco e
i lanciatori concedono una delle più alte BABIP tra tutti i team MLB
(e siamo gia' sul migliaio di AB... non pochi. come random noise
hai un errore del 3%)
No. Come detto, per ogni singolo battitore non raggiungeremo la threshold di stabilità. Non è che se una cosa non ti piace (nel caso specifico: il fatto che la BABIP sia determinata fortemente dal caso) puoi decidere arbitrariamente che sia indicativa di abilità. Entro fine stagione molti battitori si riavvicineranno alla grande ai loro standard reali. Per i lanciatori boh.
Al momento, come detto, i Red Sox sono in territorio "storia". Però ho l'impressione, e forse sbaglio, che tu creda che anche negli anni scorsi ci sia stata una bassa BABIP (ed infatti hai parlato di sample size che include la stagione scorsa). Non è vero: hanno avuto .297 l'anno scorso. L'anno scorso hanno battuto poco non certo per una bassa BABIP, ma perché, semplicemente, erano pessimi.
I Red Sox poi giocano a Fenway, che è un campo che alza naturalmente la BABIP (anche se non al livello attuale della loro rotazione). Cosa influenza la BABIP?
- Il foul ground: più territorio di foul c'è, più prese al volo lì ci saranno, abbassando la BABIP (ed anche i K, le BB, i fuoricampo, più o meno tutto). Questo è il caso per esempio di Seattle o Oakland. Fenway praticamente non ha foul ground, quindi aumenta K, BB e BABIP.
- Le dimensioni. I campi più grandi trattengono più palle al loro interno, quindi invece di essere HR diventano flyout, abbassando la BABIP. Fenway ha il muro che trasforma flyout in doppi (a volte anche HR in doppi, ma anche questo paradossalmente alza la BABIP).
- L'altitudine. Più si è in altura, più "leggera" è l'aria, quindi la palla penetra alla stragrande. Coors Field è grande ed ampio, ma per questo fattore è un campo che aiuta mostruosamente BABIP e HR, infatti i Rockies sono sempre fra i primissimi, anche quando fanno schifo. I Padres soffrono del problema opposto.
- La temperatura, il vento, ecc, ecc... ma questi sono più variabili fra i campi (specie visto che in molti casi estremi si può chiudere il tetto e buonanotte).
I Red Sox dovrebbero avere una BABIP relativamente robusta per costituzione (ed infatti storicamente è così, a prescindere dalla produttività offensiva: anche con Valentine la BABIP è stata alta), ma l'anno negativo può succedere. Se tiri un milione di volte la monetina, avrai dei periodi di 50 teste o 50 croci in fila, semplicemente perché succede.
Dici di ritenere la BABIP sintomo di bravura. Perfetto. Allora facciamo così... prendiamo dal 2004 ad oggi (incluso il 2015): in questo maxi-periodo, quali sono le squadre con la BABIP più alta? E quelle con la BABIP più bassa? E quali sono le differenze? La risposta può sorprendere...
Al 1° posto ci sono i Rockies, con .313. Nessuna sorpresa. Poi? Tigers, Red Sox, Cardinals, Royals, Marlins. Ci sono squadre fortissime e squadre che hanno fatto schifo in questo decennio e passa. I Twins sono al 12° posto, davanti agli Yankees. Agli ultimi 5 posti? Padres, Mariners, Blue Jays, White Sox e Athletics (.289). Ci sono meno di 20 punti fra Red Sox ed Athletics, tanto per dire quanta differenza esista su 10 anni. I Giants con 3 titoli sono al 20° posto.
Come pitching? Al 1° posto ci sono i Rockies. Poi? Royals, Twins, Pirates, Indians, Marlins. Le ultime 5? Cubs, Dodgers, Padres, Giants, Athletics (i Mariners sono al sestultimo posto di .001). I Red Sox sono messi benissimo: hanno una BABIP contraria di .010 punti migliore rispetto a quella offensiva. Non è niente (in un decennio!), ma è tantissimo. Fra il 2° ed il 29° posto ci sono .015 di differenza. La squadra col miglior differenziale? I Cardinals con .013. Quindi si... diciamo che in più di un decennio iniziano a vedersi gli effetti del controllo della BABIP a livello di squadra e della differenza qualitativa. E la migliore... mostra .013, che è letteralmente nulla (non te ne accorgeresti mai di persona).
Nel singolo anno, non puoi fare veramente nulla. Puoi pregare, suppongo, che non tocchi a te. Se ci metti un decennio per vedere un granello di sabbia, come puoi pretendere di vedere e razionalizzare qualcosa nel corso di una stagione (anzi, di un mese e mezzo)?
...e di solito non tocca a nessuno a questi livelli. Individualmente si. C'è gente che è sfigata tutto l'anno. Ma a livello di squadra di solito c'è un certo bilanciamento fra "fortunati" e "sfortunati". I Red Sox però come detto hanno solo Holt (.383) e Sandoval (.353) fuori linea in senso positivo (ok, c'è Masterson che è 2/2 con le BIP, ma lasciamo stare). Poi ci sono Bogaerts e Pedroia in media, e tutti gli altri in bassissimo, con ben 6 battitori a .200 o meno. Alcuni possono essere ipoteticamente comprensibili, altri proprio no. Prendiamo il caso di Hanley Ramirez.
A livello individuale c'è più controllo che a livello di squadra, perché oltre al campo interferiscono anche le caratteristiche individuali. Chi tende ad avere una BABIP alta nel medio e nel lungo termine? Battitori destri con potenza, fra gli altri. Perché? Perché "tirano" con forza la palla verso 3B e SS quando la battono per terra (e coi Red Sox c'è anche il muro sulle flyball) ed è più difficile produrre un out, rispetto a 2B e 1B. Gente come Manny Ramirez e Derek Jeter (ed oggi Mike Trout) ne beneficia. Se hai anche velocità ed inserisci qualche infield single, pure meglio. Beh, Hanley Ramirez quest'anno sta guidando l'MLB per "exit speed", ossia la velocità con la quale la palla parte dalla mazza, cosa mostrata anche dai suoi 10 HR prima dell'infortunio. Sta colpendo la palla più forte di chiunque altro, in più gioca in un campo col muro, ed è un battitore destro con potenza. Non è veloce come in gioventù, ma non è Ortiz. La sua BABIP? .219.
Lui non è un'eccezione alla "regola" dei battitori destri con potenza. Ecco la sua BABIP anno per anno:
.343, .353, .329, .379, .327, .275 (SSS: solo circa 280 BIP), .290, .363, .323. Molto variabile di anno in anno, come è normale, ma .331 di media in carriera e sempre una tendenza verso l'alto. E quest'anno, in cui sta demolendo la palla, ha .219. Perché? Perché succede. Mike Lowell nel 2005 ha avuto .248 BABIP, l'anno prima .298 e l'anno dopo .287.
Ed è lo stesso per la BA/RISP (o OPS/RISP, o quello che vuoi). Sempre Mike Lowell nel 2004 ha avuto una OPS con RISP di circa 190 punti peggiore della sua OPS a basi vuote. Choker? Nel 2005 ha avuto una OPS con RISP di 12 punti superiore a quella a basi vuote. Nel 2006 è stato di nuovo l'inverso, per ben 50 punti. Nel 2007 di nuovo meglio con RISP che a basi vuote, di 180 punti. Insomma, a caso completo.
Ha chiuso la carriera con .841 OPS con RISP ed .801 OPS a basi vuote. Ah, quindi è clutch. No. Una volta che togli le 45 IBB con RISP (ne ha avute ovviamente 0 a basi vuote), le statistiche sono sostanzialmente identiche: ha anche avuto .477 SLG con RISP e .468 a basi vuote, una differenza a dir poco irrisoria.
Ma nelle singole stagioni? Differenze di 180 o 190 punti in una direzione o nell'altra, senza motivo. Di nuovo, di solito a livello di squadra certe cose non succedono, perché i giocatori si bilanciano fra loro. Se Hanley Ramirez va male, va bene Ortiz. Ma quest'anno non sta succedendo. Quest'anno, come per la BABIP, sta andando tutto a rotoli. Ma è solo un mese e non può durare. Se durasse, sarebbe roba davvero storica. E' probabile, visto l'inizio, che non ci sia una correzione al 100% (ci si può solo aspettare che le statistiche si normalizzino da qui in avanti, non certo includendo anche il passato, ovviamente), ed è quindi probabile che la BABIP e le prestazioni con RISP risultino deficitarie nel complesso della stagione. Ma da qui in avanti non vedo ulteriori motivi di essere pessimista. Le cose miglioreranno da quel punto di vista. Bisogna continuare ad avere buone PA e colpire la palla duramente, tutto qui. Alla fine le valide inizieranno a cadere.
- markmig
- Rookie
- Messaggi: 100
- Iscritto il: 09/11/2011, 14:59
- MLB Team: Boston RedSox
- NBA Team: Boston Celtics
- 1
- 3
Re: Statistiche sabermetriche
rene144 ha scritto:[
Perfetto, allora credici anche per le altre statistiche, perché nel lungo termine è così. Dopo quante PA si stabilizza la BABIP? Dopo quante si stabilizza la BA/RISP?
........
No. Come detto, per ogni singolo battitore non raggiungeremo la threshold di stabilità.




inteso come sventolo bandiera bianca!




A questo punto se fossi una persona ragionevole direi che mi avete convinto.
ma siccome non lo sono (altrimenti non avrei provato a trovare lavoro nella
ricerca in Italia e non sarei tifoso di uno sport che comincia all'una di notte

voglio provare a continuare a capire e a dare il mio contributo alla discussione
provocando e domandando.
Allora, mi e' chiaro che la BAPIP sia la statistica più soggetta al caso, e' quella
che richiede il sample largamente più ampio. Ma ditemi se sbaglio. Occorrono
820 palle in gioco (2000 per il lanciatore!!) perché si stabilizzi. Vuol dire che devo
aspettare molto per poterla usare in maniera predittiva. Ma se dico che
la BABIP dei red sox finora e' stata desolante sia in difesa che in attacco e la
uso per descrivere il gioco (pessimo) finora mostrato dalla squadra, non sto facendo
predizioni. Capisco che non e' sicuro che continuerà cosi' ma posso preoccuparmi?
Non sarò il perfetto sabermetrico ma la sto usando in modo ragionevole per giudicare
il rendimento della squadra.
E di conseguenza posso preoccuparmi di come e' stata assemblata/gestita
la squadra ora, anche alla luce dei risultati degli anni passati?

uhm, probabilmente mi direte di no.
Una cosa mi e' balzata agli occhi. Sapete come non mi sia mai piaciuto Craig in battuta.
Ramirez ISO .288 BABIP .213
Craig ISO .058 BABIP .176 (a cui aggiungere un bel 29% di K%)
Nel primo caso posso capire che Ramirez abbia avuto sfortuna
Ma se Craig non esce con le battute dal diamante (frase da tifoso becero
ma supportata da ISO se ho ben capito) la sua BABIP sarà di conseguenza
bassa specie se non e' veloce come Ichiro o stra-fortunato?
Quindi un poco la BABIP e' figlia di di incapacità e non solo e completamente
sfortuna?