Qui, per un saluto a franci

viewtopic.php?t=26435

Statistiche sabermetriche

Il Punto d'incontro dei Fans MLB di Play.it USA
Rispondi
rene144
Hero Member
Hero Member
Messaggi: 14586
Iscritto il: 12/12/2005, 23:05
6
181
Contatta:

Re: Statistiche sabermetriche

Messaggio da rene144 » 24/10/2007, 16:50

Con la sabermetrica si può fare tutto :papa:

A parte gli scherzi, parliamo dell'ordine del lineup...

Nel corso di una stagione, alcuni studi hanno dimostrato che l'ordine del lineup abbia un'influenza relativamente piccola sul rendimento di una squadra, attorno alle 2-4 W (che peraltro possono fare la differenza tra post-season e delusione, per carità). Secondo altri, per motivi pratici (prestazioni dei pitchers, prestazioni degli avversari) l'ordine può contare anche meno (o qualcosina di più).

The Hardball Times ha fatto uno studio, qualche settimana fa... ed a loro risultava che col roster a disposizione dei Cardinals (quindi è un discorso che non vale assolutamente in linea generale, ma è basato sulla schifezza messa in campo da St. Louis quest'anno), considerando le prestazioni dei pitchers, addirittura sarebbe stato giusto mettere i lanciatori a battere settimi!

Sono stati implementati vari lineup generators, che ottimizzano l'ordine a seconda delle caratteristiche dei singoli giocatori. So che David Pinto ne avesse uno, e mi sembra che anche Max ne abbia uno (o comunque ci ha fatto un giochino tempo fa). Questo avviene perchè non c'è una risposta giusta definitiva e dipende da cosa ci si aspetti. Il pitcher è Mike Hampton per esempio? E' uno che andrà al piatto FORSE una volta soltanto (classico caso di bullpen game programmato)? Quando pensi di far entrare i pinch hitters? Insomma, è grave fare generalizzazioni. Un generatore permette di contestualizzare l'uso dei giocatori, anche se pure quello potrà dirti cosa sia giusto a lungo termine e non nella partita secca.

Quello che invece è abbastanza certo è che ci sia un vantaggio inerente nel costruire una squadra mettendo come leadoff il giocatore con la migliore OBP, e poi a scalare tutti i migliori hitters. Ricordati che nel corso della stagione, più in basso gioca un hitter, meno turni di battuta avrà. Ci sono circa 20 apparizioni al piatto di differenza per ogni posizione nel lineup. In sostanza, se sistematicamente metti il tuo peggior hitter più in alto, a fine stagione avrà rubato apparizioni al piatto ad altri. E se da una parte è vero che sia conveniente mettersi in base per gli hitters successivi, da un'altra bisogna considerare che avere il pitcher ottavo diminuirà l'efficacia degli hitters 6 e 7. E quanto è forte l'hitter numero 9?

Ti faccio un esempio: quest'anno ci sono state 140 apparizioni al piatto di differenza tra il leadoff e l'hitter numero 9 dei Cardinals. Ovviamente uno vuole che i suoi hitters migliori vadano al piatto più spesso. Mettere il pitcher (se scarso) più in alto equivale a diminuire la qualità generale della squadra. In partite specifiche ed in situazioni specifiche è anche accettabile. In generale, no.

In generale le squadre sono ancora costruite col pensiero retrogrado di mettere velocità come leadoff, ed un battitore di contatto (magari bravo a mettere giù un bunt) come secondo, prima di andare dai migliori hitters. In realtà la migliore soluzione è quella di mettere OBP in cima e poi i migliori hitters a scalare, proprio per dar loro più possibilità di fare danno agli avversari.

Per riassumere un post estremamente contorto: si lavora con ciò che si ha. Non si può dire dove debba battere un giocatore se non si conoscono tutti i dettagli. In generale, è sbagliato mettere più in alto un hitter peggiore, perchè nel corso della stagione ruberà turni di battuta ed apparizioni al piatto a giocatori più forti ed efficienti. Forse è meglio se ignori tutto il resto che ho scritto e leggi solo questo paragrafo vista tutta la confusione che ho fatto :sbadat:

koufax75
Rookie
Rookie
Messaggi: 373
Iscritto il: 05/11/2002, 20:41
Località: Udine (Wales) - Klagenfurt (AUT)
Contatta:

Re: Statistiche sabermetriche

Messaggio da koufax75 » 24/10/2007, 16:59

René. Ne avrai sicuramente parlato, ma non ho trovato nulla in questo topic. Potresti brevemente introdurre alcuni sistemi per valutare i difensori? Ad esempio: fielding average e numero di errori spesso non danno un'analisi completa di un difensore. Una statistica interessante è il Range Factor. Ne potresti introdurre delle altre? :notworthy: :ok:
ImmagineImmagine
Max Giordan: adesso che ci penso: ma una foto normale tuo fratello ce l'ha? o sulla patente ha la foto sul cesso?
Dazed: Guarda che è Koufax!

Ange86
Senior
Senior
Messaggi: 2469
Iscritto il: 05/10/2005, 13:39
Località: Rivanazzano (Pv)
144

Re: Statistiche sabermetriche

Messaggio da Ange86 » 24/10/2007, 17:04

koufax75 ha scritto: René. Ne avrai sicuramente parlato, ma non ho trovato nulla in questo topic. Potresti brevemente introdurre alcuni sistemi per valutare i difensori? Ad esempio: fielding average e numero di errori spesso non danno un'analisi completa di un difensore. Una statistica interessante è il Range Factor. Ne potresti introdurre delle altre? :notworthy: :ok:
ZR e UZR dovrebbero essere altri due metodi di misura.Ma sicuramente Rene oltra a spiegarti le due che ho detto ne conoscerà altre  :forza:
Immagine Immagine

koufax75
Rookie
Rookie
Messaggi: 373
Iscritto il: 05/11/2002, 20:41
Località: Udine (Wales) - Klagenfurt (AUT)
Contatta:

Re: Statistiche sabermetriche

Messaggio da koufax75 » 24/10/2007, 17:06

rene144 ha scritto:
gettingup ha scritto: ciao Rene

per caso c'è qualche articolo (in italiano) che spiega la Sabermetrica, mi sono intrippato malamente.

In italiano purtroppo no. La traduzione "sabermetrica" peraltro è mia (dall'inglese sabermetrics) perchè documentazione in italiano non ce n'è. Il massimo esperto è sicuramente Max (il forumista, Prof. Pepper) che prepara roba anche sul suo sito, e poi... non saprei veramente dirti perchè in Italia già è seguito poco il baseball, figuriamoci roba del genere.
In questo forum, abbiamo due esperti di sabermetrica. Quando la post-season 2007 sarà finita, questi due simpatici personaggi potrebbero scrivere qualche articolo introduttivo per Play.it :gazza: :figo:
ImmagineImmagine
Max Giordan: adesso che ci penso: ma una foto normale tuo fratello ce l'ha? o sulla patente ha la foto sul cesso?
Dazed: Guarda che è Koufax!

Avatar utente
louis
Senior
Senior
Messaggi: 1210
Iscritto il: 18/10/2007, 10:39
Località: Lodi
11

Re: Statistiche sabermetriche

Messaggio da louis » 24/10/2007, 17:20

grazie per la risposta rene,
sia per la celerità che per l'estensione....mi ha aspettavo un si/no e invece....sono commosso!

Daccordissimo sul fatto che non si possa generalizzare, ma proprio con i Cardinals di quest'anno aveva un senso.
L' unico che non ha fatto schifo è stato Pujols( sotto i suoi numeri ma sempre stellare ) Duncan si è perso per strada (in esterno sono meglio io) e Ankiel per adesso è una meteora che ha brillato 3 sole settimane.

Credo che la logica sia stata quindi di ottimizzare i risultati con quello che di buono poteva fare Pujols. Tre potenziali giocatori da leadoff negli slot 9-1-2 e speriamo che la sbatta fuori con qualcuno in base il soloHR a me mette tristezza, non lo considero un punto ma tre punti sprecati).

Permetti una battuta?
hai scritto (magari non riporto testualmente) "in testa quelli con OBP alta e poi i MIGLIORI battitori a scalare".
MIGLIORI??? cosa vuol dire???? in base a cosa???AVG? SLG? OPS? LD%? HR?
da un sabermetrico non mi sarei aspettato una topica del genere!!!!
...senza offesa, anche se adesso mi aspetto un -1 di karma, sigh!

rene144
Hero Member
Hero Member
Messaggi: 14586
Iscritto il: 12/12/2005, 23:05
6
181
Contatta:

Re: Statistiche sabermetriche

Messaggio da rene144 » 24/10/2007, 17:42

koufax75 ha scritto: René. Ne avrai sicuramente parlato, ma non ho trovato nulla in questo topic. Potresti brevemente introdurre alcuni sistemi per valutare i difensori? Ad esempio: fielding average e numero di errori spesso non danno un'analisi completa di un difensore. Una statistica interessante è il Range Factor. Ne potresti introdurre delle altre? :notworthy: :ok:

Intanto devo precisare di non essere un esperto di sabermetrica. Conosco poco la statistica. So fare qualche calcolo e capisco le procedure, ma qui l'unico vero esperto è Max. Sarei contento di leggere un paio di suoi pezzi proprio sulla sabermetrica, ma si fa pregare :hehe:

Sulla difesa abbiamo un topic a parte perchè lo studio è particolarmente interessante.

Fino a qualche anno fa si pensava che gli errori fossero l'indicazione migliore dell'abilità difensiva di un giocatore. Naturalmente non è così: il miglior modo di evitare gli errori è non arrivare sulla palla e non riuscire a fare la giocata. Ciò che è più importante dunque è il "range", ossia la copertura di territorio.
La statistica chiamata "range factor" si basa sul numero di giocate che un difensore riesce a fare. Anche questo numero però può essere inquinato. Un interbase che gioca dietro Wang o Webb (groundballers estremi) apparirà molto più bravo di uno che gioca dietro Santana (strikeout/flyballer) anche se questo non è necessariamente vero. Clay Davenport di BP ha fatto studi analoghi producendo FRAR (Fielding Runs Above Replacement) e FRAA (average), ma i dati sono "geneticamente" inaffidabili per motivi analoghi.

Fortunatamente sono state create statistiche basate sul "play-by-play", ossia differenziando i tipi di giocata. Il campo è stato tagliato a "fette" ed ogni zona è stata misurata durante l'anno. Ogni zona nella quale un giocatore di un ruolo particolare effettua almeno il 50,1% di giocate utili (producendo un out) è stata considerata da attribuire a quel particolare ruolo, come responsabilità.
Questo implica per esempio che gli infielders siano responsabili, a seconda del ruolo, di una loro zona ma solo per le groundballs (non sono responsabili per le linee battute - quelle sono solo grasso che cola se riescono a prenderle) e per gli outfielders è stato fatto lo stesso (solo che loro hanno zone diverse a seconda del fatto che vengano battute linee o flyballs).

Lo ZR (Zone Rating), disponibile su siti mainstream, tipo ESPN, si basa proprio su questi concetti. Si prende il numero di palle battute nella zona di responsabilità del giocatore e lo si utilizza come denominatore. Come numeratore viene usato il numero di giocate utili (quelle che producono eliminazioni). Quindi se su 100 palle battute nella tua zona di competenza riesci a fare 78 out, avrai .780 di ZR.
Anche questo metodo però porta una qualche iniquità. Una zona "facile" da coprire (supponiamo una zona in cui un interbase riesce a fare l'85% di out) ed una zona "difficile" (supponiamo una zona da 51% di out) vengono trattate allo stesso modo. Inoltre vengono trattate male le palle prese fuori zona, penalizzando giocatori dotati di range particolare. Supponiamo, ad esempio, che il mio allineamento difensivo mi porti a giocare (secondo ordini del manager), 3 passi più a sinistra. Questo toglierà la sovrapposizione con le zone di definizione e potrebbe penalizzarmi. In che modo? Per esempio, stando nella posizione "tradizionale" su 100 palle battute nelle mie zone, faccio 93 out, per uno ZR di .930. Il mio manager però mi vuole più a sinistra. Questo mi permette di fare un out che non avrei fatto altrimenti, ma mi fa perdere una palla che avrei potuto e dovuto prendere, e che è passata nella mia zona. La palla presa fuori zona viene aggiunta sia al numeratore che al denominatore, mentre la palla mancata in zona viene aggiunta solo al denominatore, penalizzandomi. A livello intuitivo, sappiamo che se scambiamo un out per un altro out, non ci sia una differenza nelle mie prestazioni, ma questo non è apparente dal calcolo. Infatti se (tornando all'esempio fatto) ho fino a questo punto 93 out fatti su 98 palle battute, e vado a giocare più a sinistra, succede che manco una palla che passa nella mia zona (portandomi a 93 su 99) ma prendo una palla fuori zona (portandomi a 94 su 100). In realtà ho scambiato un out per un out, ma per il calcolo il mio ZR viene penalizzato, scendendo da .949 a .940. Insomma, c'è un problema matematico. Lo ZR è sicuramente più utile di FRAR, FRAA, RF (Range Factor) e soprattutto di Fielding%, ma non è perfetto.

--------- ho scritto da cani, ho litigato col dizionario, sono molto agitato per le World Series, anzi LA World Series già che ci siamo --------------

John Dewan nella Fielding Bible ha creato il +/-. E' un sistema che da' un + per ogni palla "giocata" fuori zona, ed un - per ogni palla "non giocata" in zona. Con questo sistema, se mi sposto fuori zona e faccio una giocata altrimenti impossibile (perdendone una possibilissima però) totalizzo comunque 0, giustamente, non venendo penalizzato.
L'UZR, creato da Mitchel Lichtman, prende in considerazione gli shifts difensivi, la forza della palla battuta ed in generale la difficoltà della giocata. Per anni i dati non sono stati disponibili (Mgl è stato assunto dai Cardinals), ma adesso è tornato a pubblicarli anche se non lo fa assiduamente e non fornisce alcun dettaglio sulle formule e sui dati utilizzati.
Altre compagnie, come STATS e BIS hanno iniziato a registrare tutti i dati play by play del baseball, ma hanno iniziato a separare le giocate in zona da quelle fuori zona. Alcuni di questi dati vengono pubblicati. Usando dati del genere io ho iniziato a lavorare facendo varie normalizzazioni (secondo le tendenze da groundballers dei lanciatori della squadra, secondo il numero di giocate fatte da un determinato ruolo, ecc, ecc) e già l'anno scorso ho pubblicato alcuni dati difensivi (quelli che si leggono nell'altro topic ed in due pezzi già pubblicati). Nella off-season presenterò i miei risultati di quest'anno, che peraltro rispecchiano abbastanza fedelmente i risultati di UZR e +/-, con differenze piuttosto marginali e determinate dall'importanza delle giocate fuori zona (i miei calcoli tendono a normalizzare le occasioni avute in base ad una stagione media, mentre altri considerano solo i totali nudi e crudi).

Spero di essere stato chiaro, ma lo dubito fortemente. Mi è sembrato di scrivere in ostrogoto... sono molto stanco e faccio casino :forza:
Di difesa è meglio parlare nell'altro topic.

Louis: scusami se non ho spiegato bene cosa io intenda per migliori. Personalmente intendo l'OPS nel caso specifico (nel caso di OPS simile, prima quelli OBP-heavy e poi quelli SLG-heavy), anche se in altri contesti si può parlare di EqA e via dicendo.

Avatar utente
webba2000
Senior
Senior
Messaggi: 2062
Iscritto il: 18/05/2004, 18:33
MLB Team: Cleveland Indians
Località: Torino
159
165

Re: Statistiche sabermetriche

Messaggio da webba2000 » 24/10/2007, 18:21

Si vede che stasera c'è gara 1, eh  :hehe: :hehe:

Avatar utente
louis
Senior
Senior
Messaggi: 1210
Iscritto il: 18/10/2007, 10:39
Località: Lodi
11

Re: Statistiche sabermetriche

Messaggio da louis » 25/10/2007, 1:49

mi autoquoto
louis ha scritto: Credo che la logica sia stata quindi di ottimizzare i risultati con quello che di buono poteva fare Pujols. Tre potenziali giocatori da leadoff negli slot 9-1-2 e speriamo che la sbatta fuori con qualcuno in base il soloHR a me mette tristezza, non lo considero un punto ma tre punti sprecati).


in gara 1 Lugo all'8 e all'9 va Ellsbury.
la logica, secondo me, è la stessa.
Lugo che batte come un pitcher non va per ultimo e si preferisce mettere un' alta OBP in 9 per favorire + punti con gli slugger riprendendo il giro. In pratica potremmo definirlo un pre-leadoff.

Francona copia da LaRussa?

rene144
Hero Member
Hero Member
Messaggi: 14586
Iscritto il: 12/12/2005, 23:05
6
181
Contatta:

Re: Statistiche sabermetriche

Messaggio da rene144 » 25/10/2007, 2:36

louis ha scritto: in gara 1 Lugo all'8 e all'9 va Ellsbury.
la logica, secondo me, è la stessa.

No, Francona ha usato Lugo come nono per quasi tutta la fine dell'anno. Ellsbury batte nono perchè è un ragazzino senza esperienza secondo lui.
Se fosse stato come dici tu, avrebbe messo Crisp o Pedroia a battere ultimi durante l'anno, invece ha usato appunto Lugo ed oggi va con Ellsbury (che è mancino con un mancino sul monte). Nelle gare con Ellsbury contro un destro (le ultime due dell'ALCS), Lugo è stato ultimo.

MAX
Rookie
Rookie
Messaggi: 152
Iscritto il: 24/09/2003, 16:46
Località: Bologna
Contatta:

Re: Statistiche sabermetriche

Messaggio da MAX » 25/10/2007, 9:56

koufax75 ha scritto: René. Ne avrai sicuramente parlato, ma non ho trovato nulla in questo topic. Potresti brevemente introdurre alcuni sistemi per valutare i difensori? Ad esempio: fielding average e numero di errori spesso non danno un'analisi completa di un difensore. Una statistica interessante è il Range Factor. Ne potresti introdurre delle altre? :notworthy: :ok:

Mi faccio un po' di autopubblicità.
http://profpepper.playitusa.com/Mat_Fis/mat017.html" onclick="window.open(this.href);return false;
http://profpepper.playitusa.com/Mat_Fis/mat016.html" onclick="window.open(this.href);return false;

Per la questione lineup - non avendo molto da aggiungere su quanto detto da Renè -, preciso che ho costruito su excel (durante le guardie notturne in caserma) uno strumento che, dato un ordine di battuta (con tutte le statistiche) ti fornisce il numero di punti attesi a partita. Lo utilizzavo parecchio per farmi il lineup quando partecipavo a un campionato di tabletop baseball, e in alcuni casi mi suggeriva il pitcher settimo, ma in genere finiva in fondo.

Ange86
Senior
Senior
Messaggi: 2469
Iscritto il: 05/10/2005, 13:39
Località: Rivanazzano (Pv)
144

Re: Statistiche sabermetriche

Messaggio da Ange86 » 25/10/2007, 10:59

MAX ha scritto: Mi faccio un po' di autopubblicità.
http://profpepper.playitusa.com/Mat_Fis/mat017.html" onclick="window.open(this.href);return false;
http://profpepper.playitusa.com/Mat_Fis/mat016.html" onclick="window.open(this.href);return false;

Per la questione lineup - non avendo molto da aggiungere su quanto detto da Renè -, preciso che ho costruito su excel (durante le guardie notturne in caserma) uno strumento che, dato un ordine di battuta (con tutte le statistiche) ti fornisce il numero di punti attesi a partita. Lo utilizzavo parecchio per farmi il lineup quando partecipavo a un campionato di tabletop baseball, e in alcuni casi mi suggeriva il pitcher settimo, ma in genere finiva in fondo.
Ho visto sul sito che hai pubblicato lo studio delle facce 2007  :notworthy: :notworthy:
Immagine Immagine

Avatar utente
louis
Senior
Senior
Messaggi: 1210
Iscritto il: 18/10/2007, 10:39
Località: Lodi
11

Re: Statistiche sabermetriche

Messaggio da louis » 25/10/2007, 13:42

MAX ha scritto: Mi faccio un po' di autopubblicità.
http://profpepper.playitusa.com/Mat_Fis/mat017.html" onclick="window.open(this.href);return false;
http://profpepper.playitusa.com/Mat_Fis/mat016.html" onclick="window.open(this.href);return false;

Per la questione lineup - non avendo molto da aggiungere su quanto detto da Renè -, preciso che ho costruito su excel (durante le guardie notturne in caserma) uno strumento che, dato un ordine di battuta (con tutte le statistiche) ti fornisce il numero di punti attesi a partita. Lo utilizzavo parecchio per farmi il lineup quando partecipavo a un campionato di tabletop baseball, e in alcuni casi mi suggeriva il pitcher settimo, ma in genere finiva in fondo.

ho già "divorato" tutto il tuo sito (vecchio e nuovo) qualche notte fa.
conosco quindi la teoria del line-up generato dai tuoi calcoli. La cosa che mi aveva colpito di più era la questione del numero 2. Se non sbaglio a differenza dell'attitudine generale risulterebbe più adatto un giocatore potente (fermo restando la OBP alta e che è meglio che sia mancino) alla Giambi. Giocatare che nessuno metterebbe in slot 2.

Quello che volevo sapere sulla questione pitcher in slot 8 (forse mi sono spiegato male) non era se in generale sia una scelta da fare o meno ma se nei cardinals aveva avuto un effetto positivo o negativo. Magari è solo servito a far fare i 100 RBI a pujols o magari ha lasciato troppo in base.
La saber può fare una valutazione simile? premetto che sono consapevole che una trentina di partite non sono un campione sufficiente.

Ange86
Senior
Senior
Messaggi: 2469
Iscritto il: 05/10/2005, 13:39
Località: Rivanazzano (Pv)
144

Re: Statistiche sabermetriche

Messaggio da Ange86 » 25/10/2007, 14:34

louis ha scritto: ho già "divorato" tutto il tuo sito (vecchio e nuovo) qualche notte fa.
conosco quindi la teoria del line-up generato dai tuoi calcoli. La cosa che mi aveva colpito di più era la questione del numero 2. Se non sbaglio a differenza dell'attitudine generale risulterebbe più adatto un giocatore potente (fermo restando la OBP alta e che è meglio che sia mancino) alla Giambi. Giocatare che nessuno metterebbe in slot 2.
Devi considerare anche il fatto della protezione che il giocatore deve avere dal giocatore che lo segue nel lineup.
Comunque non sempre la consuetudine è la cosa giusta. Se tu come numero 2 hai un giocatore che si mette poco in base e tende a battere spesso in doppio gioco nello slot numero 3 puoi avere chi vuoi che "sprechi" comunque dei punti.
Immagine Immagine

Avatar utente
louis
Senior
Senior
Messaggi: 1210
Iscritto il: 18/10/2007, 10:39
Località: Lodi
11

Re: Statistiche sabermetriche

Messaggio da louis » 25/10/2007, 14:53

Ange86 ha scritto: Devi considerare anche il fatto della protezione che il giocatore deve avere dal giocatore che lo segue nel lineup.
Comunque non sempre la consuetudine è la cosa giusta. Se tu come numero 2 hai un giocatore che si mette poco in base e tende a battere spesso in doppio gioco nello slot numero 3 puoi avere chi vuoi che "sprechi" comunque dei punti.

Wait a moment
Ho precisato "fermo restando la OBP alta"
I calcoli di Max/pepper portano a dire che Giambi è meglio di Jeter in slot 2.

Ange86
Senior
Senior
Messaggi: 2469
Iscritto il: 05/10/2005, 13:39
Località: Rivanazzano (Pv)
144

Re: Statistiche sabermetriche

Messaggio da Ange86 » 25/10/2007, 15:11

louis ha scritto: Wait a moment
Ho precisato "fermo restando la OBP alta"
I calcoli di Max/pepper portano a dire che Giambi è meglio di Jeter in slot 2.

A che articolo ti riferisci? Riesci a mettere un link?
Immagine Immagine

Rispondi

Torna a “MLB”