TML Classic: Finale Roland Garros 2004, Gaudio vs Coria, Analisi statistica
Ormai appuntamento fisso per gli Slam continua la serie di articoli che analizzano in maniera molto approfondita la sfida descritta nell’articolo precendente. Cominciano ad essere un bel po’ di partite. Ricordiamo sempre che questo tipo di “articoli” non sono usa e getta. Possono e devono essere conservati per i momenti in cui si richiede di ricordare questi match. Non potendo ricordare tutti i punti e tutte le stats è molto utile rispolverarli per avere un’idea precisa di quello che è successo, perché non tutto si può ricordare, anzi.
Punteggio
Si parte sempre dal punteggio che dice tanto, quasi tutto della partita, ma il quasi è più importante del tutto. 0-6 3-6 6-4 6-1 8-6. Schema 2-2-1-1-1. Già il solo 0-6 ci dice di come sia stata rocambolesco questo match. Una rimontona da 2 set sotto senza troppi complimenti. Rimontona che poi si è trasformata in una battaglia fianco a fianco nel finale.
Palle break
Analizziamo il numero delle palle break salvate/sprecate (ricordando sempre che sono dati complementari). Il vincitore ha dovuto affrontare 23 palle break e ne ha salvate 12. 11 break subiti sono un’infinità, però è necessario in questo guardare anche quello che ha fatto l’avversario. Coria ha dovuto affrontare meno palle break, 15, però ha subito lo stesso numero di break di Gaudio, ecco perché la partita ha avuto così tanti capovolgimenti di fronte. Il dominio targato Coria si concretizza nella sola palla break dovuta affrontare nei primi 2 set. Poi man mano la partita gira ed è Coria che deve affrontare 5 palle break nel 4° set e 7 nel 5°. Ancora Gaudio è sotto pressione nell’ultimo parziale, però lo fa suo per via dei 4 break subiti contro i 5 del suo avversario.
Servizio
I dati al servizio ci dicono che Gaudio ha messo più prime in campo: 67.1% contro il 65.2% dell’avversario. Numeri molto bassi. Però siamo sulla terra battuta e il servizio non è così fondamentale per vincere una partita. Gaston rende meglio con la prima, però il 58% testimonia una partita che si è “giocata sulla risposta”, tesi corroborata dal corrispettivo 52.3% di Coria. Gaudio paga solo con la seconda di servizio, però i numeri sono talmente bassi che sono quasi del tutto trascurabili.
Prima & seconda di servizio
Il dato set-by-set testimonia il maggiore rendimento di Coria che fa sue le prime e seconde nei primi 2 set. Mantiene questa superiorità nel terzo set per quanto riguarda le prime in campo però il rendimento superiore, molto superiore: 75% vs 50% di Gaudio danno il set a El Gato. Impietosi i numeri per Guillermo nel 4° set, pesa molto il suo infortunio che l’ha menomato in questo fondamentale. 5° set con le stesse caratteristiche del 3° che per questo sorride a Gaudio.
Return Points Winner
La RPW (Return Points Winner) sorride a Gaudio che vince complessivamente la guerra in risposta con un 49.6% contro 46.3%. Dato particolarmente preponderante e che determina in maniera precisa l’assegnazione di ogni parziale. È un concetto che intuitivamente si può pensare e predire senza numeri davanti, soprattutto per via delle caratteristiche della superficie, ma vederlo concretizzato nei numeri reali e tangibili fa tutto un altro effetto.
Doppi falli
Qui continuiamo a ribadire il concetto che non conta il numero di doppi falli, ma quando sono arrivati. Per completezza diciamo che Gaudio ne ha commesso 9, Coria 6, ma andiamo nel dettaglio.
- Gaudio
- Gaudio commette il 1° doppio fallo nel 1° set 2-0 Coria 0-15 . V = 1.6
- 1° set 4-0 Coria Adv Coria. V = 0.7
- 2° set 0-0 0-15. V = 2.2
- 2° set 0-0 30-40. V = 4.5
- 2° set 5-3 Coria 0-0. V = 0.8
- 3° set 2-1 Coria 15-0. V = 1
- 5° set 0-0 30-15. V = 4.9
- 5° set 0-0 Adv2 Gaudio. V = 5
- 5° set 4-4 0-15 Gaudio. V = 10.5
- Coria
- 2° set 1-2 Coria 0-0. V = 1.8
- 4° set 1-1 30-40. V = 6.7
- 4° set 5-1 Coria 30-0. V=0.2
- 4° set 5-1 Deuce 0-0. V=0.3
- 5° set 1-0 Gaudio 0-30. V = 6.4
- 5° set 6-5 Coria 30-30. V =13.8
Vincenti/Non forzati
Come sempre il bilancio dei vincenti e dei non forzati lascia spazio a varie interpretazioni. La prima nasce spontanea perché questi dati non sono mai precisi al 100% o quantomeno riconosciuti all’unanimità, motivo per cui il sito dell’ATP non li riporta mai. La seconda, che è quella che pesa maggiormente, è che nelle rispettive categorie sono inclusi colpi anche diametralmente opposti che però, seguendo semplicemente una regola di inclusione, sono messi tutti nello stesso calderone. Ma chiudiamo l’excursus filosofico per concentrarsi sui numeri.
Teorema Tommasi. Il differenziale complessivo dei vincenti e dei gratuiti è negativo per entrambi i giocatori: -40 per Gaudio, -36 per Coria. Il teorema ci suggerirebbe una partita brutta, anzi bruttissima. In effetti lo è stata per larghi tratti e gli errori l’hanno fatta da padrone, però è proprio perché il livello è sceso così tanto che la partita è diventata così interessante e piena di colpi di scena.
Differenziale FH e BH
Forehand
Il differenziale complessivo tra W/UE di dritto denota un bilancio negativo per entrambi. Numeri molto simili con un -40 per Gaudio e -36 per Coria. I saldi sono negativi per entrambi in tutti i set, solo nel 4° set però Gaudio va sopra con un leggero +2 che poteva essere anche più pesante visto l’andamento del parziale.
Backhand
Il rovescio di entrambe i giocatori non è stato perfetto. -16 per Gaudio, -15 per Coria. Però c’era da aspettarselo visto che i 2 argentini non hanno nel rovescio il loro colpo migliore.
Vediamo il bilancio complessivo set-by-set
- -14 Gaudio |+2 Coria
- -12 Gaudio |+1 Coria
- -1 Gaudio |-7 Coria
- -7 Gaudio |-11 Coria
- -15 Gaudio |-21 Coria
Key Points
Ed ecco di nuovo i nostri key points. Per chi si fosse perso le puntate precedenti, essi sono i punti chiave ossia quei punti che fanno girare un game da una parte o dall’altra. Sono divisi in 3 categorie in ordine di importanza: in prima fila i break points che sono essenziali, secondo gradino per i game points e terzo per i deuce points, i punti che si giocano sulla parità.
Già si è parlato delle palle break nella sezione apposita, ma ricordiamo il 12/23 vs 4/15 (0.52 > 0.27). Tutto a favore di Gaudio che vince la guerra delle proporzioni salvando una marea di palle break. Gaston è stato molto più efficace quando si è trattato di annullare palle break con un 52% di prime in campo contro il 40% di Coria. Guillermo è stato più cinico a chiudere sul suo servizio, che vale molto meno della statistica precedente. Lo stesso vale per i game andati ai vantaggi, però è troppo alto il gap della prima percentuale per poter pensare di vincere il match.
Gaudio è stato quello maggiormente sotto pressione, ma se l’è cavata bene. Coria meglio e poteva benissimo vincere il match se solo avesse convertito 1 dei 2 match point a favore.
Winning probability
Ritorna di prepotenza la winning probability che attraverso un grafico in 2 dimensioni molto semplice ci regala una radiografia della partita. L’andamento del match point-by-point è un dato imprescindibile per una analisi che vuole essere dettagliata e condivisa da tutta, se poi questa è corroborata da un grafico che dà l’idea immediata di come la partita sia andata in un verso o nell’altro siamo a cavallo.
Ribadiamo alcuni concetti che sono alla base di questo tipo di analisi. Entrambi i giocatori partono dalla stessa percentuale di probabilità di vincere, quindi 50 e 50, si assegna una P di probabilità di ottenere il punto sul proprio servizio e grazie ad un particolare algoritmo si calcola punto per punto quant’è la probabilità che uno giocatore porti a casa un match. In alcuni studi la P è diversa per i 2 giocatori. Una scelta plausibile che però trova il difetto di produrre dei grafici in cui chi ha la P maggiore ha sempre una WP maggiore del 50% e solo nei casi in cui sta perdendo malamente il match questa scende sotto il livello del 50%. Questo tipo di approccio è utile per le agenzie di scommesse che lo adottato per dare le quote live, ma non è utile in un’analisi a posteriori perché un giocatore favorito avrà sempre numeri alti nonostante magari in certe situazioni si trovi pesantemente sotto nel punteggio.
Questo è il grafico più schizofrenico che si possa immaginare. Il colore rosso domina in lungo e in largo, prova tangibile che Coria ha letteralmente buttato la partita. Ci sono talmente tanti picchi che è inutile evidenziarli tutti. Tra tutti prendiamo il minimo relativo nella prima grande trance di rosso, è il punto (1) al 9.7%. Coria domina pure il 5° set con vertiginosi picchi verso il basso. Il più grande è al 3.3% (2) sul 6-5 30-0 e servizio. Poi ci sono i 2 picchi al 5.7% (3) dei 2 match point. Gaudio risorge in tempi brevissimi e va a vincere.
Il dominio
La netta prevalenza del colore rosso del grafico non lascia spazio ad altre interpretazioni.
71.21% Coria e 28.78% Gaudio.
Comeback factory
Il comeback factory misura in termini numerici la consistenza della rimonta del vincitore. Gaudio ha avuto il picco più basso del 3.3% di WP per cui ha guadagnato il 96,7% di WP per aggiudicarsi l’incontro. CF = 96,7%. Il 3.3% arriva sul 6-5 30-0 servizio Coria del 5° set.
Excitement index
Siamo arrivati al punto più controverso delle statistiche avanzate del tennis ossia cercare di quantificare quanto un match sia stato eccitante-bello. Inutile dire che non potrà esistere un metodo universalmente condiviso, ma andare a quantificare quanto il match ha avuto capovolgimenti di fronte che sono alla base di una partita “eccitante”, è un buon inizio. L’EI si basa sulla volatility che misura quanto il punto sia stato importante (già c’è stato un accenno nella sezione doppi falli).
La volatility è la differenza in valore assoluto tra la WP del punto precedente con il punto corrente. Misura quanto quel punto ha fatto cambiare le sorti del match e di conseguenza quello che sposta maggiormente la WP è il più importante. Un punto con v compreso tra 1 e 3% è un punto ininfluente, dal 4 al 6% comincia ad essere caldo, dal 6 al 10% è fondamentale, sopra il 10% è un punto che fa girare tutto.
In questa partita il punto più importante ha avuto una volatility del 21.7% che è il break point che salva Gaudio e riporta tutto in parità sul 6 pari del 5° set.
Quant’è l’EI allora? 3.38. È alta, è bassa, chi lo sa? In questi casi i numeri adimensionali dicono poco o nulla se presi singolarmente, per avere senso bisognerebbe fare un confronto con le altre partite. Un esempio: semifinale del Roland Garros 2013 ha avuto EI 2,88 che è inferiore a questa. Quella della finale degli Australian Open 2009 2.712, così come la finale di Wimbledon 2008 con 3.11. La semifinale degli Australian Open 2005 era arrivata a 3.43 (il massimo della serie TML). Le partite dominate si attestano attorno all’1. Questa è un excitement index altissimo, ma non massimo perché ci sono stati sì tanti punti di svolta, ma 2 set sono durati pochissimo, per cui la media li penalizza.
Per cercare di normalizzare questo indice dobbiamo scoprire qual è il massimo possibile. In un match al meglio dei 3 e dei 5 set con tiebreak finale l‘EI massimo è 18. Questo numero è frutto della media che si ha se il match durasse all’infinito e ad ogni punto il servitore perdesse il servizio. È un caso limite, quasi immaginario, perché una partita non può durare all’infinito, e questo è un dato di fatto, ed è altamente improbabile che i 2 giocatori perdano sempre il servizio in modo da far convergere asintoticamente il valore verso questo massimo teorico. Se applichiamo lo stesso ragionamento ad un match con long set finale viene fuori che esso ha un EI massimo di 10.15. Questo implica che i 2 format presentato 2 massimi differenti, quindi per poter paragonare EI con format differenti è necessaria una normalizzazione. Il 2,3 agli US Open vale meno di un 2,3 degli altri Slam (disputati fino a ora, sappiamo che dal 2019 Wimbledon e Australian Open cambieranno) perché arriva in un teorico match che ha il tiebreak nel set decisivo.
La normalizzazione impone di conseguenza un 3.38/10,15 = 0,333 (che sarebbe 3.38/18 agli US Open) Una normalizzazione a 1 dell’EI dà come output un 33.3% per la partita in esame (-66,6% dalla “partita perfetta”). A Wimbledon 2008 l’EI normalizzato a 1 era 30.64%.
Domination Ratio
Per chi l’avesse dimenticato la dominatio ratio è data dal rapporto della percentuale dei punti vinti in risposta e quella dei punti persi al servizio. Che cosa ci dice? Ci dice quanto un giocatore è stato dominante rispetto al suo avversario in un set o nell’intero match. Nella maggior parte dei casi questa arride al vincitore ma può capitare che il vincitore lasci tanti punti al suo avversario pur vincendo quelli più importanti. La DR in questo caso premia il perdente.
Del dominio nel match ne abbiamo parlato così è meglio concentrarsi su quella dei singoli set.
- SET 1
DR(Gaudio) = (2/6 + 2/6 + 0) / (4/6 + 4/4 + 7/12) = 0.296
DR(Coria) = 3.375
- SET 2
DR(Gaudio) = (2/6 + 2/6 + 1/4) / (2/6 + 0 + 4/6 + 3/8 + 4/4) = 0.385
DR(Coria) = 2.59
- SET 3
DR(Gaudio) = (3/8 + 2/6 + 4/6 + 2/6 + 5/8) / (1/5 + 2/6 + 4/6 + 0 + 0) = 1.944
DR(Coria) = 0.514
- SET 4
DR(Gaudio) = (1/5 + 4/6 + 4/4 + 5/8) / (2/6 + 1/5 + 0) = 4.671
DR(Coria) = 0.214
- SET 5
DR(Gaudio) = (4/5 + 0 + 2/4 + 4/6 + 4/4 + 7/12 + 4/5) / (8/14 + 5/8 + 1/5 + 1/5 + 4/6 + 9/16 + 1/5)
DR(Coria) = 0.695
Service domination e return domination
Non ci addentriamo in calcoli astrusi semplicemente stimiamo i punti vinti al servizio dai 2 giocatori e li rapportiamo al totale:
La service domination nei rispettivi set è stata del: 50.00%, 52.00%, 61.01%, 55.26%, 46.53%.
La return domination, RD, è il reciproco in termini di percentuale della SD e misura quanto sia stata incisiva la risposta. Non è difficile arrivare alla soluzione.
La RD set-by-set è stata del: 50.00%, 48.00%, 38.98%, 44.74%, 53.47%.
SD(totale) = (7 + 12 + 30 + 17 + 13 + 13 + 18 + 18 + 12 + 9) / ( 11 + 27 + 22 + 28 + 34 + 25 + 26 + 12 + 55 + 46) = 52.09%
Bassa SD, ma siamo sulla terra battuta, ci sta.
[L’analisi completa con tutti i dati correlati è disponibile a questo link]