Ultimi articoliWimbledon

TML Classic: Finale Wimbledon 2009, Federer vs Roddick, Analisi statistica

Dopo la descrizione dettagliata della partita passiamo all’analisi statistica. Il ciclo degli Slam del TML Classic continua dopo il tour dei 4 Major dell’anno scorso, l’analisi della semifinale degli Australian Open 2005 tra Federer e Safin e quella della semifinale tra Federer e Djokovic al Roland Garros 2011. Anche qui l’approfondimento sarà molto esaustivo e cercheremo anche di introdurre qualche nuovo parametro per descrivere determinati aspetti del gioco dell’uno o dell’altro contendente.

Punteggio

Si parte sempre dal punteggio che dice tanto, quasi tutto della partita, ma il quasi è più importante del tutto. 5-7, 7-6(6), 7–6(5), 3-6, 16-14. Schema 2-1-1-2-1. Primo set vinto dal perdente con almeno un break. 2° set finito al tiebreak con un (6) che potrebbe indicare che chi l’ha perso ha avuto set point, così come è stato nella realtà. Anche il 3° set è andato al tiebreak ma nessuno è andato a set point se non il vincitore. Poi 4° set con almeno un break per il perdente. Infine 16-14 irreale. Almeno un break per il vincitore. Long set eterno.

Palle break

Analizziamo il numero delle palle break salvate/sprecate (ricordando sempre che sono dati complementari). Il vincitore ha dovuto affrontare 5 palle break e ne ha salvate 3. Numero un po’ superiore per Roddick che si è fatto breakkare una sola volta su 7 occasioni. Sembrerebbe che Roddick abbia fatto meglio, però pesano tanto i 2 tiebreak vinti da Federer dove il dato analizzato in questa sezione non emerge. Chissà come sarebbero queste statistiche senza tiebreak. 6/7 > 3/5. Poteva anche perderla Federer che però ottiene il break essenziale nell’ultimo game del match. 1° set con Roddick costretto a salvare 4 palle break. Ne basta una per chiuderer il set. Proprio il set point. 2 set dove domina il servizio e solo una palla break salvata da Roddick. Poi Andy sale nel 4° e non concede nulla e su 2 occasioni breakka l’avversario una sola volta. Nel long set Federer semplicemente non si fa breakkare e vince set e partita.

Servizio

I dati al servizio ci dicono che Roddick ha messo più prime in campo: 70.3% contro 65%. Però la resa è tutta dalla parte svizzera con un 88.3% che è superiore al 83.3% di Andy. Roddick ha molto probabilmente perso la partita con la seconda. Giocata poche volte però con un rendimento scarsissimo del 43.7% contro il “normale” 60.9% di Federer. +17.2% pesantissimo nell’economia della partita che pure Roger stava per perdere, o meglio non ha così dominato.

Prima & seconda di servizio

Il dato set-by-set testimonia un Federer maggiormente propenso a mettere prime in campo in 3 casi su 5. Impressionante il 78.9% vs 55.6% del 1° parziale a favore di Roddick che pure ha dato il set all’avversario. Lo stesso caso si ripete a parti invertite nel e tutto torna alla normalità. Prime in campo identiche nel 4° parziale vinto da Andy. Lo statunitense va sotto anche nel in questa statistica, ma è sempre la seconda a tradirlo come testimoniato dal dato che include tutto il match. La tds 6 va sopra con la seconda solo nel 4° set dove Federer si perde con il suo 33.3%. Per il resto Roddick pessimo in tutti gli altri parziali. Spaventoso 75% vs 25% del 2° set che poteva vincere al tiebreak. Anzi che ha buttato al tiebreak.

Return Points Winner

La RPW (Return Points Winner) sorride a Federer che vince complessivamente la guerra in risposta con un 28.5% contro un 21.3%. Solo nel 4° set Roddick ha fatto meglio rispetto a Roger. Per il resto va sempre sotto, anche pesantemente come ne set con un 28.6% vs 9.4%. Set andato al tiebreak. Altra occasione d’oro sfuggita ad Andy nonostante, secondo questi dati, doveva andare sotto senza replica.

Doppi falli

Qui continuiamo a ribadire il concetto che non conta il numero di doppi falli, ma quando sono arrivati. Per completezza diciamo che Federer ne ha commesso 4 così come Roddick, ma andiamo nel dettaglio.

Federer

  1. Federer commette il 1° doppio fallo nel 1° set sul 3-4 Roddick e 40-0 per lui. V= 0.3. Volatility molto bassa. Ininfluente
  2. Il 2° sul 4-5 Roddick 30-15. Doppio fallo che porta Andy a 2 punti dal 3° set. V= 2.6. Volatility media.
  3. Il 3° sul 0-1 Roddick 15 pari del 4° set. V= 2.9. Arriva a inizio set, ma il set potrebbe essere decisivo. Volatily media.
  4. Ultimo doppio fallo sul 7 pari del 5° set 15-0 Federer. Volatility alta = 5.4. Il game poteva essere decisivo

Roddick

  1. Roddick commette il 1° doppio fallo nel 2° set: 1-1 15-15. V= 2.3. Media
  2. Il 2° sul 2-2 del 2° set 30-0. V= 0.8. Molto bassa
  3. Il 3° sul 6-5 Federer del 3° set 15-0. V= 2.7. Media
  4. Il 4° sul 4-2 Roddick del 4° set 30-15. V= 2.4. Media

Vincenti/Non forzati

Come sempre il bilancio dei vincenti e dei non forzati lascia spazio a varie interpretazioni. La prima nasce spontanea perché questi dati non sono mai precisi al 100% o quantomeno riconosciuti all’unanimità motivo per cui il sito dell’ATP non li riporta mai. La seconda, che è quella che pesa maggiormente, è che nelle rispettive categorie sono inclusi colpi anche diametralmente opposti che però, seguendo semplicemente una regola di inclusione, sono messi tutti nello stesso calderone. Ma chiudiamo l’excursus filosofico per concentrarsi sui numeri.

Teorema Tommasi. Il differenziale complessivo dei vincenti e dei gratuiti è positivo per entrambi: +32 per Roddick, +60 per Federer. Il teorema ci suggerirebbe una partita bella, anzi bellissima. Però se nel conto dei vincenti vanno anche gli ace non è difficile avere questi numeri, soprattutto sull’erba.

Differenziale FH e BH

  • Forehand

Il differenziale complessivo tra W/UE di dritto denota un bilancio positivo per entrambi. Molto squilibrio nei numeri a favore del numero 2 del mondo con un +4 per Roddick e +13 per Federer. Solo nel 1° set Federer va a -2, poi per il resto sempre positivo. Roddick sbaglia un po’ di più: negativo per il lui il 3° e 4° set.

  • Backhand

Il rovescio di Roddick non ha funzionato. Solo nel 4° set si è visto un bilancio positivo. Impietoso –10 nell’ultimo parziale. Anche Federer va in negativo:  -7 per lui. Male per Roger 4° e 5° set in questa statistica.

Vediamo il bilancio complessivo set-by-set

  1. +7 Roddick / +6 Federer
  2. +4 Roddick / +10 Federer
  3. +11 Roddick / +15 Federer
  4. +6 Roddick / +24 Federer

Key Points

Ed ecco di nuovo i nostri key points. Per chi si fosse perso le puntate precedenti essi sono i punti chiave ossia quei punti che fanno girare un game da una parte o dall’altra. Sono divisi in 3 categorie in ordine di importanza: in prima fila i break points che sono essenziali, secondo gradino per i game points e terzo per i deuce points, i punti che si giocano sulla parità.

Già si è parlato delle palle break nella sezione apposita, ma ricordiamo il 6/7 vs 3/5. Numeri molto simili tra i 2. Federer ha messo in campo la prima 3 volte quando ha dovuto fronteggiare una palla break, l’80% delle volte, mentre Roddick il 71% delle volte. Gli unforced condannano l’americano, anche se ne ha commesso solo 1.

In generale Federer è stato più lucido nei punti importanti della partita. Il rendimento complessivo nei key points sorride allo svizzero con un 80% di punti vinti contro il 61% di Roddick. In totale le palle critiche sono state sbilanciate verso l’americano: 61 vs 43. E questo spiega come perché è Federer ad avere avuto la meglio.

Winning Probability

Ritorna di prepotenza la winning probability che attraverso un grafico in 2 dimensioni molto semplice ci regala una radiografia della partita. L’andamento del match point-by-point è un dato imprescindibile per una analisi che vuole essere dettagliata e condivisa da tutta, se poi questa è corroborata da un grafico che dà l’idea immediata di come la partita sia andata in un verso o nell’altro siamo a cavallo.

Ribadiamo alcuni concetti che sono alla base di questo tipo di analisi. Entrambi i giocatori partono dalla stessa percentuale di probabilità di vincere, quindi 50 e 50, si assegna una P di probabilità di ottenere il punto sul proprio servizio e grazie ad un particolare algoritmo si calcola punto per punto quant’è la probabilità che uno giocatore porti a casa un match. In alcuni studi la P è diversa per i 2 giocatori. Una scelta plausibile che però trova il difetto di produrre dei grafici in cui chi ha la P maggiore ha sempre una WP maggiore del 50% e solo nei casi in cui sta perdendo malamente il match questa scende sotto il livello del 50%. Questo tipo di approccio è utile per le agenzie di scommesse che lo adottato per dare le quote live, ma non è utile in un’analisi a posteriori perché un giocatore favorito avrà sempre numeri alti nonostante magari in certe situazioni si trovi pesantemente sotto nel punteggio.

A parte i primi scampoli di primo set dove il grafico oscilla attorno al 50% si ha la prima sgasata di Roddick che ottiene il break che gli vale il primo set. Da quel momento in poi è sempre avanti lui nel punteggio fino ad arriva al picco (1) in quello del primo set point del tiebreak del 2° set. WP = 13.5. Federer raddrizza la partita e si porta avanti (2) vincendo il 3° set. Roddick fa scendere subito la WP di Federer riportando tutto al 50%. 5° set infinito con Federer quasi sempre davanti per via dell’essere stato lui a battere per primo. Poi all’improvviso picco verso il basso al (3) con un 24.9% che arriva sul 15-40 dell’8 pari. 2 break point che potevano portare Andy a serive per il match. Tutto si raddrizza fino all’impennata finale che porta al break Federer e al match nel 30° gioco.

Il dominio

La netta prevalenza del colore blu del grafico sembrerebbe dirci che è stato Federer a dominare. Non è così: lo spicchio rosso iniziale pesa tanto, tanto da portare il dominio in pareggio o quasi.

50,34% Federer e 49,66% Roddick.

Comeback factory

Il comeback factory misura in termini numerici la consistenza della rimonta del vincitore. Federer ha avuto il picco più basso del 13.5% di WP per cui ha guadagnato il 86.5% di WP per aggiudicarsi l’incontro. CF =86.5%. Grandissimo CF. Il 13.5% arriva sull 2-6 del tiebreak del 2° set.

Excitement index

Siamo arrivati al punto più controverso delle statistiche avanzate del tennis ossia cercare di quantificare quanto un match sia stato eccitante-bello. Inutile dire che non potrà esistere un metodo universalmente condiviso, ma andare a quantificare quanto il match ha avuto capovolgimenti di fronte che sono alla base di una partita “eccitante”, è un buon inizio. L’EI si basa sulla volatility che misura quanto il punto sia stato importante (già c’è stato un accenno nella sezione doppi falli). La volatility è la differenza in valore assoluto tra la WP del punto precedente con il punto corrente. Misura quanto quel punto ha fatto cambiare le sorti del match e di conseguenza quello che sposta maggiormente la WP è il più importante. Un punto con v compreso tra 1 e 3% è un punto ininfluente, dal 4 al 6% comincia ad essere caldo, dal 6 al 10% è fondamentale, sopra il 10% è un punto che fa girare tutto.

In questa partita il punto più importante ha avuto una volatility del 24.3% che è il match point, altissima come volatility.

Quant’è l’EI allora? 2,87. È alta, è bassa, chi lo sa? In questi casi i numeri adimensionali dicono poco o nulla se presi singolarmente, per avere senso bisognerebbe fare un confronto con le altre partite. Un esempio: semifinale del Roland Garros 2013 ha avuto EI 2,88 che è leggermente superiore a questa. Quella della finale degli Australian Open 2009 2.712, così come la finale di Wimbledon 2008 con 3.11. La semifinale degli Australian Open 2005 era arrivata a 3.43 (il massimo della serie TML). Le partite dominate si attestano attorno all’1. A conti fatti è la partita con il maggiore EI analizzata fino a questo momento.

Per cercare di normalizzare questo indice dobbiamo scoprire qual è il massimo possibile. In un match al meglio dei 3 e dei 5 set con tiebreak finale l‘EI massimo è 18. Questo numero è frutto della media che si ha se il match durasse all’infinito e ad ogni punto il servitore perdesse il servizio. È un caso limite, quasi immaginario, perché una partita non può durare all’infinito, e questo è un dato di fatto, ed è altamente improbabile che i 2 giocatori perdano sempre il servizio in modo da far convergere asintoticamente il valore verso questo massimo teorico. Se applichiamo lo stesso ragionamento ad un match con long set finale viene fuori che esso ha un EI massimo di 10,15. Questo implica che i 2 format presentato 2 massimi differenti, quindi per poter paragonare EI con format differenti è necessaria una normalizzazione. Il 2,3 agli US Open vale meno di un 2,3 degli altri Slam perché arriva in un teorico match che ha il tiebreak nel set decisivo. La normalizzazione impone di conseguenza un 2,87/10,15 = 0.287 Una normalizzazione a 1 dell’EI dà come output un 28.7% per la partita in esame (-71,7% dalla “partita perfetta”). A Wimbledon 2008 l’EI normalizzato a 1 era 30.64%.

Domination ratio

Per chi l’avesse dimenticato la dominatio ratio è data dal rapporto della percentuale dei punti vinti in risposta e quella dei punti persi al servizio. Che cosa ci dice? Ci dice quanto un giocatore è stato dominante rispetto al suo avversario in un set o nell’intero match. Nella maggior parte dei casi questa arride al vincitore ma può capitare che il vincitore lasci tanti punti al suo avversario pur vincendo quelli più importanti. La DR in questo caso premia il perdente.

Del dominio nel match ne abbiamo parlato così è meglio concentrarsi su quella dei singoli set.

  • Set 1

DR(Federer) = (1/5 + 0 + 2/6 + 1/5 + 0 + 7/16) / (1/5 + 0 + 1/5 + 1/5 + 0 + 2/6) = 1.25

DR(Roddick) = 0.80

  • Set 2

DR(Federer) = (1/5 + 2/6 + 1/5 + 1/5 + 1/5 + 1/5 + 3/7) / (0 + 1/5 + 1/5 + 1/5 + 2/6 + 1/5 + 2/7) = 1.24

DR(Roddick) = 0.805

  • Set 3

DR(Federer) = (1/5 + 0 + 4/10 + 1/5 + 2/6 + 2/6 + 2/6) / (1/5 + 0 + 1/5 + 0 + 0 + 0 + 1/6) = 3.18

DR(Roddick) = 0.31

  • Set 4

DR(Federer) = (2/6 + 0 + 3/8 + 2/6 + 2/6) / (2/6 + 4/6 + 2/6 + 1/5) = 0.90

DR(Roddick) = 1.11

  • Set 5

DR(Federer) = (3/8 + 0 + 2/6 + 1/5 + 0 + 1/5 + 2/6 + 1/5 + 1/5 + 1/5 + 3/6 + 0 + 3/8 + 2/6 + 6/10) / (1/5 + 1/5 + 0 + 1/5 + 1/5 + 1/5 + 2/6 + 1/5 + 3/8 + 2/6 + 1/5 + 0 + 2/5 + 0 + 0) = 1.35

DR(Roddick) = 0.74

Service domination e return domination

Non ci addentriamo in calcoli astrusi semplicemente stimiamo i punti vinti al servizio dai 2 giocatori e li rapportiamo al totale.

La service domination nei rispettivi set è stata del 73.91%, 76%, 79.73%, 66.04%, 74.55%.

La return domination, RD, è il reciproco in termini di percentuale della SD e misura quanto sia stata incisiva la risposta. Non è difficile arrivare alla soluzione.

La RD set-by-set è stata del 26.09%, 24%, 20.27%, 33.96%, 25.45%.

SD(totale) = (22+29+29+28+29+30+14+21+60+63)/ (33+36+39+36+41+33+23+30+86+79))*100 = 74.43%.

Ottima SD in tutti i set. Il servizio ha dominato per tutta la partita. Classica partita da erba da bombardieri.