Stats & AnalysisUltimi articoliUS Open

TML Classic: Semifinali US Open 2011, Djokovic vs Federer, Analisi statistica

Dopo la descrizione dettagliata della partita passiamo all’analisi statistica. Il ciclo degli Slam del TML Classic si chiude per quest’anno con una partita degli US Open, dopo l’analisi della semifinale degli Australian Open 2005 tra Federer e Safin, quella della semifinale tra Federer e Djokovic al Roland Garros 2011 e la finale di Wimbledon 2009 tra Federer e Roddick. Anche qui l’approfondimento sarà molto esaustivo e cercheremo anche di introdurre qualche nuovo parametro per descrivere determinati aspetti del gioco dell’uno o dell’altro contendente.

Punteggio

Si parte sempre dal punteggio che dice tanto, quasi tutto della partita, ma il quasi è più importante del tutto. 6-7(7) 4-6 6-3 6-2 7-5. Schema 2-2-1-1-1. Chiara rimonta da 2 set sotto. Primi 2 set combattuti, un po’ meno il 3° e il 4°. Equilibrio nel 5° con possibilità che ci sia stato match point per chi ha vinto, così come è stato (se il perdente arriva almeno a 5 game c’è questa possibilità).

Palle break

Analizziamo il numero delle palle break salvate/sprecate (ricordando sempre che sono dati complementari). Il vincitore ha dovuto affrontare 5 palle break e ne ha salvate 2. Numero molto superiore per Federer che si è fatto breakkare 6 volte su 12 occasioni. Con 3 break in più sembrerebbe che la partita sia stata dominata da Djokovic che presenta in questa sezione una statistica migliore per via del 3° e 4° set maggiormente dominati rispetto al 1° e al 2° da chi l’ha vinto. Nole merita la vittoria che poi ottiene, ricordando sempre che ha dovuto affrontare 2 match point contro. Nessun break nel primo set deciso al tiebreak. Un break in più per Federer nel 2°. Immacolato Nole nel 3° e 4° set, mentre Federer va sotto pesantemente. Il break in più nel 5° fa girare la partita in direzione Djokovic.

Servizio

I dati al servizio ci dicono che Federer ha messo più prime in campo: 61.3% contro il 58.6%. Però la resa è tutta dalla parte serba con un sorprendente 82.9% che è molto superiore al 67.0% di Roger. Estremo equilibrio con la seconda, quasi uguali nel rendimento: 55.6% vs 55.2%. È tutto nel rendimento con la prima la differenza che stava per fare soccombere chi ha dominato in questa statistica.

Prima & seconda di servizio

Il dato set-by-set testimonia un Federer maggiormente propenso a mettere prime in campo in 3 casi su 5. Normale il 61.5% vs 59.5% del 1° parziale a favore di Roger che vince il set. Lo stesso caso nel 2°, ma qui il gap è alto e il set non poteva non andare a chi ha messo il maggior numero di prime in campo: 78.6% vs 57.1%. La partita gira nel 3° set con Nole che fa sua la statistica delle prime in campo. All’inizio con un piccolo gap: 54.2% vs 52.9% che si dilata nel 4° set con un 80% vs 64.3%. Federer va avanti solo nel 5° set, che ha perso. Anche il rendimento con la prima segue lo schema dei set, tranne l’estremo equilibrio nel 2° e nel 5°. Federer fa meglio con la seconda solo nel 4° set, perso, però non si può fare niente se Djokovic vince il 93.8% con la prima.

Return Points Winner

La RPW (Return Points Winner) sorride a Djokovic che vince complessivamente la guerra in risposta con un 37.4% contro 28.6%. Solo nel 2° set Federer ha fatto meglio rispetto a Nole. Per il resto va sempre sotto, anche pesantemente come nel 3° e 4° set. La differenza più importante è quella del 5° set: 38.2% vs 35.5% che dà la partita al numero 1 del mondo.

Doppi falli

Qui continuiamo a ribadire il concetto che non conta il numero di doppi falli, ma quando sono arrivati. Per completezza diciamo che Djokovic ne ha commesso 6, Federer 4, ma andiamo nel dettaglio.

Djokovic

  1. Djokovic commette il 1° doppio fallo nel tiebreak del 1° set sul 5-2 Federer. V= 5.1. Volatility molto alta. Grave.
  2. Il 2° sul 5-3 Federer 40-15 Djokovic del 2° set. V= 0.1. Volatility molto bassa. Ininfluente.
  3. Il 3° sul 3 pari del 2° set. V= 2.3. Volatility media. Medio.
  4. Il 4° sul 5-2 per Djokovic 40-15 Nole del 4° set. Arriva sul set point. V= 0.1. Molto bassa. Ininfluente.
  5. Il 5° sul 3-2 Federer 15-0 Nole del 5° set. V=4. Media. Media.
  6. Il 6° sul 4-3 Federer 0-30 del 5° set. V=10.8. Vale il set point. Gravissimo.

 

Federer

  1. Federer commette il 1° doppio fallo nel tiebreak del 1° set sul 5-3 Federer. V= 3.6. Volatility medio-alta. Mediamente grave.
  2. Il 2° sul 1-0 Djokovic 0-0 del 3° set. V=1.1. Volatility bassa. Inifluente
  3. Il 3° sul 2-2 15-0 Federer del 5° set. V=3.9. Volatility media. Mediamente grave
  4. Il 3° sul 5-3 Federer vantaggio Djokovic del 5° set. V=19.7. Volatility altissima. Fatale

 

Vincenti/Non forzati

Come sempre il bilancio dei vincenti e dei non forzati lascia spazio a varie interpretazioni. La prima nasce spontanea perché questi dati non sono mai precisi al 100% o quantomeno riconosciuti all’unanimità motivo per cui il sito dell’ATP non li riporta mai. La seconda, che è quella che pesa maggiormente, è che nelle rispettive categorie sono inclusi colpi anche diametralmente opposti che però, seguendo semplicemente una regola di inclusione, sono messi tutti nello stesso calderone. Ma chiudiamo l’excursus filosofico per concentrarsi sui numeri.

Teorema Tommasi. Il differenziale complessivo dei vincenti e dei gratuiti è positivo per Djokovic, +5, negativo per Federer, -7. Il teorema ci suggerirebbe una partita né bella né brutta. C’è un -2 che sarebbe pendere la bilancia per il brutto, ma i numeri sono troppo poco consistenti per dare questo giudizio.

Differenziale FH e BH

Forehand

Il differenziale complessivo tra W/UE di dritto denota un bilancio positivo per Djokovic, neutro per Federer. Molto squilibrio nei numeri a favore del numero 1 del mondo con un +6 per Nole e 0 per Federer. Solo nel e set Federer va a +3 e +5, poi per il resto sempre negativo. Nole sbaglia di meno: negativo per il lui solo il 1° set.

Backhand

Il rovescio di Federer non ha funzionato. In nessun set è andato in bilancio positivo. Impietoso -20 totale. Anche Djokovic va in negativo: -7 per lui.

Vediamo il bilancio complessivo set-by-set

  1. -4 Federer, -3 Djokovic
  2. +3 Federer, -1 Djokovic
  3. -7 Federer, +2 Djokovic
  4. -4 Federer, -4 Djokovic
  5. -1 Federer, +3 Djokovic

Key Points

Ed ecco di nuovo i nostri key points. Per chi si fosse perso le puntate precedenti essi sono i punti chiave ossia quei punti che fanno girare un game da una parte o dall’altra. Sono divisi in 3 categorie in ordine di importanza: in prima fila i break points che sono essenziali, secondo gradino per i game points e terzo per i deuce points, i punti che si giocano sulla parità.

Già si è parlato delle palle break nella sezione apposita, ma ricordiamo il 6/12 vs 2/5 (0.5 > 0.4). Tutto a favore di Djokovic. Federer ha messo in campo la prima 5 volte quando ha dovuto fronteggiare una palla break, l’42% delle volte, pochissimo, mentre Nole il 60% delle volte. Gli unforced condannano lo svizzero, anche se ne ha commesso solo 1 in più.

In generale Djokovic è stato più lucido nei punti importanti della partita. Il rendimento complessivo nei key points sorride al serbo con un 72% di punti vinti contro il 60% di Federer. In totale le palle critiche sono state sbilanciate verso lo svizzero: 63 vs 39. Nonostante i 2 match point salvati Roger ha dovuto fronteggiare più pericoli con un rendimento inferiore all’avversario che non demerita così la vittoria finale.

Winning probability

Ritorna di prepotenza la winning probability che attraverso un grafico in 2 dimensioni molto semplice ci regala una radiografia della partita. L’andamento del match point-by-point è un dato imprescindibile per una analisi che vuole essere dettagliata e condivisa da tutta, se poi questa è corroborata da un grafico che dà l’idea immediata di come la partita sia andata in un verso o nell’altro siamo a cavallo.

Ribadiamo alcuni concetti che sono alla base di questo tipo di analisi. Entrambi i giocatori partono dalla stessa percentuale di probabilità di vincere, quindi 50 e 50, si assegna una P di probabilità di ottenere il punto sul proprio servizio e grazie ad un particolare algoritmo si calcola punto per punto quant’è la probabilità che uno giocatore porti a casa un match. In alcuni studi la P è diversa per i 2 giocatori. Una scelta plausibile che però trova il difetto di produrre dei grafici in cui chi ha la P maggiore ha sempre una WP maggiore del 50% e solo nei casi in cui sta perdendo malamente il match questa scende sotto il livello del 50%. Questo tipo di approccio è utile per le agenzie di scommesse che lo adottato per dare le quote live, ma non è utile in un’analisi a posteriori perché un giocatore favorito avrà sempre numeri alti nonostante magari in certe situazioni si trovi pesantemente sotto nel punteggio.

A parte i primi scampoli di primo set dove il grafico oscilla attorno al 50% si ha la prima sgasata di Federer che ottiene il break che gli vale il primo set. Da quel momento in poi è sempre avanti lui nel punteggio fino ad arriva al picco (1) all’inizio del 3° set. WP = 13.4. Roger domina in lungo e largo fino all’inizio nel 3° in cui Djokovic accelera e appiattisce la curva con 2 break nel 4° parziale che riporta tutto al 50%. Nel 5° set Federer accelera la fine della partita fino ad arrivare al 1° match point che vale il picco in basso (2) dell’1.3%, il più basso mai fatto registrare dal TML Classic (il minimo teorico si aggira attorno allo 0.08% con una partita ribaltata dal 6-0 6-0 5-0 40-0).

Il dominio

La netta prevalenza del colore rosso del grafico sembrerebbe dirci che è stato Federer a dominare, e non poteva essere altrimenti.

63,76% Federer e 36,24% Djokovic.

Comeback factory

Il comeback factory misura in termini numerici la consistenza della rimonta del vincitore. Djokovic ha avuto il picco più basso del 1.3% di WP per cui ha guadagnato il 98,7% di WP per aggiudicarsi l’incontro. CF =98,7%. Grandissimo CF. l’ 1.3% arriva sul  5-3 40-15 Federer del 5° set.

Excitement index

Siamo arrivati al punto più controverso delle statistiche avanzate del tennis ossia cercare di quantificare quanto un match sia stato eccitante-bello. Inutile dire che non potrà esistere un metodo universalmente condiviso, ma andare a quantificare quanto il match ha avuto capovolgimenti di fronte che sono alla base di una partita “eccitante”, è un buon inizio. L’EI si basa sulla volatility che misura quanto il punto sia stato importante (già c’è stato un accenno nella sezione doppi falli). La volatility è la differenza in valore assoluto tra la WP del punto precedente con il punto corrente. Misura quanto quel punto ha fatto cambiare le sorti del match e di conseguenza quello che sposta maggiormente la WP è il più importante. Un punto con v compreso tra 1 e 3% è un punto ininfluente, dal 4 al 6% comincia ad essere caldo, dal 6 al 10% è fondamentale, sopra il 10% è un punto che fa girare tutto.

In questa partita il punto più importante ha avuto una volatility del 19.7% che è punto che consegna a Djokovic il break necessario per vincere il match, altissima come volatility.

Quant’è l’EI allora? 2,21. È alta, è bassa, chi lo sa? In questi casi i numeri adimensionali dicono poco o nulla se presi singolarmente, per avere senso bisognerebbe fare un confronto con le altre partite. Un esempio: semifinale del Roland Garros 2013 ha avuto EI 2,88 che è superiore a questa. Quella della finale degli Australian Open 2009 2.712, così come la finale di Wimbledon 2008 con 3.11. La semifinale degli Australian Open 2005 era arrivata a 3.43 (il massimo della serie TML). Le partite dominate si attestano attorno all’1.

Per cercare di normalizzare questo indice dobbiamo scoprire qual è il massimo possibile. In un match al meglio dei 3 e dei 5 set con tiebreak finale l‘EI massimo è 18. Questo numero è frutto della media che si ha se il match durasse all’infinito e ad ogni punto il servitore perdesse il servizio. È un caso limite, quasi immaginario, perché una partita non può durare all’infinito, e questo è un dato di fatto, ed è altamente improbabile che i 2 giocatori perdano sempre il servizio in modo da far convergere asintoticamente il valore verso questo massimo teorico. Se applichiamo lo stesso ragionamento ad un match con long set finale viene fuori che esso ha un EI massimo di 10,15. Questo implica che i 2 format presentato 2 massimi differenti, quindi per poter paragonare EI con format differenti è necessaria una normalizzazione. Il 2,3 agli US Open vale meno di un 2,3 degli altri Slam perché arriva in un teorico match che ha il tiebreak nel set decisivo. La normalizzazione impone di conseguenza un 2.21/18 = 0.123 (che sarebbe 2.21/10.15 negli altri Slam) Una normalizzazione a 1 dell’EI dà come output un 12.3% per la partita in esame (-87,7% dalla “partita perfetta”). A Wimbledon 2008 l’EI normalizzato a 1 era 30.64%.

Domination ratio

Per chi l’avesse dimenticato la dominatio ratio è data dal rapporto della percentuale dei punti vinti in risposta e quella dei punti persi al servizio. Che cosa ci dice? Ci dice quanto un giocatore è stato dominante rispetto al suo avversario in un set o nell’intero match. Nella maggior parte dei casi questa arride al vincitore ma può capitare che il vincitore lasci tanti punti al suo avversario pur vincendo quelli più importanti. La DR in questo caso premia il perdente.

Del dominio nel match ne abbiamo parlato così è meglio concentrarsi su quella dei singoli set

  • Set 1

DR(Djokovic) = (0 + 0 + 2/6 + 2/6 + 2/6 + 1/5 + 3/8) / (0 + 1/5 + 1/5 + 1/5 + 1/5 + 1/5 + 4/8) = 1.05

DR(Federer) = 0.952

  • Set 2

DR(Djokovic) = (0 + 3/8 + 4/6 + 2/6 + 1/5) / (1/5 + 3/8 + 1/5 + 4/4 + 2/6) = 0.75

DR(Federer) = 1.34

  • Set 3

DR(Djokovic) = (9/16 + 3/8 + 0 + 2/6) / (0 + 1/5 + 1/5 + 0 + 2/6) = 1.73

DR(Federer) = 0.58

  • Set 4

DR(Djokovic) = (4/5 + 1/5 + 4/6 + 5/12) / (0 + 0 + 0 + 3/8) = 5.55

DR(Federer) = 0.18

  • Set 5

DR(Djokovic) = (1/5 + 0 + 2/6 + 0 + 6/10 + 4/5) + (1/5 + 2/6 + 2/6 + 4/4 + 1/5 + 1/5) = 0.85

DR(Federer) = 1.17

Service domination e return domination

Non ci addentriamo in calcoli astrusi semplicemente stimiamo i punti vinti al servizio dai 2 giocatori e li rapportiamo al totale.

La service domination nei rispettivi set è stata del 75%, 63.16%, 68.97%, 64.58%, 63.08%.

La return domination, RD, è il reciproco in termini di percentuale della SD e misura quanto sia stata incisiva la risposta. Non è difficile arrivare alla soluzione.

La RD set-by-set è stata del 25%, 36,84%, 31.03%, 35.42%, 36.92%.

SD(totale) = (29 + 28 + 19 + 17 + 20 + 20 + 14 + 17 + 21 + 20) / (38 + 38 + 30 + 27 + 24 + 34 + 17 + 31 + 32 + 33) *100 = 67.43%.

Ottima SD solo nel 1° set e in parte nel 3°, per il resto numeri normali per una partita su cemento.