Australian OpenUltimi articoli

TML Classic: Australian Open 2009,Nadal vs Verdasco, Analisi statistica

Ormai appuntamento fisso per gli Slam continua la serie di articoli che analizzano in maniera molto approfondita la sfida descritta nell’articolo precedente. Cominciano ad essere un bel po’ di partite. Ricordiamo sempre che questo tipo di “articoli” non sono usa e getta. Possono e devono essere conservati per i momenti in cui si richiede di ricordare questi match. Non potendo ricordare tutti i punti e tutte le stats è molto utile rispolverarli per avere un’idea precisa di quello che è successo, perché non tutto si può ricordare, anzi.

Punteggio

Si parte sempre dal punteggio che dice tanto, quasi tutto della partita, ma il quasi è più importante del tutto. 6-7(4) 6-4 7-6(2) 6-7(1) 6-4. Schema 2-1-1-2-1. Il vincitore va sotto nel primo, poi vince 2 set, il 2° dei quali lottato. C’è un 4° set che potrebbe far pensare ad un match point sprecato, che però non c’è. Un solo break in più nel set decisivo.

Palle break

Analizziamo il numero delle palle break salvate/sprecate (ricordando sempre che sono dati complementari). Il vincitore ha dovuto affrontare 4 palle break e ne ha salvate 2. Numeri infinitamente superiori per Verdasco che si è fatto breakkare 4 volte su 20 occasioni. Con 2 break in più sembrerebbe che la partita sia stata dominata da Nadal però non è tutto oro quello che è luce. In effetti è stato Verdasco a condurre i giochi ma in alcuni game ha dovuto affrontare tante palle break. Nadal merita la vittoria che poi ottiene per il break in più nel parziale decisivo che appare il più dominato dal maiorchino. 7/8 per Verdasco significa che ha sofferto tanto e lo 0/0 di Nadal ci dice che Rafa ha vinto bene il set che conta più di tutti. Da sottolineare i set immacolati per il numero 1 del mondo: 2°, 4° e 5°…e poteva anche perdere la partita.

Servizio

I dati al servizio ci dicono che Nadal ha messo più prime in campo: 74% contro il 70.3% dell’avversario. Numeri altissimi che testimoniano la qualità della partita. La resa è dalla parte maiorchina con un buon 72.7% di poco superiore al 69.8% di Fernando. Lo stesso gap lo ritroviamo sulla seconda di servizio, però un po’ più ampio: 60% vs 55.6%. Queste 2 stats danno ragione al numero 1 del mondo che così si ritrova davanti nelle 3 statistiche (obsolete) che riguardano il servizio.

Prima & seconda di servizio

Il dato set-by-set testimonia un dato ondivago sulle prime in campo nonostante poi Nadal prevalga nel computo generale. Nel primo bene Verdasco che è davanti con il 75.5% contro il 72.3% dell’avversario. Il dato gira nel secondo set così come chi lo vince. Impressionante l’88.9% del numero 1 del mondo. Nando si mantiene però il suo dato è molto più basso: 67.6%. Il numero 15 del mondo fa sua questa stat nel 3° set pur perdendolo. Dove l’ha perso il set? Nella resa con la seconda: un impietoso 35.7% non può bastare se dall’altra parte c’è un 60%. Nadal restituisce il favore nel 4° parziale con un set di dati simile al precedente ma a parti invertite. Rafa vince il 37.5% con la seconda, bene Verdasco con una resa del 77.8%. Quasi perfetto Rafacito nell’ultimo set in cui domina sia le statistiche riguardanti la prima di servizio e la seconda. Da evidenziare il 100% dei punti vinti con la seconda.

Return Points Winner

La RPW (Return Points Winner) sorride a Nadal che vince complessivamente la guerra in risposta con un 34.4% contro 30.6%. Solo nel e 4° set Verdasco ha fatto meglio rispetto a Rafa. Per il resto va sempre sotto, anche pesantemente, come nel 5° set. Qui c’è la differenza più importante: 41% vs 13% che dà la partita al numero 1 del mondo.

Doppi falli

Qui continuiamo a ribadire il concetto che non conta il numero di doppi falli, ma quando sono arrivati. Per completezza diciamo che Nadal ne ha commesso 3, Verdasco 4, ma andiamo nel dettaglio.

Nadal

  1. Nadal commette il 1° doppio fallo nel 2° set sul 4-4 15-0. V= 2. Volatility medio-bassa.
  2. Il 2° doppio fallo arriva nel 3° set sul 5-5 40-15. V= 0.8. Volatility bassa.
  3. Il 3° doppio fallo arriva nel 4° set sullo 0-1 Verdasco 0-15. V= 3.3. Volatility medio-bassa.

Verdasco

  1. Verdasco commette il 1° doppio fallo nel 4° set sul 5-5 15-0. V= 2.6. Volatility medio-bassa.
  2. Il 2° doppio fallo arriva nel 5° set sul 3-2 Nadal 30-30. V= 10.1. Volatility altissima.
  3. Il 3° doppio fallo arriva nel 5° set sul 5-4 Nadal 0-30. V= 5.6. Volatility alta.
  4. Il 4° doppio fallo arriva nel 5° set sul 5-4 Nadal 30-40. V= 24.3. Volatility massima.

 

Vincenti/Non forzati

Come sempre il bilancio dei vincenti e dei non forzati lascia spazio a varie interpretazioni. La prima nasce spontanea perché questi dati non sono mai precisi al 100% o quantomeno riconosciuti all’unanimità, motivo per cui il sito dell’ATP non li riporta mai. La seconda, che è quella che pesa maggiormente, è che nelle rispettive categorie sono inclusi colpi anche diametralmente opposti che però, seguendo semplicemente una regola di inclusione, sono messi tutti nello stesso calderone. Ma chiudiamo l’excursus filosofico per concentrarsi sui numeri.

Teorema Tommasi. Il differenziale complessivo dei vincenti e dei gratuiti è positivo per entrambi i giocatori: +32 per Verdasco, +24 per Nadal. Il teorema ci suggerirebbe una partita bella e così è stato. La tripla cifra di Nando è un indice sia di qualità che di straordinarietà: difficile andare a risalire ad un match con così tanti vincenti complessivi sia per un giocatore che nel computo totale.

Differenziale FH e BH

Forehand

Il differenziale complessivo tra W/UE di dritto denota un bilancio positivo per entrambi. Numeri molto simili con un +13 per Verdasco e +14 per Nadal. I saldi sono positivi per entrambi in tutti i set, solo nel 5° set però Nando va sotto con un leggero -1 che poteva essere anche più pesante visto l’andamento del parziale.

Backhand

Il rovescio di entrambe i giocatori non è stato perfetto. -6 per Verdasco, -3 per Nadal. Però c’era da aspettarselo visto che i 2 spagnoli non hanno nel rovescio il loro colpo migliore.

Vediamo il bilancio complessivo set-by-set

  1. +4 Nadal   |+7 Verdasco
  2. +10 Nadal |+7 Verdasco
  3. +6 Nadal   |+8 Verdasco
  4. +1 Nadal    |+13 Verdasco
  5. +6 Nadal   |-6 Verdasco

Key Points

Ed ecco di nuovo i nostri key points. Per chi si fosse perso le puntate precedenti, essi sono i punti chiave ossia quei punti che fanno girare un game da una parte o dall’altra. Sono divisi in 3 categorie in ordine di importanza: in prima fila i break points che sono essenziali, secondo gradino per i game points e terzo per i deuce points, i punti che si giocano sulla parità.

Già si è parlato delle palle break nella sezione apposita, ma ricordiamo il 16/20 vs 2/4 (0.8 > 05). Tutto a favore di Verdasco che vince la guerra delle proporzioni ma non quella del totale che in questi casi è essenziale. Entrambi i giocatori hanno messo il 75% di prime quando hanno dovuto affrontare una palla break. Gli unforced condannano Nando, pesa come un macigno il doppio fallo su break/match point.

In generale Nadal è stato più lucido nei punti importanti della partita. Il rendimento complessivo nei key points sorride al maiorchino con un 73% di punti vinti contro il 60% di Verdasco. In totale le palle critiche sono state sbilanciate verso Nando: 96 vs 56. In generale così il numero 15 del mondo ha affrontato molti più pericoli ed inevitabilmente ha dovuto soccombere perché sono diventate troppe le criticità da salvare.

Winning probability

Ritorna di prepotenza la winning probability che attraverso un grafico in 2 dimensioni molto semplice ci regala una radiografia della partita. L’andamento del match point-by-point è un dato imprescindibile per una analisi che vuole essere dettagliata e condivisa da tutta, se poi questa è corroborata da un grafico che dà l’idea immediata di come la partita sia andata in un verso o nell’altro siamo a cavallo.

Ribadiamo alcuni concetti che sono alla base di questo tipo di analisi. Entrambi i giocatori partono dalla stessa percentuale di probabilità di vincere, quindi 50 e 50, si assegna una P di probabilità di ottenere il punto sul proprio servizio e grazie ad un particolare algoritmo si calcola punto per punto quant’è la probabilità che uno giocatore porti a casa un match. In alcuni studi la P è diversa per i 2 giocatori. Una scelta plausibile che però trova il difetto di produrre dei grafici in cui chi ha la P maggiore ha sempre una WP maggiore del 50% e solo nei casi in cui sta perdendo malamente il match questa scende sotto il livello del 50%. Questo tipo di approccio è utile per le agenzie di scommesse che lo adottato per dare le quote live, ma non è utile in un’analisi a posteriori perché un giocatore favorito avrà sempre numeri alti nonostante magari in certe situazioni si trovi pesantemente sotto nel punteggio.

A parte i primi scampoli di primo set dove il grafico oscilla attorno al 50% si ha la prima sgasata di Verdasco che vince il 1° set (1). Da quel momento in poi è sempre avanti lui nel punteggio fino ad arriva al picco (2) all’inizio del 2° set. WP = 25,6%. Nadal aggiusta il tiro e pareggia i conti dei set e porta tutto al 50%. Break e contro break fanno vibrare il grafico fino alla vittoria del set che porta il maiorchino al 75%. Rafa raggiunge un picco al punto (3) con 78.6%. Nando recupera tutto il gap fino a pareggiare i conti all’inizio del 5° set. Il numero 1 del mondo spadroneggia per tutto l’ultimo parziale, Verdasco sta per portasi a casa il match sul 4 pari 0-30 sul servizio Nadal (4), poi tutto gira e Rafa segue l’escalation che lo porta alla vittoria.

Il dominio

La netta prevalenza del colore blu del grafico sembrerebbe dirci che è stato Nadal a dominare, lo è stato, ma di poco.

53,42% Nadal e 46,58% Verdasco.

Comeback factory

Il comeback factory misura in termini numerici la consistenza della rimonta del vincitore. Nadal ha avuto il picco più basso del 25.6% di WP per cui ha guadagnato il 74,4% di WP per aggiudicarsi l’incontro. CF =74,4%. CF medio. Il 25.6% arriva sul 3-3 0-30 servizio Rafa del 2° set.

Excitement index

Siamo arrivati al punto più controverso delle statistiche avanzate del tennis ossia cercare di quantificare quanto un match sia stato eccitante-bello. Inutile dire che non potrà esistere un metodo universalmente condiviso, ma andare a quantificare quanto il match ha avuto capovolgimenti di fronte che sono alla base di una partita “eccitante”, è un buon inizio. L’EI si basa sulla volatility che misura quanto il punto sia stato importante (già c’è stato un accenno nella sezione doppi falli).

La volatility è la differenza in valore assoluto tra la WP del punto precedente con il punto corrente. Misura quanto quel punto ha fatto cambiare le sorti del match e di conseguenza quello che sposta maggiormente la WP è il più importante. Un punto con v compreso tra 1 e 3% è un punto ininfluente, dal 4 al 6% comincia ad essere caldo, dal 6 al 10% è fondamentale, sopra il 10% è un punto che fa girare tutto.

In questa partita il punto più importante ha avuto una volatility del 24.3% che è match point che consegna la vittoria a Nadal con tanto di doppio fallo. Volatility altissima.

Quant’è l’EI allora? 2.76. È alta, è bassa, chi lo sa? In questi casi i numeri adimensionali dicono poco o nulla se presi singolarmente, per avere senso bisognerebbe fare un confronto con le altre partite. Un esempio: semifinale del Roland Garros 2013 ha avuto EI 2,88 che è superiore a questa. Quella della finale degli Australian Open 2009 2.712, così come la finale di Wimbledon 2008 con 3.11. La semifinale degli Australian Open 2005 era arrivata a 3.43 (il massimo della serie TML). Le partite dominate si attestano attorno all’1.

Per cercare di normalizzare questo indice dobbiamo scoprire qual è il massimo possibile. In un match al meglio dei 3 e dei 5 set con tiebreak finale l‘EI massimo è 18. Questo numero è frutto della media che si ha se il match durasse all’infinito e ad ogni punto il servitore perdesse il servizio. È un caso limite, quasi immaginario, perché una partita non può durare all’infinito, e questo è un dato di fatto, ed è altamente improbabile che i 2 giocatori perdano sempre il servizio in modo da far convergere asintoticamente il valore verso questo massimo teorico. Se applichiamo lo stesso ragionamento ad un match con long set finale viene fuori che esso ha un EI massimo di 10.15. Questo implica che i 2 format presentato 2 massimi differenti, quindi per poter paragonare EI con format differenti è necessaria una normalizzazione. Il 2,3 agli US Open vale meno di un 2,3 degli altri Slam (disputati fino a ora, sappiamo che dal 2019 Wimbledon e Australian Open cambieranno) perché arriva in un teorico match che ha il tiebreak nel set decisivo. La normalizzazione impone di conseguenza un 2.76/10,15 = 0.271 (che sarebbe 2.21/18 agli US Open) Una normalizzazione a 1 dell’EI dà come output un 27.1% per la partita in esame (-72,8% dalla “partita perfetta”). A Wimbledon 2008 l’EI normalizzato a 1 era 30.64%.

Domination ratio

Per chi l’avesse dimenticato la dominatio ratio è data dal rapporto della percentuale dei punti vinti in risposta e quella dei punti persi al servizio. Che cosa ci dice? Ci dice quanto un giocatore è stato dominante rispetto al suo avversario in un set o nell’intero match. Nella maggior parte dei casi questa arride al vincitore ma può capitare che il vincitore lasci tanti punti al suo avversario pur vincendo quelli più importanti. La DR in questo caso premia il perdente.

Del dominio nel match ne abbiamo parlato così è meglio concentrarsi su quella dei singoli set

  • Set 1

DR(Nadal) = (4/10 + 0 + 4/10 + 1/5 + 1/5 + 4/10 + 1/5) / (2/6 + 3/8 + 1/5 + 2/6 + 4/10 + 1/5 + 3/6) = 0.7686832740

DR(Verdasco) = 1.300925925

  • Set 2

DR(Nadal) = (0 + 0 + 0 + 6/14 + 5/8) / (0 + 2/4 + 1/5 + 2/6 + 2/6 ) =  0.7709059233

DR(Verdasco) = 1.297175141

  • Set 3

DR(Nadal) = (10/18 + 1/5 + 4/6 + 3/8 + 2/6 + 2/6 + 2/4) / (2/6 + 4/4 + 4/10 + 4/6 + 1/5 + 1/5 + 0) = 1.058531746

DR(Verdasco) = 0.9447047797

  • Set 4

DR(Nadal) = (1/5 + 4/10 + 0 + 1/5 + 0 + 1/5 + 0) / (2/6 + 0 + 1/5 + 2/6 + 2/6 + 0 + 3/4) = 0.5128205128

DR(Verdasco) = 1.95

  • Set 5

DR(Nadal) = (4/10 + 1/5 + 3/8 + 4/10 + 4/6) / (0 + 0 + 1/5 + 0 + 2/6) = 3.828125

DR(Verdasco) = 0.2612244897

Service domination e return domination

Non ci addentriamo in calcoli astrusi semplicemente stimiamo i punti vinti al servizio dai 2 giocatori e li rapportiamo al totale:

La service domination nei rispettivi set è stata del: 67.37%, 70.49%, 57.45%, 76.39%, 69.35%.

La return domination, RD, è il reciproco in termini di percentuale della SD e misura quanto sia stata incisiva la risposta. Non è difficile arrivare alla soluzione.

La RD set-by-set è stata del: 32.63, 29.51, 42.55, 23.61, 30.65.

SD(totale) = (30 + 34 + 20 + 23 + 25 + 29+ 25 + 30 + 20 + 23) / (45 + 50 + 31 + 30 + 49 + 45 + 32 + 40 + 36 + 26) * 100= 67.45%

Ottima SD sempre alta tranne nel 3° set pieno di break.