ATPEditorialeUltimi articoli

TML Classic: Finale Australian Open 2009, Nadal vs Federer, Analisi statistica

australian-open-2016-stats

Dopo la descrizione dettagliata della partita passiamo all’analisi statistica. Così come successo per la finale del 2012 anche qui l’approfondimento sarà molto esaustivo e cercheremo anche di introdurre qualche nuovo parametro per descrivere determinati aspetti del gioco dell’uno o dell’altro contendente.

Punteggio

Il primo step dell’analisi è il punteggio che recita: 7-5, 3-6, 7-6(3), 3-6, 6-2. Punteggio molto altalenante a prima vista che ci dà subito l’idea di un’anomalia statistica che è tipica di un punteggio sinusoidale, ossia vittoria dei set in maniera alternata e numero di set dispari. I 2 set vinti dal perdente, in questo caso Federer, sono stati dominati maggiormente rispetto agli altri 2 speculari: il 1° 6-3 batte il 7-5 e il 2° 6-3 batte il 7-6, poi chiusura facile di Nadal con un netto 6-2 che dimostra come la partita sia scivolata via del set conclusivo. Il maggiore dominio in 2 parziali contro 1 ci suggerisce che magari Federer ha fatto più punti dell’avversario, eventualità che realmente si è verificata, e che in alcuni casi la domination ratio set-by-set è stata appannaggio dello svizzero. Anche questa congettura è verificata, ma andiamo avanti.

Palle break

australian-open-2009-finale-nadal-vs-federer-break-points

Analizziamo il numero delle palle break salvate/sprecate che ricordiamo essere dati complementari. Da qui risulta che Nadal ha dovuto fronteggiare 19 palle break e Federer 16. Siamo alle solite, nel Fedal è molto spesso Nadal a doversi salvare e Federer a sprecare palle break. In 13 delle 19 occasioni Rafa si è salvato, mentre Roger solo in 9 delle 16, quindi il numero 1 del mondo ha subito 6 break, mentre il numero 2 7. Dal punteggio non si direbbe che ci sia un così alto numero di break, ma la loro distribuzione non è omogenea da qui nascono i 5 set con il saliscendi. L’unico set in cui Federer non ha subito break è il 3° e l’ha perso, Nadal non ha subito break nel 3° e nel 5° e ha vinto entrambi i set. Altra caratteristica del Fedal: Federer deve brekkare necessariamente per portare a casa il set.

Servizio

I dati al servizio sono piuttosto anomali. Il 52.3% di prime di Federer è un parametro che conoscono tutti, o meglio tutti sanno che in questa partita ha messo in campo pochissime prime rispetto ai suoi standard. Ma un’analisi più approfondita rivela come per entrambi la resa con la seconda è stata scarsa e magicamente Federer si trova meglio con la prima, 73.3% vs 66.1% ma ha perso lo stesso, ma ricordiamo sempre che ha fatto più punti del suo avversario e questo dato ne è un indicatore preciso.

La prima di servizio

Analizzando la partita set-by-set vengono fuori altre anomalie. Nel primo set non ci sono problemi: il 58.1% di Nadal premia lo spagnolo a fronte del 54.3% di Federer che producono però una resa non proporzionale con Nadal che vince il 64% dei punti e Federer il 31.3%. Il secondo set stradominato da Federer vede un orribile 37% di prime in campo, con lo svizzero che però ha prodotto un risultato positivo per il 90% dei casi, un differenziale pazzesco. Mentre per Nadal c’è stato un leggero calo con 66.7% di prime in campo positive per il 58.3%. Il set è andato a Roger. Perché? Bhè è facile intuire come è andato benissimo in risposta con un RPW (Return Point Winner) del 50% contro il 33% di Nadal. Nel 3° set si ripete l’anomalia federiana, ma stavolta i numeri non sono così sbilanciati: 51.1% di prime con 79.2% di punti vinti mentre Rafa ha una percentuale maggiore di prime in campo, 69.1%, ma la resa è proporzionale: 63.2%. Qui è solo una questione di dettagli che hanno fatto andare il set allo spagnolo. 4° set dominato da Federer che continua ancora ad avere una resa superiore in termini di percentuale delle prime messe in campo: 61.5% con resa del 75%- 6-3 facile ancora frutto di un altissimo RPW del 50%. L’anomalia si ripete per l’ultima volta nel 5° set ma questa volta è Nadal a non sbagliare quasi mai con un 68.4% di prime in campo e una resa quasi ottimale del 92.3% ed è per questo motivo che la partita si è chiusa in fretta nell’ultimo e decisivo set.

La seconda di servizio

Pessima per entrambi i giocatori è stata la resa con la seconda. Vince di poco Nadal con un 47.6% vs 45.1%. Da notare però come chi ha fatto più punti con la seconda ha sempre vinto il set. E’ un altra prova empirica di quanto già esplicato nell’articolo precedente: chi fa più punti con la seconda porta a casa il match.

I doppi falli

Qui continuiamo a ribadire il concetto che non conta il numero di doppi falli, ma quando sono arrivati. Per completezza diciamo che Federer ne ha commessi 6, Nadal 4, ma andiamo nel dettaglio.

Nadal

  1. Il 1° doppio fallo è arrivato sul 3-2 del 2° set Nadal e 15 pari, quindi ininfluente, o meglio quasi ininfluente perché quel turno di servizio è stato perso da Rafa. Si può “pesare” la gravità del doppio fallo usando il parametro volatility che stabilisce quanto un punto sia importante. Nel caso specifico la volatility è 2.6%, una quantità piuttosto bassa, come era prevedibile.
  2. Il 2° arriva sul 1 pari del 3° 30-0, dopo uno scambio duro e con v = 1.1%. Doppio fallo quasi trascurabile.
  3. Il 3° sul 2 pari 40-15 nel 3°. v = 1%. Questo discorso del 2.
  4. Il 4° e ultimo sul 3 pari del 3° 0-0. v = 3.1%. Molto più alto degli altri, ma ancora ininfluente ai fini del punteggio.

Federer

  1. Il primo doppio fallo arriva nel game di apertura e proprio per questo motivo non è così determinante. Siamo sul 15-15 e la v = 2.1%.
  2. Grave il 2° che consegna il break a Nadal. Siamo sul 4-2 Federer del 1° set. v = 6.5%. Numero molto alto.
  3. Il 3° è di gravità estrema e arriva sul set point del tiebreak del 3°. 6 punti a 3 per Nadal e Federer che regala il set. v = 3.7%. (Non tanto alta perché il tiebreak era già compromesso).
  4. Il 4° è meno esiziale del 2. Siamo sul 2 pari nel 4° set e 3° deuce. v = 5.1%, altro fallo grave che avrebbe potuto consegnare la partita a Nadal se questi avesse concretizzato la successiva palla break.
  5. Il 5° è meno grave perché arriva sul 2-1 Nadal 30-0 Federer, ma ha un valore relativamente alto perché nei set decisivi ogni punto ha un peso specifico superiore dell’omologo dei set precedente. v = 4.5%.
  6. L’ultimo doppio fallo è quasi una resa. Siamo sul 5-2 Nadal del 5° e 0-30. v= 1.6%. Il valore è molto basso nonostante arrivi sul game finale, proprio perché ormai le sorti della partita era già ampiamente decisi.

La conclusione è molto semplice: Nadal ha commesso 4 doppi falli che hanno inciso pochissimo sull’andamento della partita, invece Federer ne ha messi di più e tutti di un certa gravità. Uno dei tanti motivi per cui Roger ha perso l’incontro.

Vincenti/Non forzati

Come sempre il bilancio dei vincenti e dei non forzati lascia spazio a varie interpretazioni. La prima nasce spontanea perché questi dati non sono mai precisi al 100% o quantomeno riconosciuti all’unanimità motivo per cui il sito dell’ATP non li riporta mai, la seconda che è quella che pesa maggiormente è che nelle rispettive categorie sono inclusi colpi anche diametralmente opposti che però, seguendo semplicemente una regola di inclusione, sono messi tutti nello stesso calderone. Ma chiudiamo l’excursus filosofico per concentrarsi sui numeri.

Teorema Tommasi. Il differenziale complessivo dei vincenti e dei gratuiti è negativo per entrambi. Partita brutta quindi? Definizione semplicistica e del tutto soggettiva che è impossibile districare usando solo ed esclusivamente i numeri. Quello che possiamo dire subito è che Federer ha avuto un bilancio negativo per colpa del 5° set in cui ha letteralmente mollato, quindi quel -3 poteva essere benissimo un +3 o superiore se solo Roger fosse stato più preciso nel set decisivo.

Non stupiscono i 64 vincenti di Federer e neanche i 44 di Nadal. Rafa ha commesso molti più gratuiti in relazione ai vincenti rispetto al suo avversario, ma questo non è una novità e non lo è neanche constatare come la maggior parte degli errori siano arrivati con il rovescio e il maggior numero di vincenti con il dritto.

Differenziale FH e BH

  1. Il differenziale complessivo tra W/UE di dritto denota un bilancio positivo per entrambi. Un ottimo risultato che dimostra, se mai ce ne fosse il caso, la qualità della partita. Federer ha un bilancio di +2, Nadal di +3. Andando a scrutare questa particolare statistica set-by-set notiamo come Federer ha un bilancio positivo nel 1°, nel 2°, nel 4° e negativo negli altri. Nadal è negativo nel 1°, nel 2° e neutro nel 5°. Il dato interessante è vedere il 11-7 nel 3° set a favore di Rafa che ha spinto tantissimo con il dritto però stava per perdere il set che si è concluso solo con il tiebreak.
  2. Il rovescio è andato nella direzione opposta del dritto. Saldo molto negativo per entrambi. -10 Federer, – 17 per Nadal. Il rovescio non ha funzionato per entrambi? No, non è così semplice la deduzione. Andando a rivedere la partita si scopre come i maggiori errori di rovescio siano arrivati perché entrambi i giocatori hanno cercato il punto con questo colpo spesso anche con soluzioni estreme e definitive che in alcuni hanno prodotto vincenti spettacolari, ma di più errori non forzati.

Vediamo il bilancio complessivo set-by-set

  1. -2 Federer, 0 Nadal
  2. +8 Federer, -5 Nadal
  3. -4 Federer, -6 Nadal
  4. + 5 Federer, -1 Nadal
  5. -10 Federer, -2 Nadal

Key Points

australian-open-2009-nadal-vs-federer-key-points

Ed ecco di nuovo i nostri key points. Per chi si fosse perso la puntata precedente essi sono i punti chiave ossia quei punti che fanno girare un game da una parte o dall’altra. Sono divisi in 3 categorie in ordine di importanza: in prima fila i break points che sono essenziali, secondo gradino per i game points e terzo per i deuce points, i punti che si giocano sulla parità.

Come già ricordato in precedenza Nadal ha affrontato 19 palle break vincendone 13 (68%), mentre Federer 16 di cui 9 vinte (56%). Già questo dato è significativo e come detto in precedenza ci sono tanti casi di Fedal con questi dati. Ma andiamo nel dettaglio. Quando Roger ha dovuto fronteggiare una palla break ha messo la prima nel 44% dei casi contro il 58% di Nadal, ha messo un ace (6%) contro i 2 di Nadal (11%). I servizi vincenti arridono di poco a Federer 13% vs 11% così come le risposte che hanno prodotto un forzato: sempre 13% vs 11%. Nadal vince la gara delle percentuali anche nelle risposte vincenti: 21% vs 19% e quella dei doppi falli esiziali: 0 contro 1 di Federer. A conti fatti qui è andato meglio Nadal molto più preciso e cinico nei momenti di massimo rischio.

Di contro però Federer ha avuto una maggiore percentuale di goal nella seconda e terza categoria che però, come è facile intuire contano molto meno. Roger vince la gara dei game points e dei punti sul deuce. Complessivamente Roger è davanti a Nadal nel computo totale dei punti chiave: 62% vs 58%. Questo ci dice che Roger ha chiuso bene i punti importanti ma questi sono stati distribuiti male del corso della partita e sono arrivati in momenti in cui il risultato del set era già acquisito.

Winning Probability

australian-open-2009-nadal-vs-federer-winning-prob-upload

Ritorna di prepotenza la winning probability che attraverso un grafico in 2 dimensioni molto semplice ci regala una radiografia della partita. L’andamento del match point-by-point è un dato imprescindibile per una analisi che vuole essere dettagliata e condivisa da tutta, se poi questa è corroborata da un grafico che dà l’idea immediata di come la partita sia andata in un verso o nell’altro sia a cavallo.

Ribadiamo alcuni concetti che sono alla base di questo tipo di analisi. Entrambi i giocatori partono dalla stessa percentuale di probabilità di vincente, quindi 50 e 50, si assegna una p di probabilità di ottenere il punto sul proprio servizio e grazie ad un particolare algoritmo si calcola punto per punto quant’è la probabilità che uno giocatore porti a casa un match. In alcuni studi la p è diversa per i 2 giocatori. Una scelta plausibile che però trova il difetto di produrre dei grafici in cui chi ha la p maggiore ha sempre una WP maggiore del 50% e solo nei casi in cui sta perdendo malamente il match questa scende sotto il livello del 50%. Questo tipo di approccio è utile per le agenzie di scommesse che lo adottato per dare le quote live, ma non è utile in un’analisi a posteriori perché un giocatore favorito avrà sempre numeri alti nonostante magari in certe situazioni si trovi pesantemente sotto nel punteggio.

Dal grafico si nota subito come sia una prima impennata a favore di Nadal che sale dopo il primo game attorno al 60% per via del break in apertura. Federer rimedia subito e riporta tutto sul 50-50 con il controbreak. Da subito c’è un picco verso il basso del 35.14% che premia Roger che si ritrova 4-2 e servizio nel primo parziale, ma questo vantaggio viene subito ricucito con il controrbreak e tenuta del successivo servizio che riporta tutto in parità. E’ un picco insignificante perché arriva nelle fasi iniziali ma sarà il massimo per il numero 2 del mondo.

Con la vittoria del primo set Rafa va al 68.75% e mantiene questo vantaggio per tutto il secondo parziale. Addirittura ha un picco del 79.5% che corrisponde al 3-2 e servizio 30-30 nel 2° set. Federer si riprende il break e da qui inizia la rimonta che lo porta a pareggiare i conti dei set.

Nel 3° parziale il pallino è nelle mani di Nadal che però rischia parecchio dovendo salvare tante palle break che danno i picchi in basso del 34.78% e del 37.51%, ma Rafa è bravo a cavarsela e la vittoria del set lo porta al canonico 75% di chi è avanti 2 set a 1.

I break e contro-break del 4° set fanno salire e scendere il grafico con Nadal però che non precipita e mantiene la quota di sicurezza arrivando anche al picco di 78.09% quando ha una palla break con 2 pari e 30-40 servizio Roger. Federer si salva e il break del 6° gioco dà il via alla rimonta che si concretizza con il secondo break che gli consegna il 6-3 finale e il 2 a 2 nel computo dei set. Ancora 50 e 50 quindi.

Da qui in avanti c’è poco da analizzare: Nadal domina in lungo e in largo il 5° e la sua curva si impenna e arriva presto al 100% che significa vittoria.

Questa analisi veloce ci permette di concludere che Federer non  ha mai avuto la possibilità di chiudere il match e neanche Nadal. Solo il 5° set ha deciso in maniera precisa chi doveva essere il vincitore.

Il dominio

La netta prevalenza del colore blu del grafico ci dice che è stato Rafa a “dominare” avendo avuto maggiori picchi ed è stato per molto più tempo in vantaggio. La vittoria finale gli consegna definitivamente lo scettro del dominio del match che in termini di percentuale di traduce con un:

59.3% Nadal vs 40.7% Federer.

Comeback factory

Il comeback factory misura in termini numerici la consistenza della rimonta del vincitore. Il nostro amico Jeff Sackmann la calcola come l’inverso della più bassa WP del vincitore, ma io dico che è meglio non fare conti in più e dare numeri adimensionali che non dicono niente. Seguendo Jeff dovrei dire che il CF è stato di 2.94, sì ma che vuol dire? Meglio dire che Nadal ha avuto il picco più basso del 34,78% di WP per cui ha guadagnato il 65.55% di WP per aggiudicarsi l’incontro. CF =34.78%.

Excitement index

Ahhhh. E siamo arrivati al punto più controverso delle statistiche avanzate del tennis ossia cercare di quantificare quanto un match sia stato eccitante->bello. Inutile dire che non potrà esistere un metodo universalmente condiviso, ma andare a quantificare quanto il match ha avuto capovolgimenti di fronte che sono alla base di una partita “eccitante” è un buon inizio. L’EI si basa sulla volatility che misura quanto il punto sia stato importante (già c’è stato un accenno nella sezione doppi falli). Sempre il nostro amico Jeff la quantifica come differenza in termini di percentuale tra la probabilità di  vittoria del punto da parte del servitore e quella di perdere il punto successivo. Definizione che lascia il tempo che trova personalmente, così mi sono permesso di semplificarla dicendo che la volatility è la differenza in valore assoluto tra la WP del punto precedente con il punto corrente. Mi sembra una definizione più consistente perché in termini pratici misura quanto quel punto ha fatto cambiare le sorti del match e di conseguenza quello che sposta maggiormente la WP è il più importante. Un punto con v compreso tra 1 e 3% è un punto inifluente, dal 4 al 6% comincia ad essere caldo, dal 6 al 10% è fondamentale, sopra il 10% è un punto che fa girare tutto. In questa partita il punto più importante ha avuto una volatility del 15.18% che è il punto che dà il 3-1 e servizio Nadal con break nel 5° set che sposta definitivamente la partita a favore del maiorchino.

Quant’è l’EI allora? 2,712. E’ alta, è bassa, chi lo sa? In questi casi i numeri adimensionali dicono poco o nulla se presi singolarmente, per avere senso bisognerebbe fare un confronto con le altre partite. Un esempio: la finale di W2008 ha avuto un EI di 3,11 che è molto superiore a questa. Le partite dominate si attestano attorno all’1. Quindi possiamo concludere che questa partita è stata parecchio eccitante ma ce ne sono altre sicuramente superiori.

Domination ratio

Per chi l’avesse dimenticato la dominatio ratio è data dal rapporto della percentuale dei punti vinti in risposta e quella dei punti persi al servizio. Che cosa ci dice? Ci dice quanto un giocatore è stato dominante rispetto al suo avversario in un set o nell’intero match. Nella maggior parte dei casi questa arride al vincitore ma può capitare che il vincitore lasci tanti punti al suo avversario pur vincendo quelli più importanti. La DR in questo caso premia il perdente.

Del dominio nel match ne abbiamo parlato così è meglio concentrarsi su quella dei singoli set.

  1. DR(Nadal) = (4/5 + 1/5 + 3/8 + 4/6 + 2/6 + 4/5) / (8/14 + 1/5 + 4/6 + 2/6 + 2/6 + 2/6) = 1.302246093

DR(Federer) = 0.7679040119

  1. DR (Nadal) = (2/6 + 0 + 4/6 + 2/6 + 1/5) / (2/6 + 4/10 + 4/6 + 8/14) = 0,7777

DR(Federer) = 1,285

  1. DR(Nadal) = (2/6 + 2/6 + 3/7 + 1/5 + 1/5 + 5/12 +2 /5) / (2/6 + 4/10 + 2/6 + 2/6 + 5/12 + 5/12 + 1/5) = 0.9500978473

DR(Federer) = 1,052523

  1. DR(Nadal) = (0 + 4/6 + 9/20 + 1/5) / (4/5 + 2/6 + 4/6 + 1/4) =0.6422764227

DR(Federer) = 1,556962

  1. DR(Nadal) = (2/6 + 4/6 + 6/8) / (1/5 + 0 + 2/6 + 0) = 3,28125

DR(Federer) = 0,304761905

In 4 casi su 5 la DR è a favore di chi vince il set come è logico aspettarsi, l’unico caso i cui c’è un’anomalia è il 3° set finito al tiebreak. E chi poteva essere penalizzato? Solo Federer. Segnamo un altro tassello che compone il mosaico del Fedal: dominare un set per poi perderlo sul filo di lana.

Service domination e return domination

Per concludere aggiungiamo qualche altro parametro tanto per dare pepe alle stats. Il primo riguarda il servizio. Ossia: quanto ha inciso il servizio nella dinamica della partita? Non ci addentriamo in calcoli astrusi semplicemente stimiamo i punti vinti al servizio dai 2 giocatori e li rapportiamo al totale.

La SD nei rispettivi set è stata del 52,56%, 58,73%, 63,46%, 58,33%, 65,12%.

La retun domination, RD, è il reciproco in termini di percentuale della SD e misura quanto sia stata incisiva la risposta. Non è difficile arrivare alla soluzione. La RD set-by-set è stata del 47.44%, 41,27%, 36%,54%, 41,67%, 34,88%.

Questi 2 nuovi coefficienti non dicono nulla da soli, per avere una certa consistenza bisogna usarlo per confrontare partite, partite su superfici diversi e giocatori con caratteristiche diverse.