Australian OpenUltimi articoli

TML Classic: Semifinali Australian Open 2005, Safin vs Federer. Analisi statistica

Dopo la descrizione dettagliata della partita passiamo all’analisi statistica. Riparte il ciclo degli Slam dopo il TML Classic della scorsa stagione: dopo la finale degli Australian Open 2012, la semifinale tra Nadal e Djokovic al Roland Garros 2013 e la finale di Wimbledon 2008 tra Nadal e Federer e la finale degli US Open 2009, si ritorna in Australia. Anche qui l’approfondimento sarà molto esaustivo e cercheremo anche di introdurre qualche nuovo parametro per descrivere determinati aspetti del gioco dell’uno o dell’altro contendente.

Punteggio

Si parte sempre dal punteggio che dice tanto, quasi tutto della partita, ma il quasi è più importante del tutto. 5-7, 6-4, 5-7, 7-6(6), 9-7. Questo ci dice che c’è stato un andamento ondivago nei primi 4 set in cui si è portato avanti Federer, vincitore del primo con un break in più dell’avversario. Safin vince il 2° anche lui con un break in più dell’avversario. Idem per Roger nel 3°. Il tiebreak e il “6” ci suggerisce che Roger potrebbe essere stato sul punto di vincere il set e quindi il match. Così come è stato realmente. Poi il 9-7 ci dice di un long set dove alla fine è prevalso semplicemente chi ne aveva di più.

Palle break

Analizziamo il numero delle palle break salvate/sprecate (ricordando sempre che sono dati complementari). Il vincitore ha dovuto affrontare 14 palle break e ne ha salvate 10. Quasi lo stesso numero per Federer, 13, che si è fatto breakkare in 4 occasioni, così come Safin. Questi numeri dimostrano lo straordinario equilibrio del match. 10/14 > 9/13, ma ci pochissimo. L’equilibrio delle palla break si riflette anche nell’analisi set-by-set. Solo il 1° ha visto un Federer praticamente perfetto, contro un Safin che deve salvare 4 palle break. Ne salva 3 e il break gli costa il set. Nel 2° set break in più per Marat e set per lui. Nel 3° set ci sono state 4 palle break per ognuno, ma la tds 4 ne ha salvate solo 2 contro le 3 del numero 1 del mondo che si aggiudica così il parziale. 4° set immacolato. 5° set con una marea di palle break e 3 break totali. Inutile dire che qui prevale in russo. Grande merito anche di avere dalla sua ben 7 palle break.

Servizio

Anche i dati al servizio certificano il grande equilibrio. Safin ha messo in campo il 58.9% di prime in campo, di poco avanti a Federer con il suo 56.9%. Roger va meglio nel rendimento con la prima, invece Safin è davanti con quella con la seconda. Dato, che ricordiamo, fa spostare molto spesso l’equilibrio in campo. Chi fa meglio con la seconda vince nella maggior parte dei casi il match.

Prima & seconda di servizio

L’equilibrio complessivo nel servizio si diluisce nell’analisi set-by-set. Impressionante è il 73.2% di prime in campo di Safin e il corrispettivo rendimento del 70% che però non gli hanno permesso di vincere il set, anzi è proprio in questo che ha dovuto affrontare 4 palle break a fronte delle 0 dell’avversario. Federer vince il parziale con un modesto 50% di di prime in campo. Allora come fa a vincere? Facile, ha un rendimento assurdo del 94.1% con la prima. Roger prevale anche nel rendimento con la seconda. L’anomalia delle prime in campo cambia padrone ma rimane. Federer ha un 69% di prime in campo. Safin 60.7%. Marat vince il set. Non perché ha un rendimento con la prima del 82.4%, Federer ha fatto meglio, ancora un assurdo 90%, ma perché con la seconda ha un rendimento ottimo del 63.6%. Malissimo il numero 1 del mondo con il 22.2% di rendimento con la seconda. Il set non poteva non essere russo. 3° set e 3° caso in cui c’è l’anomalia delle prime. Safin mette in campo il 53.5% di prime, Federer 43.2%. Il set è svizzero perché continua il rendimento straordinario con la prima: 81.3% contro un pessimo 47.8%. Safin perde il parziale nonostante il 60% di rendimento con la seconda contro il 57.1% di Federer. L’equilibrio del 4° set non è nelle prime in campo: 60.5% per Federer, 50% di Safin, né nel suo rendimento: 73.9% per lo svizzero e 88.9% di Marat, ma nel rendimento: praticamente uguale per i 2. 66.7% per Safin, 66.6% per Roger. Set deciso da 1-2 punti. Il 5° set è vinto da Safin perché ha un rendimento con la prima del 82.4%. Nelle altre statistiche che riguardano il servizio è sotto. Ancora equilibrio e ancora il rendimento con la seconda che lo testimonia: 36.8% vs 36%.

Return Points Winner

La RPW (Return Points Winner) sorride Federer che vince complessivamente la guerra in risposta con un 34.8% contro un 31.4%. Le RPW set by set rispecchiano il risultato finale del parziale in tutti i parziali. La RPW è maggiore nel complessivo per Federer perché ha un grande rendimento rispetto al suo avversario nel 1° set. 36.6% vs 23.5%.

Doppi falli

Qui continuiamo a ribadire il concetto che non conta il numero di doppi falli, ma quando sono arrivati. Per completezza diciamo che Safin ne ha commesso 1, Federer 8, ma andiamo nel dettaglio.

Safin

  1. Marat commette il primo e unico e doppio fallo nel 2° set sul punteggio di 5-4 per lui e vantaggio 30-15. E’ un punto che influisce pochissimo sul set e il match, però ha una volatity media, 2.5, perché arriva alla fine del parziale.

Federer

  1. Il primo doppio fallo di Roger arriva sul 2 pari del 1° set e 40-0. Volatility bassissima, 0.3, quindi doppio fallo molto ininfluente
  2. Il secondo arriva sul 5 pari del 1° set e 0-0. Sembra un doppio fallo ininfluente però ha una volatility media, 2.7, perché arriva quasi a fine set. Medio
  3. 3° doppio fallo fatto registrare sul 5-3 Safin del 2° set e 40-15 di punteggio. v=0.2, bassissima perché il set era praticamente deciso
  4. Il 4° si registra a inizio del 5° gioco del 3° set con v=2.3. Una volatility media.
  5. Sempre nello stesso game arriva 5°, è molto più grave. v=4.5. E’ un doppio fallo che consegna la palla break a Safin che poi concretizza e riaddrizza il set. Grave.
  6. Sempre nel 3° set c’è un doppio fallo. Siamo nel 9° gioco, punteggio 4 pari e 15 pari. C’è ancora una volatily alta, 4.5. Grave
  7. 7° doppio fallo che arriva nel 6° gioco del set decisivo. Esso consegna il break a Safin. v=5.3. Gravissimo
  8. L’ultimo doppio fallo è fatto registrare nel 14° gioco. 7-6 Safin e vantaggio Federer. Siamo a fine match e le volatility dei punti persi al servizio sono altissime. Qui punta nel 7.2. Vitale.

Vincenti/Non forzati

Come sempre il bilancio dei vincenti e dei non forzati lascia spazio a varie interpretazioni. La prima nasce spontanea perché questi dati non sono mai precisi al 100% o quantomeno riconosciuti all’unanimità motivo per cui il sito dell’ATP non li riporta mai. La seconda, che è quella che pesa maggiormente, è che nelle rispettive categorie sono inclusi colpi anche diametralmente opposti che però, seguendo semplicemente una regola di inclusione, sono messi tutti nello stesso calderone. Ma chiudiamo l’excursus filosofico per concentrarsi sui numeri.

Teorema Tommasi. Il differenziale complessivo dei vincenti e dei gratuiti è positivo per entrambi: +15 per Federer, +28 Safin. Il teorema ci suggerirebbe una partita “bella”. Si sapeva, non c’era bisogno di questa controprova, però quello che emerge chiaramente non è solo il dato positivo, ma il grande differenziale in positivo in una partita in cui la ricerca del vincente è stata a tratti esasperata.

Differenziale FH e BH

Forehand.

Il differenziale complessivo tra W/UE di dritto denota un bilancio positivo per entrambi. Molto equilibrio nei numeri con un +2 per Safin e +2 per Federer. Bilancio quasi sempre positivo per Federer che ha un +4 nel primo, -4 nel secondo, 0 nel terzo, +1 nel 4°, +1 nel 5°. Safin sullo stesso piano del suo avversario:-3, +1, -1, +1, +4.

Backhand.

Il rovescio di Safin non ha funzionato. Impietoso -15 complessivo nel differenziale W/UE, va molto meglio Federer, con un +6. Safin ha collezionato una marea di unforced con il rovescio nel 3° con un -11 che penalizza il totale complessivo della partita.  Federer va in negativo solo nel primo set.

Vediamo il bilancio complessivo set-by-set

  1. +2, Safin +5 Federer
  2. +3 Safin, -2 Federer
  3. -11 Safin, +4 Federer
  4. +6 Safin, +9 Federer
  5. +15 Safin, +12 Federer

Key Points

Ed ecco di nuovo i nostri key points. Per chi si fosse perso la puntata precedente essi sono i punti chiave ossia quei punti che fanno girare un game da una parte o dall’altra. Sono divisi in 3 categorie in ordine di importanza: in prima fila i break points che sono essenziali, secondo gradino per i game points e terzo per i deuce points, i punti che si giocano sulla parità.

Già si è parlato delle palle break nella sezione apposita, ma ricordiamo il 9/13 di Federer e il 10/14 di Safin. Tradotto significa che Safin è stato maggiormente attento ad annullare palla break, ma di una inezia. Federer ha messo in campo la prima 6 volte quando ha dovuto fronteggiare una palla break, il 46% delle volte, mentre Safin il 50% delle volte, per lui ci sono anche 2 ace provvidenziali che però viene bilanciato dai 4 servizi vincenti di Federer nella massima situazione di emergenza. Gravi i 4 unforced di Safin contro gli 0 i Federer che però compensa con 1 terribile doppio fallo su palla break del set decisivo.

In generale Federer è stato più lucido nei punti importanti della partita. Difetta solo nelle break points faced che sono quelli che contano di più. Il rendimento complessivo nei key points sorride allo svizzero con un 74% di punti vinti contro il 67% di Safin. In totale le palla critiche sono state sbilanciate verso il russo: 84 vs 66 ed è il 67% vs 74% che ha influito molto sull’esito del match. Safin ha dovuto affrontare tantissime difficoltà ma se l’è cavata meglio.

Winning Probability

Ritorna di prepotenza la winning probability che attraverso un grafico in 2 dimensioni molto semplice ci regala una radiografia della partita. L’andamento del match point-by-point è un dato imprescindibile per una analisi che vuole essere dettagliata e condivisa da tutta, se poi questa è corroborata da un grafico che dà l’idea immediata di come la partita sia andata in un verso o nell’altro sia a cavallo.

Ribadiamo alcuni concetti che sono alla base di questo tipo di analisi. Entrambi i giocatori partono dalla stessa percentuale di probabilità di vincere, quindi 50 e 50, si assegna una p di probabilità di ottenere il punto sul proprio servizio e grazie ad un particolare algoritmo si calcola punto per punto quant’è la probabilità che uno giocatore porti a casa un match. In alcuni studi la p è diversa per i 2 giocatori. Una scelta plausibile che però trova il difetto di produrre dei grafici in cui chi ha la p maggiore ha sempre una WP maggiore del 50% e solo nei casi in cui sta perdendo malamente il match questa scende sotto il livello del 50%. Questo tipo di approccio è utile per le agenzie di scommesse che lo adottato per dare le quote live, ma non è utile in un’analisi a posteriori perché un giocatore favorito avrà sempre numeri alti nonostante magari in certe situazioni si trovi pesantemente sotto nel punteggio.

Dopo un primo set all’insegna dell’equilibrio Federer prende il largo e domina per la maggior parte della partita. Nel primo parziale c’è qualche spicchio rosso, ma dal 2° set in poi è dominio blu. Safin pareggia i conti per andare sotto anche all’inizio del 3° salvo poi recuperare e perdere ancora. Il 4° set è un tripudio di blu fino al massimo raggiunto con il 4% di WP di Safin sul match point del tiebreak. Marat prende il comando delle operazioni e si porta in vantaggio nel set decisivo. Da evidenziare i punti 2, 3, 4 che corrispondono ai match point avuto Safin. Federer ha un picco a suo favore nel punto 5 con un 32.1% (100-32.1 per lui) di WP. Per Marat c’è un altro match point al punto 6, fino a quello decisivo che gli vale la partita.

Il dominio

La netta prevalenza del colore blu  del grafico ci dice che è stato Federer a “dominare” avendo avuto maggiori picchi ed essendo stato per molto più tempo in vantaggio. Però Safin ha avuto molti più picchi nel set decisivo.

54,7% Federer e 45,3% Safin.

Comeback factory

Il comeback factory misura in termini numerici la consistenza della rimonta del vincitore. Safin ha avuto il picco più basso del 4% di WP per cui ha guadagnato il 96% di WP per aggiudicarsi l’incontro. CF =96%. Clamoroso risultato per un match che sembrava segnato. Il 4% arriva sul 5-2 e 2 servizi Federer del tiebreak 4° set.

Excitement index

Siamo arrivati al punto più controverso delle statistiche avanzate del tennis ossia cercare di quantificare quanto un match sia stato eccitante-bello. Inutile dire che non potrà esistere un metodo universalmente condiviso, ma andare a quantificare quanto il match ha avuto capovolgimenti di fronte che sono alla base di una partita “eccitante” è un buon inizio. L’EI si basa sulla volatility che misura quanto il punto sia stato importante (già c’è stato un accenno nella sezione doppi falli). La volatility è la differenza in valore assoluto tra la WP del punto precedente con il punto corrente. Misura quanto quel punto ha fatto cambiare le sorti del match e di conseguenza quello che sposta maggiormente la WP è il più importante. Un punto con v compreso tra 1 e 3% è un punto ininfluente, dal 4 al 6% comincia ad essere caldo, dal 6 al 10% è fondamentale, sopra il 10% è un punto che fa girare tutto.

In questa partita il punto più importante ha avuto una volatility del 24.3% che è il match point che dà la vittoria a Safin che è anche un break.

Quant’è l’EI allora? 3.43. E’ alta, è bassa, chi lo sa? In questi casi i numeri adimensionali dicono poco o nulla se presi singolarmente, per avere senso bisognerebbe fare un confronto con le altre partite. Un esempio: semifinale del Roland Garros 2013 ha avuto EI 2,88 che è inferiore a questa. Quella della finale degli Australian Open 2009 2.712, così come la finale di Wimbledon 2008 con 3.11. Le partite dominate si attestano attorno all’1. A conti fatti è la partita con il maggiore EI analizzata fino a questo momento.

Per cercare di normalizzare questo indice dobbiamo scoprire quale è il massimo possibile. In un match al meglio dei 3 e dei 5 set con tiebreak finale l‘EI massimo è 18. Questo numero è frutto della media che si ha se il match durasse all’infinito e ad ogni punto il servitore perdesse il servizio. E’ un caso limite, quasi immaginario, perché una partita non può durare all’infinito, e questo è un dato di fatto, ed è altamente improbabile che i 2 giocatori perdano sempre il servizio in modo da far convergere asintoticamente il valore verso questo massimo teorico. Se applichiamo lo stesso ragionamento ad un match con long set finale viene fuori che esso ha un EI massimo di 10,15. Questo implica che i 2 format presentato 2 massimi differenti, quindi per poter paragonare EI con format differenti è necessaria una normalizzazione. Il 2,3 agli US Open vale meno di un 2,3 degli altri Slam perché arriva in un teorico match che ha il tiebreak nel set decisivo. La normalizzazione impone di conseguenza un 3.43/10,15 = 0.338. Una normalizzazione a 1 dell’EI dà come output un 33.8% per la partita in esame (-66,2% dalla “partita perfetta”). A Wimbledon 2008 l’EI normalizzato a 1 era 30.64%.

Domination ratio

Per chi l’avesse dimenticato la dominatio ratio è data dal rapporto della percentuale dei punti vinti in risposta e quella dei punti persi al servizio. Che cosa ci dice? Ci dice quanto un giocatore è stato dominante rispetto al suo avversario in un set o nell’intero match. Nella maggior parte dei casi questa arride al vincitore ma può capitare che il vincitore lasci tanti punti al suo avversario pur vincendo quelli più importanti. La DR in questo caso premia il perdente.

Del dominio nel match ne abbiamo parlato così è meglio concentrarsi su quella dei singoli set

Set 1

DR(Safin) = (1/5+0+1/5+2/6+0+4/9)/(3/8+1/5+1/5+3/8+1/5+5/10) = 0.64

DR(Federer) = 1.57

Set 2

DR(Safin) = (0+6/10+1/5+0+2/6)/(1/5+1/5+0+3/8+2/6)  = 1.02

DR(Federer) = 0.98

Set 3

DR(Safin) = (2/6+0+5/8+1/5+4/10+0)/(4/5+3/8+2/6+3/8+4/10+4/6) = 0.53

DR(Federer) = 1.90

Set 4

DR(Safin) = (2/6 + 1/5 + 0 + 2/6 + 1/5 + 1/5 + 4/7) / (0 + 0 + 2/6 + 2/6 + 0 + 1/5 + 3/7) = 1.42

DR(Federer) = 0.70

Set 5

DR(Safin) =  (1/5 + 0 + 4/6 + 2/6 + 3/8 + 1/5 + 4/10 + 4/6) / (0 + 5/12 + 2/6 + 2/6 + 7/12 + 2/6 + 3/8 + 1/5)  =1.10

DR(Federer) = 0.91

Service domination e return domination

Per concludere aggiungiamo qualche altro parametro tanto per dare pepe alle stats. Il primo riguarda il servizio. Ossia: quanto ha inciso il servizio nella dinamica della partita? Non ci addentriamo in calcoli astrusi semplicemente stimiamo i punti vinti al servizio dai 2 giocatori e li rapportiamo al totale.

La service domination nei rispettivi set è stata del 69.33%, 71.93%, 60.00%, 74.32%, 62.39%.

La retun domination, RD, è il reciproco in termini di percentuale della SD e misura quanto sia stata incisiva la risposta. Non è difficile arrivare alla soluzione.

La RD set-by-set è stata del 30.67%, 28.07%, 40.00%, 25.68%, 37.61%.

SD(totale) =((26 + 26+  21 + 20 + 23 + 25 + 28 + 27 + 37 + 31) / (27 + 35 + 51 + 48 + 27 + 29 + 46 + 40 + 29 + 20))*100 = 67%.

Ottima SD nel set 1, 2 e 4. Nel 3° e nel 5° grande dominio della risposta.