TML Classic: Semifinali Roland Garros 2011, Federer vs Djokovic, Analisi statistica
Dopo la descrizione dettagliata della partita passiamo all’analisi statistica. Il ciclo degli Slam del TML Classic continua dopo il tour dei 4 Major dell’anno scorso e l’analisi della semifinale degli Australian Open 2005 tra Federer e Safin. Anche qui l’approfondimento sarà molto esaustivo e cercheremo anche di introdurre qualche nuovo parametro per descrivere determinati aspetti del gioco dell’uno o dell’altro contendente.
Punteggio
Si parte sempre dal punteggio che dice tanto, quasi tutto della partita, ma il quasi è più importante del tutto. 7-6(5), 6–3, 3-6, 7-6(5). Per la prima volta si prende in considerazione un match che è finito in 4 set. Questo ci porta a tante conclusioni, forse la più banale è che tutti i match dovrebbero giocarsi in 5 set, con 4 la partita rimane monca, anche se sarebbe insensato giocare un ulteriore set quando ormai il risultato è acquisito. Chiaro dominio di Federer che ha perso malamente solo il 3° set e ha chiuso la partita al tiebreak del 4°.
Palle break
Analizziamo il numero delle palle break salvate/sprecate (ricordando sempre che sono dati complementari). Il vincitore ha dovuto affrontare 13 palle break e ne ha salvate 9. Numero complementare esorbitante, 25 palle break per Federer, che si è fatto breakkare in 4 occasioni, così come Djokovic. Questi numeri dimostrerebbero un equilibrio che però non c’è stato per colpa dei 2 tiebreak vinti entrambi da Roger. 9/13 > 21/25 è una disuguaglianza che parla chiaro: Djokovic ha salvato molto ma allo stesso tempo è stato costretto a salvare molto. Il 1° set ha visto lo stesso differenziale di palle break ottenute/salvate, solo che Federer ne ha avuto molte di più: ben 10 con solo 2 convertite. Stesso numero di palle break convertite da Djokovic ma con solo 4 colpi a disposizione. Questo dato esplode nel 2° parziale con Roger che concede solo 2 palle break e le salva tutte, di contro lo svizzero ha ben 12 possibilità di breakkare e solo in un’occasione vi riesce. Il 3° set è tutto serbo. Federer non arriva mai a palla break, di contro ne concede 3 salvandone 2. C’è molto equilibrio nel 4° e ultimo parziale. In questa particolare statistica lo vince il numero 2 del mondo, però conta poco se c’è lo stesso differenziale e soprattutto se non vinci il tiebreak.
Servizio
I dati al servizio ci dicono che Djokovic ha messo più prime in campo: 67.3% contro 63.8%. Però la resa è tutta dalla parte svizzera con un 76.7% che sovrasta il 60.2% di Nole. Il grande differenziale del +16.5% viene miticato parzialmente da una maggiore resa serba della seconda con: 60.0% contro il 51%. Un +9% che non può competere contro il ben più grande +16.5%. Strano perché di solito chi ha un grande rendimento con la seconda vince il match. Però bisogna avere dei dati simili con la prima.
Prima & seconda di servizio
Il dato set-by-set testimonia un Djokovic maggiormente propenso a mettere prime in campo in 3 casi su 4. Stranamente è nel 3° parziale vinto che va sotto: 59.4% vs 60.9%. Non sapendo a priori i risultati dei set sembrerebbe che Nole abbia vinto, però se integriamo il dato con la seconda ci rendiamo conto perché la partita è girata dalla parte svizzera. Nel primo parziale nonostante la minore di percentuale di prime in campo Federer rende al 76.9% con la prima contro il 59.0% dell’avversario. Lo stesso pattern si ripete nel 2° parziale con un gap ancora più largo. Resa di Federer con la prima: 80.0%. Djokovic 57.1%. Troppo poco. Federer è avanti con la prima anche nel 3° parziale però lascia andare malamente la seconda. 69.2% di rendimento per Nole, 55.6% per Roger. Il set è serbo e non potrebbe essere altrimenti. Il 4° parziale segue il copione dei primi 2 con il numero 2 del mondo che ha un rendimento pazzesco con la prima: 76.7% contro il 59.3% che bilancia il rendimento opposto con la seconda: 57.9% vs 73.3%. Risultato: equilibrio e tiebreak dirimente.
Return Points Winner
La RPW (Return Points Winner) sorride a Federer che vince complessivamente la guerra in risposta con un 39.9% contro un 32.6%. Le RPW set by set rispecchiano il risultato finale del parziale in tutti i parziali. Incredibile pensare che Roger abbia vinto questa partita in risposta contro una delle migliori risposte del mondo quale era la versione monstre del 2011 di Nole.
Doppi falli
Qui continuiamo a ribadire il concetto che non conta il numero di doppi falli, ma quando sono arrivati. Per completezza diciamo che Federer ne ha commesso 2 così come Djokovic, ma andiamo nel dettaglio.
Federer
- Federer commette il suo primo doppio fallo nel 3° game del 3° set sul punteggio di 15-30. Il doppio fallo porta Nole a palla break che però non concretizza, v = 1.9. Volatility medio-bassa
- Il 2° doppio fallo arriva nel 9° game del 4° set sulla 2a parità. Ha una volatility alta, v = 6.9. Grave.
Djokovic
- Nole commette il primo doppio fallo all’inizio dell’8° gioco del 2° set. V= 0.5. Ininfluente.
- Replica nell’8° gioco del 4° set sul punteggio di 4-3 per Federer e 40-0. V = 0.5. Ininfluente.
Vincenti/Non forzati
Come sempre il bilancio dei vincenti e dei non forzati lascia spazio a varie interpretazioni. La prima nasce spontanea perché questi dati non sono mai precisi al 100% o quantomeno riconosciuti all’unanimità motivo per cui il sito dell’ATP non li riporta mai. La seconda, che è quella che pesa maggiormente, è che nelle rispettive categorie sono inclusi colpi anche diametralmente opposti che però, seguendo semplicemente una regola di inclusione, sono messi tutti nello stesso calderone. Ma chiudiamo l’excursus filosofico per concentrarsi sui numeri.
Teorema Tommasi. Il differenziale complessivo dei vincenti e dei gratuiti è negativo per entrambi: -2 per Federer, -11 per Djokovic. Il teorema ci suggerirebbe una partita “brutta”. Siamo sulla terra battuta e il teorema è molto, ma molto labile in questo frangente.
Differenziale FH e BH
- Forehand
Il differenziale complessivo tra W/UE di dritto denota un bilancio negativo per entrambi. Molto squilibrio nei numeri con un -4 per Djokovic e -2 per Federer. Bilancio quasi sempre negativo per Federer che ha un -1 nel primo, -1 nel secondo, 0 nel terzo, +1 nel 4°. Nole sbaglia un po’ di più: 0, -3, -1, 0.
- Backhand
Il rovescio di Djokovic non ha funzionato. Impietoso –13 complessivo nel differenziale W/UE, va peggio Federer, con un -24. Roger ha collezionato una marea di unforced con il rovescio nel 2° con un -9. Federer va sempre in negativo.
Vediamo il bilancio complessivo set-by-set
- -3, Djokovic -1 Federer
- -10 Djokovic, -3 Federer
- -2 Djokovic, -2 Federer
- +3 Djokovic, +4 Federer
Key Points
Ed ecco di nuovo i nostri key points. Per chi si fosse perso la puntata precedente essi sono i punti chiave ossia quei punti che fanno girare un game da una parte o dall’altra. Sono divisi in 3 categorie in ordine di importanza: in prima fila i break points che sono essenziali, secondo gradino per i game points e terzo per i deuce points, i punti che si giocano sulla parità.
Già si è parlato delle palle break nella sezione apposita, ma ricordiamo il 9/13 vs 21/25. Tradotto significa che Djokovic è stato maggiormente attento nell’annullare palle break però ne ha dovuto affrontare molte di più. Federer ha messo in campo la prima 9 volte quando ha dovuto fronteggiare una palla break, il 69% delle volte, mentre Djokovic il’84% delle volte, per lui c’è anche un ace. Gli unforced si equivalgono però pesano di più per Djokovic.
In generale Djokovic è stato più lucido nei punti importanti della partita. Il rendimento complessivo nei key points sorride al serbo con un 69% di punti vinti contro il 65% di Fderer. In totale le palla critiche sono state sbilanciate verso il serbo: 80 vs 55. E questo spiega come, nonostante la percentuale di realizzazione di poco superiore per Nole, sia Federer ad avere la meglio.
Winning Probability
Ritorna di prepotenza la winning probability che attraverso un grafico in 2 dimensioni molto semplice ci regala una radiografia della partita. L’andamento del match point-by-point è un dato imprescindibile per una analisi che vuole essere dettagliata e condivisa da tutta, se poi questa è corroborata da un grafico che dà l’idea immediata di come la partita sia andata in un verso o nell’altro siamo a cavallo.
Ribadiamo alcuni concetti che sono alla base di questo tipo di analisi. Entrambi i giocatori partono dalla stessa percentuale di probabilità di vincere, quindi 50 e 50, si assegna una P di probabilità di ottenere il punto sul proprio servizio e grazie ad un particolare algoritmo si calcola punto per punto quant’è la probabilità che uno giocatore porti a casa un match. In alcuni studi la P è diversa per i 2 giocatori. Una scelta plausibile che però trova il difetto di produrre dei grafici in cui chi ha la P maggiore ha sempre una WP maggiore del 50% e solo nei casi in cui sta perdendo malamente il match questa scende sotto il livello del 50%. Questo tipo di approccio è utile per le agenzie di scommesse che lo adottato per dare le quote live, ma non è utile in un’analisi a posteriori perché un giocatore favorito avrà sempre numeri alti nonostante magari in certe situazioni si trovi pesantemente sotto nel punteggio.
Dopo un primo set all’insegna dell’equilibrio e molto ondivago Federer prende il largo e domina per tutto il match. Questo tipo di grafico poco si presta a rappresentare un match di 4 set. Chi ha vinto ha avuto sempre il pallino in mano avendo fatto suo il primo parziale. In rosso sono evidenziati solo i passaggi di set. Da sottolineare solo il punto 1, punto in cui Djokovic poteva riaprire il match, ossia quando era avanti 5-4 e servizio. Per il resto, ottenuto il controbreak la partita di fatto è finita.
Il dominio
La netta prevalenza del colore blu del grafico ci dice che è stato Federer a “dominare” avendo avuto maggiori picchi ed essendo stato per molto più tempo in vantaggio.
69,8% Federer e 30,2% Djokovic.
Comeback factory
Il comeback factory misura in termini numerici la consistenza della rimonta del vincitore. Federer ha avuto il picco più basso del 36% di WP per cui ha guadagnato il 64% di WP per aggiudicarsi l’incontro. CF =64%.Molto piccolo in confronto alle altre puntate del TML Classic. Il 36% arriva sul 4-5, 15-40 e 2 break-set point per Djokovic del 1° set.
Excitement index
Siamo arrivati al punto più controverso delle statistiche avanzate del tennis ossia cercare di quantificare quanto un match sia stato eccitante-bello. Inutile dire che non potrà esistere un metodo universalmente condiviso, ma andare a quantificare quanto il match ha avuto capovolgimenti di fronte che sono alla base di una partita “eccitante”, è un buon inizio. L’EI si basa sulla volatility che misura quanto il punto sia stato importante (già c’è stato un accenno nella sezione doppi falli). La volatility è la differenza in valore assoluto tra la WP del punto precedente con il punto corrente. Misura quanto quel punto ha fatto cambiare le sorti del match e di conseguenza quello che sposta maggiormente la WP è il più importante. Un punto con v compreso tra 1 e 3% è un punto ininfluente, dal 4 al 6% comincia ad essere caldo, dal 6 al 10% è fondamentale, sopra il 10% è un punto che fa girare tutto.
In questa partita il punto più importante ha avuto una volatility del 11.5% che è il set point del 1° parziale. Non così alta come volatility massima.
Quant’è l’EI allora? 2,3. È alta, è bassa, chi lo sa? In questi casi i numeri adimensionali dicono poco o nulla se presi singolarmente, per avere senso bisognerebbe fare un confronto con le altre partite. Un esempio: semifinale del Roland Garros 2013 ha avuto EI 2,88 che è superiore a questa. Quella della finale degli Australian Open 2009 2.712, così come la finale di Wimbledon 2008 con 3.11. La semifinale degli Australian Open 2005 era arrivata a 3.43 (il massimo della serie TML). Le partite dominate si attestano attorno all’1. A conti fatti è la partita con il maggiore EI analizzata fino a questo momento.
Per cercare di normalizzare questo indice dobbiamo scoprire qual è il massimo possibile. In un match al meglio dei 3 e dei 5 set con tiebreak finale l‘EI massimo è 18. Questo numero è frutto della media che si ha se il match durasse all’infinito e ad ogni punto il servitore perdesse il servizio. È un caso limite, quasi immaginario, perché una partita non può durare all’infinito, e questo è un dato di fatto, ed è altamente improbabile che i 2 giocatori perdano sempre il servizio in modo da far convergere asintoticamente il valore verso questo massimo teorico. Se applichiamo lo stesso ragionamento ad un match con long set finale viene fuori che esso ha un EI massimo di 10,15. Questo implica che i 2 format presentato 2 massimi differenti, quindi per poter paragonare EI con format differenti è necessaria una normalizzazione. Il 2,3 agli US Open vale meno di un 2,3 degli altri Slam perché arriva in un teorico match che ha il tiebreak nel set decisivo. La normalizzazione impone di conseguenza un 2,3/10,15 = 0.226 Una normalizzazione a 1 dell’EI dà come output un 22.6% per la partita in esame (-77,3% dalla “partita perfetta”). A Wimbledon 2008 l’EI normalizzato a 1 era 30.64%.
Domination ratio
Per chi l’avesse dimenticato la dominatio ratio è data dal rapporto della percentuale dei punti vinti in risposta e quella dei punti persi al servizio. Che cosa ci dice? Ci dice quanto un giocatore è stato dominante rispetto al suo avversario in un set o nell’intero match. Nella maggior parte dei casi questa arride al vincitore ma può capitare che il vincitore lasci tanti punti al suo avversario pur vincendo quelli più importanti. La DR in questo caso premia il perdente.
Del dominio nel match ne abbiamo parlato così è meglio concentrarsi su quella dei singoli set.
- Set 1
DR(Djokovic) = (4/5 + 0 + 4/5 + 0 + 3/8 + 2/6 + 1/6)/(4/6+8/18+3/8+4/5+2/6+2/6+2/6) = 0.75
DR(Federer) = 1.33
- Set 2
DR(Djokovic) = (3/8 + 0 + 1/5 + 2/6 + 3/8) / (1/5 + 5/8 + 6/14 + 5/12) = 0.77
DR(Federer) = 1.30
- Set 3
DR(Djokovic) = (4/6 + 3/8 + 1/5 + 0) / (3/8 + 2/6 + 3/8 + 2/6 + 0) = 0.88
DR(Federer) = 1.14
- Set 4
DR(Djokovic) = (0 + 1/5 + 0 + 0 + 9/16 + 4/10 + 1/6) / (2/6 + 1/5 + 2/6 + 1/5 + 4/6 + 3/8 + 2/6) = 0.54
DR(Federer) = 1.84
Service domination e return domination
Non ci addentriamo in calcoli astrusi semplicemente stimiamo i punti vinti al servizio dai 2 giocatori e li rapportiamo al totale.
La service domination nei rispettivi set è stata del 58,06%, 62.86%, 67.27%, 67.03%.
La return domination, RD, è il reciproco in termini di percentuale della SD e misura quanto sia stata incisiva la risposta. Non è difficile arrivare alla soluzione.
La RD set-by-set è stata del 41,94%, 37.14%, 32.74%, 32.97%.
SD(totale) = ((24+30+22+22+15+22+34+27) / (49+44+39+31+25+30+49+42))*100 = 63.43%
Ottima SD in tutti i set. Il servizio ha funzionato bene per entrambe i giocatori per essere sulla terra battuta.