The GOAT Theory: gli Head-to-Head

tennismylife Dicembre 15, 2017Dicembre 15, 2017 452 Comments

Quando eravamo ignoranti e non avevamo a disposizione statistiche facilmente rintracciabili attraverso una query le statistiche riportate dai commentari circa gli scontri diretti dei giocatori che erano in campo era una manna dal cielo. Al di là del curriculum vitae del tennista in campo si mettevano in luce gli Head-to-Head contro chi gli stava davanti per capire se l’avversario con una carriera più debole avrebbe avuto chance di battere quello con la carriera più blasonata. Per quanto statisticamente è lapalissiano trovare in vantaggio negli H2H il giocatore che ha collezionato più trofei anche in base al loro peso specifico, può capitare che questa regola non venga rispettata. Il caso più importante e che distorce la percezione della realtà dei fatti e il caso Federer-Nadal contratto in Fedal.

Fedal

La rivalità più importante del tennis dell’era Open e non solo ha creato un paradosso che ha deviato il modo di percepire i rapporti di forza tra tennisti. Attenzione, non nella valutazione della carriera tout court, ma in quella dello scontro diretto. Il punto di origine del paradosso è il torneo di Miami 2004 in cui il giovanissimo Rafa sconfisse in 2 set il numero 1 del mondo Federer. Roger si rifece sotto l’anno successivo nello stesso torneo ma questa volta in finale recuperando un gap di 2 set a 0. Dalla successiva sfida del Roland Garros 2005 Rafa è sempre stato avanti negli scontri diretti incrementando sempre di più il distacco fino al famoso 23-10 che risulta il massimo divario nella rivalità. Non c’è bisogno di andare a spulciare gli almanacchi per renderci conto che Federer ha una carriera migliore di Nadal, però avendo un saldo negativo con il rivale di sempre si cerca sempre di insabbiare il particolare. L’errore eziologico di questo insabbiamento o trascuramento sta nell’obiettivo o meglio nelle conclusioni che si vogliono trarre quando vengono portati alla luce quei dati famosi. Per quanto ci possiamo sforzare di dire che Nadal sia davanti negli H2H questo non implica che lo sia anche nella carriera. I 2 concetti sono scorrelati. Si potrebbe addurre tante dimostrazioni per mettere alla luce la natura fallace di queste deduzioni , ma ci limitiamo a portane una. Gli H2H come dice la parola stessa riguardano lo scontro 1 a 1, per cui essere davanti ad un solo tennista non ti permette di essere davanti a tutti gli altri; è una sub-struttura locale e non globale. Invece il peso del palmarés assume una connotazione globale perché valuta i tornei in cui teoricamente sono comprese tutte le variabili possibili e non solo 1, ossia quella del giocatore avanti negli H2H.

Oltre al Fedal un caso meno noto ma altrettanto significativo è quello di Boris Becker e Stefan Edberg. Le 2 carriere sono molto simili in termini di numero di trofei vinti e soprattutto di peso dei trofei vinti. Per una serie di coincidenze che non stiamo qui a discutere Becker si trova ad avere pochissime settimane al numero 1, pochissime anche rispetto al rivale svedese. Però gli H2H parlano chiaro: 25-10 per Becker. E’ un dato straordinario che in proporzione è molto più sbilanciato del Fedal, eppure esiste e non può essere trascurato quando si parla del rapporto di forza tra i 2 che, a differenza di Federer e Nadal, hanno un palmares dello stesso peso. Però ribadiamo sempre il concetto: l’essere davanti ad Edberg non implica che lo sia con tutti quelli che stanno dietro ad Edberg, è un’implicazione logica fallace. Per questa rivalità funziona, visto che ormai i tifosi di entrambi si sono estinti, discorso diverso per il Fedal che oggi come oggi rimane ancora vivo, vivissimo.

Casualità delle partite

Se volessimo stilare una classifica di importanza degli H2H, con tutti i tennisti e non solo contro uno, questi avrebbero una posizione molto marginale e a distanza siderale dal parametro primario che riguarda le vittorie pesate dei tornei, dal parametro successivo che riguarda i record derivanti dal ranking e, se vogliamo, dal numero di vittorie, ossia winning games, della carriera di un tennista. Questa considerazione non deriva dalla frase infantile: ma chi H2H con contano, piuttosto dai tanti difetti intrinseci che riguarda questo parametro. Il primo che può emerge immediatamente è la casualità delle partite. Il circuito ATP è strutturato in tornei, e non in campionati, per cui ogni competizione può essere considerata come a sé stante. Se aggiungiamo che sono tutte tranne 1 a eliminazione diretta è facile intuire che non tutti i tennisti incontrano tutti gli altri. Che siano 4, 5, 6 o 7 partite, il vincitore non dovrà mai confrontarsi con tutti gli altri che inevitabilmente vengono eliminati perdendo così la possibilità di confronto. Se aggiungiamo a questo la casualità del sorteggio si arriva alla conclusione che per avere degli H2H bilanciati ci vuole una certa dove di fortuna aleatoria, quella che hanno i vincitori del Super-Enalotto, per renderci conto. Che i top player abbiano molte più probabilità di incontrarsi nei tornei in cui partecipano contemporaneamente è assodato, ma la valutazione del parametro H2H alla luce della GOAT Theory non deve riguardare solo i tennisti di fascia alta, deve includere tutti, anche chi gioca una sola partita nel circuito maggiore e si ritira. E’ molto facile riscontrare tante stagioni in cui 2 giocatori non si incontrano tra di loro o perché uno dei 2 non è in forma e perde prima dell’altro, o perché entrambi perdono nello stesso turno annullando così la possibilità di incontrarsi.

Gli H2H di un top player contro un altro top player sono più importanti rispetto a quelli tra top player e non top player che lo sono a sua volta rispetto agli H2H tra non top player. Si dovrebbero pesare, ma il fattore casualità è troppo determinante per dare un peso elevato ad una statistica che però non deve essere trascurata. La soluzione adottata da TennisBase è quella di usare tutti gli H2H per ogni tennista senza distinzione di sorta, un metodo un po’ raffazzonato perché, ripetiamo, questi devono essere pesati.

L’attitudine alla superficie

La casualità di incontrarsi in una superficie piuttosto che un’altra, di per sé un fattore negativo degli H2H, si amplifica se modulato in base all’attitudine alla superficie di determinati tennisti. Nonostante sia di moda dire che da ormai 15 anni ci sia una certa omologazione delle superfici, tanti tennisti, se non tutti giocano meglio su determinati campi piuttosto che su altri. Ancora resiste la categoria dei “terraioli” così come quella dei “giocatori da veloce”. La diversa attitudine fa sì che un H2H sbilanciato verso la superficie preferita di un tennista ne falsi inevitabilmente il risultato. In linea teorica potrebbe capitare che determinate coppie di tennisti si affrontino solo in una superficie che favorisce uno piuttosto che l’altro e viceversa, tutto questo sempre frutto della casualità delle partite.

Per ovviare a questo problema si potrebbero adottare diverse soluzioni, come l’uso di coefficienti correttivi in base alla attitudine alla superficie, però l’utilizzo di questi coefficienti andrebbe ad intaccare l’essenza stessa gli H2H che vuole che ogni partita vale uno. Vale 1 perché semplicemente quando 2 tennisti si incontrano faccia a faccia devono sopperire alle stesse difficoltà per battere l’avversario, così la differenza delle difficoltà e delle “facilità” di uno con quelle dell’avversario danno sempre somma 0. Discorso diverso invece per i tornei in cui, come ribadito più volte, si incontrano solo pochi tennisti e incontrarne alcuni piuttosto che altri sposta in negativo o in positivo la difficulty path.

Pesi della partita: torneo vs torneo & turno vs turno

Finora si è considerata la legge uno vale uno, quindi senza l’utilizzo di pesi, ma vogliamo usare una certa fantasia e presupporre che non tutte le partite valgano uno. Non è così utopistico pensare che una partita vinta in una finale Slam valga di più di un primo turno di un ATP 250. L’uso di pesi presuppone un uso di coefficienti correttivi. OK, ma quali usare? La soluzione naturale sarebbe quella di usare il ranking ATP normalizzato al massimo punteggio che può valere una vittoria che è la conquista di uno Slam. Imponiamo che questo tipo di vittoria valga 1, le altre arriveranno di conseguenza secondo questo schema.

Messa su questo piano si nota come le vittorie nei primi turni valgano molto ma molto poco rispetto alle fase finali di un torneo. C’entra da aspettarselo, ma le proporzioni sembrano troppo distanti tra loro: battere un avversario in finale Slam vale 1.67 volte di più che farlo in semifinale. Siamo d’accordo che la finale debba valere di più di una finale, ma 1.67 è un valore troppo elevato. Molto spesso è capitato che le semifinali Slam abbiano messo di fronte i 2 giocatori più in forma del momento e capitati nella stessa parte di tabellone solo a causa del sorteggio.

I risultati sono talmente insoddisfacenti da pensare di cassare questo metodo ed usarne uno più semplicistico che pesa le vittorie indipendentemente dal turno ma solo dal torneo in cui si gioca. I coefficienti che pesano gli H2H dovrebbero essere 1 per gli Slam, 0.5 per i Masters 1000, 0.25 per gli ATP 500 e 0.125 per gli ATP 250. La semplificazione potrebbe avere un ulteriore step appiattendo le differenze di categoria e distinguendo solo il 3 su 5 dal 2 su 3. Dato valore 1 alle partite Slam e Coppa Davis (o comunque 3 su 5) e 0.5 a quelle di tutti gli altri tornei.

Stato di forma: Ranking, Elo e punti ATP

Un altro corollario della casualità delle partite è lo stato di forma dei giocatori. In tutti i casi possibili di H2H capita che un giocatore si trovi in uno stato di forma migliore dell’avversario e viceversa e/o in uno stato peggiore rispetto al suo prime o al suo peak, tutte questo coincidenze fanno sì che il risultato dello scontro sia sbilanciato a favore di chi in quel momento sta meglio. Può capitare che chi stia peggio la spunti lo stesso, ma è molto più probabile che si verifichi il caso contrario. Il buon senso ci indicherebbe di non usare correttivi in merito a questo particolare, ma se volessimo imporlo troveremmo molte difficoltà tutte derivanti dall‘impossibilità di stabilire con un’approssimazione vicina al 100% della forza impulsiva di un tennista al momento della partita.

Negli scacchi si usa il sistema Elo che da un po’ di tempo a questa parte è diventato famoso anche nel mondo del tennis. In sintesi il sistema funziona in questo modo: si assegna ad ogni giocatore un punteggio base di 1500 e questo aumenta o diminuisce proporzionalmente alla bravura dell’avversario. La formula usata per calcolare la Elo è la seguente:

Ogni tennista prima di ogni partita avrà un certo punteggio Elo che dovrebbe in linea teorica misurare quanto è forte in quel momento. La particolarità di questo indice è che non dipende dal contesto in cui si ottiene la vittoria a differenza del ranking ATP. Il sistema, per quanto buono, prende dei difetti intriseci come quello dell’assoluta non dipendenza del tempo. Un giocatore può vincere un certo numero di partite e avere una Elo molto alta e rimanere con questo punteggio per un periodo di tempo infinito. Questo difetto è trascurabile se non risolto dall’uso del ranking ATP.

Inutile stare a ribadire come funziona il ranking ATP. Lo sanno tutti come funziona. Quello che però non è mai stato esaminato con una certa cura è la distinzione tra punti ATP e numero di ranking. Per quanto per la compilazione dei tabellone sia fondamentale il numero del ranking per misurare la forza di un tennista è molto più utile utilizzare i punti ATP.

Le conclusione non possono che essere che 2: usare un coefficiente correttivo proporzionale ad Elo o punti ranking oppure non usare coefficienti. Difficile scegliere.

Differenza di carriera

La forza impulsiva misura la forza istantanea ma non tiene conto delle carriere dei tennisti. Può capitare che a scontrarsi siano dei tennisti che in quel momento siano sullo stesso livello ma con palmarés molto differente. Non è determinante per lo scontro, ma possiamo benissimo dedurre che la sconfitta di un tennista con grande blasone sia molto più pesante di uno con un palmarés scarno. In questo caso sarebbe d’uopo usare non una “Elo annuale“, ma una “career Elo” ossia che tenga conto di tutta la carriera di un tennista. Ecco perché potrebbe pesare molto la sconfitta di Federer a Montreal contro Zverev, anche se Federer non era la peak e Zverev con molta probabilità avrà una Elo molto più alta del massimo raggiunto fino ad oggi.

Scartare i numeri troppo piccoli

Gli H2H positivi possono avere un numero elevato di partite, diciamo sopra le 10, altre sopra le 30, ma può capitare di essere sopra o sotto di uno scarto minimo di 1, 2 o 3 unità. Queste pesano poco nel valutare gli H2H tour court di un tennista. Ci deve essere un taglio altrimenti nel computo totale i più deboli andrebbero ad intaccare quelli più forti. Anche qui è molto complesso trovare un numero esatto, talmente difficile che verrebbe in mente di non trovarlo, ma visto che ci siamo proviamo a ragionare. Nella carriera di un tennista più in alto si sale più partite si giocano con i top player. Le grandi rivalità sono fatte minimo di 10 partite, difficile trovarne altre con un numero minore di scontri, così, per il momento scegliamo il numero 10 come taglio per “gli H2H che contano”.