The GOAT Theory: Una questione di proporzioni

tennismylife Ottobre 18, 2017Ottobre 18, 2017 1.781 Comments

Dopo aver martellato l’algoritmo di TheTennisBase.com sembra doveroso cercare di trovarne un altro che non sia necessariamente alternativo ma uno che pone delle questioni ben precise e non mischia dei numeri adimensionali senza spiegarne la logica. Detta così sembra un po’ altezzoso, ma non più di tanto e non è questo il goal di questa fantomatica ricerca. Quello che bisogna capire in primis sono i tantissimi punti controversi che stanno alla base della valutazioni della carriera di un tennista e soprattutto i confronti tra tennisti di epoche diverse. Così questa serie di articoli non propone delle soluzioni alla annose questioni, ma evidenzia le annose questioni. Più che un algoritmo questo sarà l’inizio di un’infinita serie di articoli sulla teoria del GOAT, ossia un insieme di regole precise che cercano di spiegare come e perché la storia del tennis è andata in un certo modo piuttosto che un’altra.

Il punto base, l’origine di tutto è il seguente: se io voglio fare un confronto tra tennisti devo avere un solo numero che lo caratterizzi, adimensionale certamente. Ora se c’è un solo numero per forza di cose devo sommare tra loro e dividere le vittorie Slam, dei M1000, degli ATP 500, 250, ranking e settimane al numero x in un sistema omogeneo. Ed è qui il danno! Quanti Masters 1000 vale uno Slam? Qualcuno dirà:”Non c’è paragone“. Allora tutto è vano. Ma per ovviare a questo paradosso è necessaria una proporzione, che sarà sempre e comunque fallace perché sappiamo tutti che non può esistere in senso assoluto, ma deve esistere perché voglio quel numero. Questo succede in tanti ambiti. Anche il Peter di Moneyball usava questo metodo. Processare tantissime variabili di un giocatore di baseball per ridurre tutto a un singolo numero, questo implica una proporzione tra RBI, Homerun, Basi rubate e tutto quello che volete. Stesso dicasi per il PER dell’NBA. E’ un algoritmo che “pesa” punti fatti, assist, rimbalzi, tiri liberi dando loro una certa proporzione (che non sto qui a spiegare). Semplicisticamente (per esempio): 3.23 assist corrispondono a 10 punti. Così viene fuori un unico numero che giudica un giocatore di basket in una stagione.

Proporzione Slam/Masters 1000

La prima proporzione che vogliamo prendere in esame è quella tra Slam e Masters 1000. La domanda chiave è: quanti Masters 1000 vale uno Slam? Domanda molto complessa perché i tornei innanzitutto hanno un formato diverso sia per quanto riguarda i tabelloni che soprattutto il numero di set giocati. Il famoso 3 su 5 dei Major li eleva al di sopra di tutto e di tutti. E’ molto, ma molto più semplice vincere uno dei 9 Masters 1000 che presentano il formato ridotto del 2 su 3. A complicare ancora di più i calcoli in 3 tornei dello Slam quali: Australian Open, Roland Garros e Wimbledon è la presenza del long set nel set decisivo, un ulteriore plus che fa allargare ulteriormente la distanza, anche se questo piccolo particolare può essere trascurato per estrapolare una proporzione precisa. Si può affrontare la questione da un punto di vista probabilistico, anche molto semplicisticamente. In uno Slam ci sono 7 partite al meglio dei 5 set, per aggiudicarsi una partita bisogna vincere 3 set. Supponendo che la vittoria dei set sia per tutti equipollente la probabilità di vincere un set da parte di un giocatore è del 50%, ossia 1/2, per vincere una partita (1/2)^3. Supponendo anche che la vittoria di una partita non influenzi quella successiva in termini probabilistici la vittoria del torneo si ottiene moltiplicando 7 volte per se stesso la singola vittoria ossia un elevamento a potenza 7. Da qui p = ( (1/2)^3)^7) =0.0000004768371582. Numero che di per sé non dice niente. E’ necessario un confronto per avere maggiori info. Applichiamo lo stesso metodo per calcolare la probabilità di vincere un Masters 1000. Qui la situazione si complica perché ci sono i bye per alcune teste di serie, 8 o 16, in base al torneo, per cui la vittoria finale del torneo può arrivare con la conquista di 5 o 6 partite. Per il momento ci concentriamo su 5 partite perché sono quelle che affrontano di solito i vincitori dei tornei, molto difficile statisticamente incontrare un vincitore finale senza bye al primo turno (ma certamente questo particolare non va trascurato). Per vincere una partita al meglio dei 3 basta vincere 2 set, se ognuno ha il 50% di essere vinto da un giocatore vincere l’incontro ha una p = (1/2)^2, per vincere il titolo sono necessarie 5 partite che si traduce in elevamento alla potenza di 5. p = ((1/2)^2)^5) = 0.0009765625. Altro numero adimensionale che non dice nulla. Ma vediamo il confronto: p(Masters) / p(Slam) = 2048. Come è facile intuire la proporzione è tutta spostata a favore degli Slam in maniera esagerata, la proporzione 1/2048 è abnorme per i nostri scopi; in sostanza ci dice che vincere uno Slam è 2048 più difficile che vincere un Master 1000 che si traduce a livello pratico: puoi vincere tutti i Masters 1000 che vuoi ma uno Slam sarà comunque irraggiungibile a meno che ci sia un giocatore in grado di arrivare a 2048: dovrebbe giocare 228 anni e vincere ogni anno tutti i 9 Masters 1000. Impossibile. Non era così difficile da intuire che saremmo arrivati a questa empasse e che questo metodo probabilistico non è il massimo.

Come continuare? Quando si studiano delle variabili aleatorie si possono usare 2 approcci: quello probabilistico (usato in precedenza) o quello statistico. Il primo è un approccio deduttivo che impone dall’alto le regole, l’altro è un metodo induttivo, ossia si parte dal particolare per arrivare all’universale. Si studiano i tantissimi casi accaduti, e non impossibili, per arrivare ad estrapolare una regola che metta in correlazione tra loro tutte le variabili. Purtroppo per noi il campione statistico è molto, ma molto limitato: quando si compiono questi studi la casistica prevede migliaia, se non milioni di record, invece qui ci dobbiamo accontentarci di circa 250 campioni…pochissimi, ma solo gli unici che hanno un riscontro oggettivo sulla realtà dei fatti, sono gli unici casi che realmente si sono verificati.

La correlazione vittorie totali M1000/Slam (tra coloro che hanno vinto almeno un 1000 oppure almeno uno slam) c’è ma non è ipersignificativa. Comunque statisticamente, dal 1990 a oggi, all’incirca #M1000=#slam x 1.5 + 1.3, che è inferiore al rapporto teorico 9/4, basato sulla frequenza annuale dei rispettivi eventi (e non sulla reale partecipazione dei giocatori, visto che sono pochi quelli che fanno sempre tutti e 9 i Masters e sono molti di più quelli che fanno tutti e 4 gli Slam) a partire dai 3 Slam.
Quindi banalmente vincere tanti 1000 è addirittura “più difficile”, in proporzione, che vincere tanti Slam. C’è invero l’outlier di Sampras che pesa abbastanza e tante altre situazione contingenti, ma a noi non interessa chi ha fatto cosa, l’approccio deve essere asettico senza considerare i nomi dei tennisti.

Paradossalmente qui la situazione si complica, o meglio i dati forniti sono in antesi con quello che ci si aspetta. La proporzione “naturale” M1000/Slam 9/4 = 2.25 non trova riscontro nei dati empirici, addirittura la proporzione è molto più piccola: 1.486. Di per sé il dato non stupisce perché sappiamo benissimo che i giocatori sono soliti saltare i Masters 1000 piuttosto che gli Slam, ma questo non ci dà nessuna mano, anzi i risultati così come vengono proposti devono essere necessariamente scartati. In sintesi: non si può considerare la vittoria di uno Slam come 1.486 di quella di un Masters 1000. I casi sono pochi e la statistica non ci aiuta. Niente di nuovo sotto il sole. Si potrebbero simulare qualche migliaia di tornei con il Metodo Monte Carlo, ma appunto sarebbero solo simulazioni. Nulla da fare, bisogna cercare un’altra via.

Tolto l’approccio probabilistico e quello statistico non rimane che adottare un metodo brutale quale quello di imporre noi una certa proporzione. In questo caso si possono usare 3 tipi di funzione: lineare, esponenziale e logaritmica. Il primo tipo è semplicemente una proporzione che dipende da un certo coefficiente che non tiene conto del numero di vittorie (o piazzamenti), quella esponenziale dà sempre più un peso maggiore all’aumentare delle vittorie, quella logaritmica, contrariamente esponenziale, dà un peso peggiore all’aumentare del numero delle vittorie.

Funzione logaritmica: tale funzione di base è uguale a y = ln (x). Messa così non funziona perché per x = 1->y =0, che tradotto significa che una vittoria in un Masters 1000 vale 0 Slam. Allora è meglio usare una traslazione con y = ln(x+1) o y = ln (x/2 +1) o y = ln (x/4 +1).

Nel primo caso bastano 2 Masters 1000 vinti per raggiungere uno Slam, ma per arrivare a 2 Slam sono necessari 7 Masters 1000, per arrivare a 3 ci vogliono 19 Masters 1000. Sono dei numeri un po’ casuali però sono necessari per fare in modo che vincere tanti Masters 1000 non equivalga a vincere tanti Slam. La prima proporzione 2/1 non è tanto attinente alla realtà, ecco l’introduzione della seconda funzione, quella di colore marrone. In questo caso sono necessari 4 Masters 1000 per arrivare ad uno Slam, ma la distanza aumenta di tanto rispetto alla prima funzione: per arrivare a 2 Slam sono necessari ben 13 Masters 1000. Sembra che ci stiamo allontanando dalla realtà tanto da andare completamente fuori giri con la funzione di colore verde dove sono necessari 7 Masters 1000 per uno Slam. Non ci siamo. La prima funzione è quella che più si avvicina alla realtà, ma non basta.

Funzione lineare. Come accennato in precedenza con una funzione lineare c’è sempre una proporzione diretta tra vittorie di Masters 1000 e quelle dello Slam. Una proporzione che dipende dal coefficiente angolare. Non è complicato capire come funziona la proporzione. Basta dire che per 1 Slam sono necessari coefficiente*x Masters 1000. il primo rapporto che ci viene in mente è 9/4 = 2.25. Il secondo un po’ più ragionato è 3.56.

Nella funzione in blu si hanno i seguenti valori: 3 M1000 per 1.33 Slam, 5 per 2.22 e 7 per 3.11. Una proporzione un po’ troppo “leggera”. Nel secondo caso la forbice si allarga e sono necessari 4 Masters 1000 per arrivare ad uno Slam (1.12). 8 per 2.25 e 11 per 3.09. Questi numeri sembrano più attinenti alla realtà. E ci dicono che arrivare a 30 Masters equivale ad “avere 8.43 Slam in più”. E’ molto complesso arrivare a 30 così come lo è arrivare a 8 Slam, per cui la proporzionalità sembra buona, non perfetta, questo non lo sarà mai, ma si avvicina più o meno a quello che ci possiamo aspettare e a quello che potrebbe succedere nel corso della carriera di un tennista.

Per il momento la teoria si ferma qui. Questo è un argomento relativamente leggero. Ce ne saranno tanti altri un po’ più spinosi che richiederanno un po’ più impegno.

The numbers can tell us all about except the reason why we love it.

(Si ringrazia King per la foto di copertina di questa serie di articoli, si ringrazia per lo slogan Topspin1985 :P).