GOATUltimi articoli

The GOAT Theory: Algoritmo Ranking Oriented

 

Dopo il rilascio della prima release bisogna fare un passo indietro e capire che cosa si è messo in atto, ossia quali sono state le implicazioni che quel tipo di approccio si è portato dietro. Ridurre tutta la carriera di un tennista a 4 categorie di tornei canonici e 2 non canonici è un approccio molto semplicistico, che può essere valido dal 2009 in poi, ma andando indietro con la macchina del tempo i risultati appaiono un po’ offuscati. Lo stint precedente il 2009 è quello 2000-2008. Sostanzialmente non ci sono state grandi riforme nella categorizzazione dei tornei, però questo stint rispetto a quello 2009-oggi è molto più diverso di quanto ci si possa aspettare. Tutti siamo abituati, per esempio, a mettere nello stesso calderone Slam e Slam, Masters Series con Masters 1000, ATP 500 con ATP Gold Series, e ATP 250 con ATP World Series. Il quadro non è così semplice come possa apparire. Se da un lato la massima categoria non ha subito variazioni, il diverso sistema di punteggio ATP di quelle inferiore ne modifica inevitabilmente le proporzioni. Il rapporto tra Slam e Masters Series del 2000-2008 è uguale a quello tra Slam e Masters 1000 del 2009-oggi (rapporto 1:2), ma il rapporto tra Masters Series ed “ATP Gold” è diverso da quello tra Masters 1000 e ATP 500 (diverso da 1:2). Questa è una delle conseguenze del Redshift che cambia le carte in tavola.

Considerando il 2017 (con anessa Olimpiade) come punto di riferimento per i calcoli relativi alla prima release si trova “l’equazione caratteristica” dell’annata:

I coefficienti evidenziati in blu rappresentano il numero massimo di tornei appartenenti ad una categoria che un giocatore può disputare. 4 Slam, 9 Masters 1000, 9 ATP 500, 13 ATP 250, 1 Masters (+1 Olimpiade). Se i primi 2 coefficienti sono facilmente ricavabili, il 3° e il 4° sono frutto di un ragionamento semplice che però non è così intuitivo. Un giocatore non può disputare 2 tornei contemporaneamente, per cui, pur essendo più numerosi i tornei appartenenti alla categoria, solo un sott’insieme di esso può essere disputato da un singolo giocatore. È impossibile che un tennista disputi contemporaneamente Tokyo e Pechino, dovrà scegliere, e questa scelta, o meglio la non possibilità di ubiquità, deforma i calcoli di una stagione e di conseguenza di tutte le altre.

Per chi non l’avesse intuito le x, y, z, i e j rappresentano rispettivamente i rapporti Slam/Masters 1000, Masters 1000/ATP 500, ATP 500/ATP 250, Slam/Masters, Slam/Olimpiadi (o l’inverso dei rapporti, cambia poco). Sono ben 5 variabili non statiche, che vanno bene per il 2009-oggi, ma per i periodi precedenti? Lasciamo in sospeso la domanda. La F rappresenta una costante, che nella simulazione è stata posta a 2000 (la famosa cella verde), ma può essere modificata in sede di inizializzazione purché però rimanga fissa per tutta la simulazione.

Il parametro che dà maggiore fastidio è la P. La P rappresenta il numero totale di punti realizzabili in una stagione. Punti ATP non punti GOAT. Applicando questa equazione al 2017 viene fuori che la P = 26250. Un numero come un altro. Ci si aspetterebbe che la P sia costante per tutto il periodo 2009-oggi invece i dati sono leggermente sfasati. Nel 2016 il numero totali di punti realizzabili era di 26500. La differenza è esigua, quasi trascurabile, però dovrebbe essere uguale a 0, perché se consideriamo vero l’assioma 4, che esplicita l’equipollenza di tutti i periodi ergo anche le stagioni, è necessario introdurre un correttivo year by year per mettere tutti i tennisti sullo stesso piano. Se non si adottasse questo correttivo ci sarebbe un deprecabile sfasamento in cui un giocatore avrebbe la possibilità teorica di realizzare più o meno punti rispetto ad un altro in un’annata diversa.

Troppe variabili

Senza volerlo nella prima release è stato applicato un algoritmo ranking oriented, e tutto va bene fino a quanto le categorie, o meglio i punti assegnati da una categoria, sono relativamente pochi. Nel caso 2009-oggi 4+2, 6. Il passo successivo quasi scontato sarebbe quello di usare lo stesso approccio per lo stint 2000-2008, però le equazioni si complicano parecchio fino quasi a farci pensare di cambiare qualcosa. Dal 2000 al 2008 ci sono 7 variabili libere, che sommate e quelle del Masters di fine anno e alle Olimpiadi danno 9 variabili totali. Questo per quanto riguarda i il 2000-2008. Se si va indietro e si considerano altri sistemi ranking ATP le variabili aumentano a dismisura. Si pensi ai ranking ATP degli anni ’80 con il sistema a stelle: teoricamente si dovrebbe usare una variabile per ogni stella, troppe. Si deve cambiare qualcosa.

Equazione caratteristica del 2008

Si è parlato di equazione caratteristica per il 2009-oggi, ma qual è quella del 2008? Bene, è la seguente:

I membri dell’equazione sono lievitati semplicemente perché nel 2008 le categorie erano 4, però in alcune di esse c’erano delle sottocategorie. In generale il quadro era il seguente:

  1. 1000 punti per gli Slam
  2. 500 punti per i Masters Series
  3. 300 punti per gli ATP Championship Series con montepremi di $1.000.000
  4. 250 per gli ATP Championship Series con montepremi di $800.000
  5. 250 per gli ATP World Series con montepremi di $1.000.000
  6. 225 per gli ATP World Series con montepremi di $800.000
  7. 200 per gli ATP World Series con montepremi di $600.000
  8. 175 per gli ATP World Series con montepremi di $400.000

Si noti come era possibile che i tornei ATP World Series con montepremi di $1.000.000 potessero avere gli stessi punti degli ATP Championship Series con $800.000 di prize money. Un’anomalia non da poco. Altro aspetto da attenzionare è la correlazione tra montepremi/categoria/punti assegnati, correlazione che scomparirà nel 2009. Aspetto della riforma preso molto spesso sotto gamba. Queste ulteriori elementi porterebbero a complicare la simulazione con l’aggiunta di ulteriori slider di proporzioni senza considerare che i tornei di una categoria/specie alle volte erano solo di una unità. È il caso di Dubai, unico torneo da 300 punti del 2008. Bisogna cambiare prospettiva.

Una sola variabile

Il cambio di prospettiva più logico è quello di usare una sola variabile libera e impostare delle proporzioni fisse che ricalcano quelle del ranking ATP. Ecco perché l’algoritmo viene chiamato “ranking orienteted”. Le proporzioni per il 2009-oggi saranno:

  • Slam / M1000 = x
  • M1000 / ATP 500: (2000/1000): x = (2000:500): y –>da cui y = 2x
  • ATP 500 / ATP 250: (2000/1000): x = (2000:250): z –>da cui z = 4x
  • Slam / Masters: (2000/1000): x = (2000:1500): i –>da cui i = 0.67x
  • Slam / Olimpiadi: (2000/1000): x = (2000:750): j –>da cui j = 0.75x

L’equazione caratteristica diventa (calcolando gli inversi):

Equazione 1

Quando poco o nulla rispetto alla versione precedente, semplicemente è necessario un solo slider.

La semplificazione necessaria consente subito di collocare i tornei del 2000-2008 dove cambia l’equazione caratteristica.

  • 1000 punti per gli Slam
  • 500 punti per i Masters Series = x
  • 300 punti per gli ATP Championship Series con montepremi di $1.000.000 = 1.67x
  • 250 per gli ATP Championship Series con montepremi di $800.000 = 2x
  • 250 per gli ATP World Series con montepremi di $1.000.000 = 2x
  • 225 per gli ATP World Series con montepremi di $800.000 = 2.22x
  • 200 per gli ATP World Series con montepremi di $600.000 = 2.5x
  • 175 per gli ATP World Series con montepremi di $400.000 = 2.86x

Per il 2008 l’equazione caratteristica con l’algoritmo ranking oriented diventa:

Equazione 2

Questo significa che nella simulazione i tornei 2000-2009 non verranno più accorpati, ma in base alla categoria derivante dai punti ATP verranno pesati di conseguenza.

Sfasamento dell’assioma 4

Se si considera vera l’equipollenza tra vari periodi storici deve accadere che fissati F e P per ogni x l’equazione 1 dovrebbe essere uguale all’equazione 2, ossia la somma dei massimi punti anno per anno dovrebbe essere per tutti uguale a prescindere dalla x. Proviamo a risolvere le 2 equazioni in x:

Proviamo a fare il rapporto:

Non è 1. Per quanto vicini ci sarà sempre una piccola discrepanza tra gli stint. In questo caso i tornei diversi dagli Slam nello stint 2000-2008 “valgono leggermente meno” rispetto allo stint 2009-oggi. E c’era da aspettarselo visto che la non completa separazione tra ATP Championship Series e ATP World Series ridistribuisce in maniera più uniforme i punti delle basse categorie a differenza della riforma 2009 che segna una separazione precisa tra tornei di 3a fascia e quelli di 4a.