Il mondo delle scommesse on-line è in continua crescita. Basta poco per rendersi conto di quante ricevitorie siano spuntate in città o degli ormai sempre più numerosi siti internet dedicati.

Si può scommettere sulla classica corsa dei cavalli e anche sull’esotico cricket, sul tennis, sulla vela e, se proprio lo sport vi annoia, potete scommettere sugli esiti delle elezioni politiche in USA o sui ranking del celebre video-game League of Legends! (www.snai.it/sport )

Nonostante tutta questa scelta, il calcio continua ad avere il bacino di scommesse più ampio: basti pensare che solo per la partita Italia Germania degli europei 2016, sul sito della Sisal era possibile effettuare oltre 114 scommesse diverse!

image06

Il principio dietro a una scommessa è molto semplice: gioco dei soldi, “puntando” su un certo risultato e se ci prendo vinco tanti soldi quanti sono valutati dalla relativa quotazione. La quotazione di una scommessa esprime quindi una probabilità che un certo evento si verifichi ed è ottenuta principalmente in base all’esperienza del bookmaker e alle sue considerazioni e studi del settore.

D’altro canto, più si è abili nel prevedere un certo risultato, più ci si può definire buoni scommettitori.

Un vero appassionato spulcia riviste e siti web con chirurgica attenzione cercando di ottenere quante più informazioni possibili prima di giocare. Segue il campionato e resta sveglio fino a tardi per il dopo partita, perché non basta la fortuna per vincere una scommessa ma è necessario raccogliere tutte le informazioni possibili.

Il vero problema di questo modus operandi è che in ogni caso ci si affida all’istinto e al presentimento, influenzando la predizione finale in maniera decisamente personale.

Proprio per svincolare la previsione dai fattori soggettivi, sono nati una serie di metodi basati sulla matematica e sulla statistica.

Tutto comincia con uno dei 100 personaggi più carismatici del 2006 secondo The Times: Bill James. James è un grandissimo appassionato di baseball e per primo sostenne l’importanza di introdurre un sistema analitico basato su un metodo statistico “definitivo” (almeno in parte) che esca immune da previsioni influenzabili dal giocatore preferito. Dall’acronimo SABR, Society for American Baseball Research, nasce così la sabermetrica, ovvero lo studio “e la ricerca di una comprensione oggettiva del baseball”, studio che viene iterato nel tempo al fine di individuare un indice di prestazione delle squadre e dei singoli giocatori.

Successivamente la sabermetrica è stata applicata ad altri sport e trova utili applicazioni anche nell’hockey, nel basket e, in tempi più recenti, nel calcio. Il calcio, però, è uno sport che si presta più difficilmente agli studi della sabermetrica dato che, ad esempio, prevede 22 giocatori contro i 10 di una partita di pallacanestro. Inoltre, rispetto a una partita di baseball dove battuta e ricezione avvengono in un’area ben definita, le azioni calcistiche sono più complesse e difficili da prevedere.

Tra i parametri utilizzati per fare previsioni durante un match di calcio abbiamo il Total Shots Ratio o TSR= numero tiri fatti/ (n tiri fatti + tiri subiti), oppure il derivato SoTR (Shots of Target Ratio) = %[Tiri in porta/(tiri in porta fatti+ tiri in porta subiti)].

Questi indici però hanno in comune l’assunto che ogni tiro sia uguale agli altri, sia che venga calciato su punizione che su azione, sia dai 10 che dai 30 metri. Ovviamente le cose sono un po’ diverse e non ci basta il semplice numero di tiri per definire un eventuale indice di prestazione di una squadra.

Per risolvere questa mancanza il matematico Paul Riley ha introdotto lo Shot Position Average Model (SPAM).

Secondo questo modello, corroborato su oltre 30 mila tiri della Premier League nelle stagioni calcistiche dal 2009 al 2012, Riley arriva a definire una media dei tiri necessari prima che uno di essi venga “trasformato” in goal. Le aree principali in cui può essere divisa la metà campo sono 4, ma ci sono modelli più complessi che tendono ad individuare anche più zone.

Nello schema a sinistra Riley ha diviso il campo in 4 aree colorate e ogni numero indica il numero di tiri medi che deve essere effettuato prima di ottenere un goal. A destra un altro modello che prevede 8 zone.

Nello schema a sinistra Riley ha diviso il campo in 4 aree colorate e ogni numero indica il numero di tiri medi che deve essere effettuato prima di ottenere un goal. A destra un altro modello che prevede 8 zone.

L’altro indice di grande interesse è quello dei “goal previsti” o Expected goals (xG o ExpG).

Questo indice esprime il numero di goal attesi da una squadra rispetto alle performance ottenute fino a quel momento e tiene quindi conto non solo della quantità ma anche della qualità dei tiri effettuati: il tipo di tiro (es: di testa o di piede), la posizione, la velocità di attacco e altri fattori legati all’assist. Vanno esclusi dalle statistiche degli xG le sanzioni e gli autogol.

Il modello di xG di Paul Riley è calibrato benissimo sulla Premier League e prende in esame solo i tiri in porta. Tuttavia esistono modelli più versatili che differiscono non tanto per i concetti di base quanto per il peso dato ai singoli fattori e a piccole variazioni sulle formule.

Il modello di Michael Caley è sicuramente un’alternativa interessante. Anzitutto si tratta di uno schema che restituisce ottimi riscontri rispetto ad altri campionati europei (compresa la nostra serie A), in secondo luogo tiene conto non solo dei tiri in porta ma dei tiri totali, delle rimesse laterali e dei calci d’angolo.

Per valutare al meglio i vari parametri, il campo viene suddiviso in 46 micro-aree o “bin” a cui è associata una particolare probabilità di segnare.

Nel modello a “Bin” di Michael Clay la metà campo è divisa in 46 aree e segnare dalla casella 14 ha una probabilità teorica del 59% di essere goal, mentre dalla casella 5 la probabilità teorica sale al 91%

Nel modello a “Bin” di Michael Caley la metà campo è divisa in 46 aree e segnare dalla casella 14 ha una probabilità teorica del 59% di essere goal, mentre dalla casella 5 la probabilità teorica sale al 91%

I modelli elencati finora portano a collezionare una serie di dati che possono essere analizzati tramite uno studio di regressione lineare (vedi Figura in basso), e in base alla distanza dei punti dalla media si cerca di analizzare se i fattori che ne provocano l’allontanamento siano legati a semplici fluttuazioni statistiche o a quelli che vengono definiti “punti di cambiamento”.

Didascalia: in figura sull’asse delle x abbiamo i goal attesi mentre sulle y i gol realizzati durate 4 stagioni calcistiche di oltre 80 squadre prese dei maggiori campionati. Il valore di R2 esprime l’attendibilità del modello rispetto alla realtà e se R2=1 c’è piena corrispondenza, se R2=0 il modello è da scartare. In questo caso R2 ha un valore molto vicino a 1 e possiamo ritenere il nostro modello più che soddisfacente.

In figura sull’asse delle x abbiamo i goal attesi mentre sulle y i gol realizzati durate 4 stagioni calcistiche di oltre 80 squadre prese dei maggiori campionati. Il valore di R2 esprime l’attendibilità del modello rispetto alla realtà e se R2=1 c’è piena corrispondenza, se R2=0 il modello è da scartare. In questo caso R2 ha un valore molto vicino a 1 e possiamo ritenere il nostro modello più che soddisfacente.

Lo studio dei “punti di cambiamento” rispetto al normale andamento di una squadra in base alle sue prestazioni passate, è un altro dei settori di cui si occupa la sabermetrica.

Da quest’analisi è anche possibile capire se gli straordinari risultati di un certo atleta siano dovuti al caso, all’allenamento o all’uso di doping.

Torniamo al calcio e facciamo qualche considerazione pratica sulle partite dell’Italia durante questo campionato europeo 2016.

Nella partita Italia Spagna, le occasioni di segnare ci sono state e gli xG dell’Italia sono stati superiori ai valori xG della Spagna. Possiamo dirlo senza paura: la vittoria è stata meritata.

A Sinistra: I tiri in porta (SoT) dell’Italia; a destra i tiri in porta della Spagna. I palloni arancioni sono i tiri “off-target”, i neri sono quelli trasformati in goal, mentre i viola sono i tiri parati e i gialli quelli bloccati. Si nota facilmente come l’attacco della nostra nazionale fosse più preciso di quello dei campioni d’Europa 2012. – fonte www.sqwaka.com

A Sinistra: I tiri in porta (SoT) dell’Italia; a destra i tiri in porta della Spagna. I palloni arancioni sono i tiri “off-target”, i neri sono quelli trasformati in goal, mentre i viola sono i tiri parati e i gialli quelli bloccati. Si nota facilmente come l’attacco della nostra nazionale fosse più preciso di quello dei campioni d’Europa 2012. – fonte www.sqwaka.com

Situazione diversa per il match dei quarti di finale Germania – Italia. Abbiamo visto una partita particolarmente equilibrata nel primo tempo, con un’Italia che aveva dalla sua una difesa valida e una Germania poco incisiva nell’attacco.

Tiri complessivi durante i 120 minuti di Germania - Italia. A sinistra la porta della Germania e a destra la porta dell’Italia. Fonte www.sqwaka.com

Tiri complessivi durante i 120 minuti di Germania – Italia. A sinistra la porta della Germania e a destra la porta dell’Italia. Fonte www.sqwaka.com

Durante il secondo tempo la situazione è cambiata (anche se non tanto da sconvolgere il risultato) e lo stesso Michael Caley, in uno dei suoi tweet live, scriveva che la Germania era decisamente superiore in termini di xG.

Nelle immagini postate da Caley i quadratini rappresentano le occasioni di tiro delle due squadre e il corrispettivo valore degli xG.

In figura a sinistra il primo tempo, mentre a destra il secondo tempo di GER-ITA attraverso i tweet di M. Clay che secondo me, sotto-sotto, tifava Germania. Come si nota durante il match l’Italia ha avuto tante piccole occasioni, mal sfruttate e decisamente poco incisive che hanno mantenuto il tasso di xG basso sotto lo 0.4. Mentre la Germania ha avuto buone possibilità di rimonta portando i suoi xG da 0.2 a 1.4.

In figura a sinistra il primo tempo, mentre a destra il secondo tempo di GER-ITA attraverso i tweet di M. Caley che secondo me, sotto-sotto, tifava Germania. Come si nota durante il match l’Italia ha avuto tante piccole occasioni, mal sfruttate e decisamente poco incisive che hanno mantenuto il tasso di xG basso sotto lo 0.4. Mentre la Germania ha avuto buone possibilità di rimonta portando i suoi xG da 0.2 a 1.4.

Statistiche Passaggi: Numero di attacchi e passaggi del Belgio e della Spagna durante le partite di Euro16. Come si deduce l’Italia ha goduto di un ottima difesa durante questo campionato.

Statistiche Passaggi: Numero di attacchi e passaggi del Belgio e della Spagna durante le partite di Euro16. Come si deduce l’Italia ha goduto di un ottima difesa durante questo campionato.

La sabermetrica diventa un argomento sempre più interessante che, nonostante i suoi limiti, offre dei parametri oggettivi per le nostre considerazioni sportive. Nel mondo del calcio la strada è ancora lunga e le variabili in gioco da gestire sono tante ma i progressi degli ultimi anni sono notevoli.

In ogni caso,  se da un lato parlare di calcio scommessa può essere un modo per far tornare l’interesse per la matematica, dall’altro dobbiamo ricordarci che il gioco crea dipendenza e i numeri non aiutano ad essere più razionali in questo, anzi, c’è il rischio di farvi troppo affidamento. È importante tenere a mente che esiste sempre e sempre esisterà l’errore umano e se vogliamo giocare dobbiamo farlo con giudizio prima di ogni cosa, e poi … tutti a studiare la matematica!

Filmografia e Extra:

Se volete approfondire potete guardare questi film:

Numb3rs – Ep 3×08: In questa puntata della 3 stagione della serie tv Numb3rs, dove matematica e lotta contro il crimine vanno a braccetto, viene trattata la questione dei punti di cambiamento partendo da una morte sospetta di un giocatore di baseball, per l’appunto!

Moneyball – L’arte di vincere (2011); di B. Miller con Brad Pitt e Philip S. Hoffman. In questo film invece viene per la prima volta trattato il tema della sabermetrica in relazione al mondo delle scommesse.

Oppure dare un occhiata a questi siti:

http://www.ultimouomo.com/cosa-sono-gli-expected-goals/

https://www.washingtonpost.com/news/fancy-stats/wp/2016/06/30/ability-to-play-in-different-styles-gives-germany-the-edge-over-italy/

http://cartilagefreecaptain.sbnation.com/2015/4/10/8381071/football-statistics-expected-goals-michael-caley-deadspin

http://cartilagefreecaptain.sbnation.com/2014/2/12/5404348/english-premier-league-shot-statistics

https://differentgame.wordpress.com/spam-our-model/