Una nuova rubrica del Napolista: la partita di ieri e il campionato del Napoli secondo gli indici statistici più dettagliati: expected goals, shot quality, conversion rate.
Con questo articolo il Napolista inaugura una nuova rubrica di analisi prestazionale. Indagheremo le partite del calcio Napoli tramite l’utilizzo di statistiche sportive classiche e moderne. L’analisi statistica è la nuova frontiera del business ed è opportuno promuoverla, dopo il successo negli Stati Uniti e nel Regno Unito, anche in Italia. Occorre discutere di calcio con basi differenti dal solo sensitivismo, attribuendo la giusta dignità allo sport che tanto amiamo. Buona lettura.
Le Football Analytics sono un’insieme di metodi di analisi statistica dei dati di gioco del calcio. Negli Stati Uniti sono note come Soccer Analytics e il loro sviluppo sta aumentando di pari passo con l’ascesa della MLS. Vari strumenti per indagare il calcio derivano dall’hockey in ragione di alcune similitudini. Infatti, il calcio è uno sport collettivo e risulta complesso codificare le innumerevoli situazioni di gioco. Ogni azione si articola in modo distinto da un’altra.
La statistica studia i fenomeni caratterizzati da casualità, cioè aventi un esito incerto, come le partite di calcio. Il proposito, generalmente, è produrre previsioni, ma anche comprendere lo stato di cose post hoc. Illustriamo le principali statistiche di Udinese – Napoli (giornata 13 di Serie A).
Nel prepartita abbiamo simulato una previsione sul risultato, incrociando le performance realizzative delle due squadre fino alla giornata 12. Il Napoli avrebbe dovuto segnare tra gli 1.6 e 1.8 gol, mentre l’Udinese tra gli 1 e 1.2 gol. Arrotondando 1-2 per il Napoli. Nei grafici successivi notiamo l’andamento realizzativo del Napoli in Serie A. Si nota come il Napoli sia orientato a produrre e subire poco, cioè intorno all’unità.
I punti chiari sono detti gol stimati. Essi sono calcolati in ragione di quanto costruito sul terreno di gioco seconda la logica degli xg (expected goals o gol attesi). Gli xg sono un indice statistico che misura la pericolosità offensiva tramite la valutazione della qualità di ogni tiro. Considerando l’insieme dei tentativi in una gara si arriva ad una misura di performance che, arrotondata, mostra un tabellino alternativo. Tra gli ultimi risultati del Napoli, quelli con la Juventus e la Lazio sono mendaci: il Napoli meritava un pareggio in trasferta allo Stadium e un vittoria al San Paolo. Errori e scarsa efficacia realizzativa hanno comportato un trend negativo, rispetto un inizio brillante di campionato. La prossima figura illustra la mappa dei 10 tiri del Napoli contro l’Udinese. I punti rossi sono le due reti di Lorenzo Insigne. Suo anche il terzo tiro nello specchio dall’area di rigore. Il man of the match statistico è proprio l’attaccante di Frattamaggiore, autore dei tentativi più pericolosi: tre big chanche da distanza ravvicinata in situazioni di open play con probabilità di successo rispettivamente di 60%, 60% e 30% circa. Le altre occasioni da fuori area (Insigne, Diawara e Mertens) sono statisticamente nulle. Tre i tiri intercettati. I padroni di casa, invece, hanno tirato 7 volte, di cui 3 in porta. Il colpo di testa vincente di Perica è stata l’azione più pericolosa.
In tabella sono presentati i principali indicatori statistici di qualità offensiva. Oltre i primi 3 tabellini, di cui si è già argomentato, ci sono 4 valori di tipo xg (tra cui le stime dell’analista Sander Ijtsma di 11tegen11) e 5 statistiche elementari, così dette perché non considerano la citata probabilità di successo per ogni tiro (il pdo è la combinazione tra le percentuali di tiro e salvataggio). Gli analisti dell’hockey, infatti, sostenevano che gli indici dovevano tener conto delle differenze dei singoli tentativi. Se un tiro dalla distanza non aveva la stessa efficacia di uno ravvicinato senza copertura dei difensori perché attribuirgli medesimo peso in un indicatore statistico?
Nel complesso, i valori del Napoli sono sempre migliori rispetto quelli dell’Udinese, soprattutto quando si considera la qualità e non solo la quantità delle situazioni offensive. L’Udinese ha raccolto più di quanto creato sul campo. Non avrebbe dovuto segnare, ma lo ha fatto. I conversion rate (rapporto tra i gol e i tiri, totali o in porta) e gli shot ratio (rapporto tra tiri fatti e la somma di fatti e subiti) non appaiono troppo diversi tra le due squadre. Il Napoli ha meritato, ma non ha ottenuto più di quanto dovesse. Ciò può accadere in situazioni di coerenza tra risultati reali e statistici. Come avvenuto nelle ultime gare, dunque, seppur vi sia stata una buona prestazione si può raccogliere meno di quanto dovuto. Sandre Ijstima, autore anche della metrica di shot quality (rapporto tra gli xg e i tiri totali), ha infatti dimostrato empiricamente la correlazione tra la qualità di tiro e la posizione in classifica. Meglio si tira, più si vince. Non conta quanto si tira, ma come si tira. L’obiettivo dello staff tecnico azzurro deve essere di allenare i calciatori nelle situazioni offensive con probabilità di successo importanti, ove possibile.
Gli xg del Napoli sono 1.5 contro gli 0.4 dell’Udinese. Nel calcolo, come per un expected value, si combinano tutti gli eventi occorsi (i tiri in una partita) pesandoli con la loro probabilità di successo. Nel calcolo dei fattori ponderali si considerano le caratteristiche del tiro statisticamente incidenti. Spetta all’autore, in ragione dei dati a disposizione e della bontà dei risultati, selezionare lo strumento di calcolo (frequenze relative o regressione per dati binari) e discernere i fattori significativi (solitamente distanza di tiro, testa o piede, stato di gioco, tipo di azione).
La casualità dei gol è uno dei principali ambiti d’intervento. I calci di rigore sono un esempio immediato di logica della previsione. Uno specialista con un penalty conversion rate dell’80% dovrebbe battere il portiere, soprattutto se quest’ultimo ha invece scarsi precedenti. L’idea è stata estesa dai set plays (tipici del baseball) ad ogni tiro in open play, seconda la logica del calcolo probabilistico sul buon esito delle situazioni offensive. Il punto critico nello sviluppo di una metrica è cogliere i tratti di persistenza e ripetibilità nell’ampia variabilità che caratterizza la misura osservata, nel calcio sia a livello di squadra che di giocatori.
Per la giornata 14 di Serie A, secondo le nostre simulazioni, il Napoli dovrebbe segnare tra gli 1.7 e i 2.1 gol, mentre il Sassuolo tra gli 1.1 e gli 1.4. Arrotondando 2-1. Ciò deriva dal fatto che la squadra di Di Francesco abbia sempre segnato almeno un gol fuori casa, ma ha spesso perso. La rincorsa del Napoli alla testa della classifica riprende. Dal punto di vista delle Football Analytics, gli azzurri stanno disputando un buon campionato, ma hanno raccolto 6 punti in meno rispetto a quanto avrebbero meritato. I punti stimati nella seguente figura sono calcolati in base ai punteggi alternativi nelle partite di campionato, seconda la logica degli xg.
Nei prossimi appuntamenti mostreremo altri strumenti statistici per l’analisi delle gare del Napoli, intanto, alleghiamo un elenco di link utili per chi fosse interessato ad approfondire la materia:
Qui il contributo di Sander Ijtsma
Qui il contributo di Micheal Caley
Qui il contributo di Martin Eastwood
Qui il contributo de L’Ultimo Uomo
Qui il contributo di Calcio e Finanza
Da bambini, quando si formano le squadre al campetto, c’è chi si propone come attaccante, chi vuole fare il fantasista, mentre per il portiere ci si alterna. Qualcuno, però, non sceglie nessuno di questi ruoli, perché insiste per annotare i dati di gioco a bordo campo. E’ lo statistico.
Si scherza, ovviamente. Analisti non si nasce, ma lo si diventa. Molti sportivi, appese le scarpette al chiodo, si dedicano all’osservazione dei numeri legati alla loro disciplina. Le scienze matematiche regolano il mondo. Non si tratta di stabilire se la statistica serva al calcio. La statistica serve al calcio. La strada è tortuosa ma la si sta percorrendo. Magari tra qualche anno un bambino saprà approssimare ad occhio il valore probabilistico di un tiro al campetto perché lo ha letto su internet o l’ha visto in tv. Intanto, pensi a giocare, ma – come tutti noi – imparare a non preoccuparsi e ad amare la statistica.