Cosa c’entra il teorema di Bayes con la pandemia? Molto, se si vuole capire quanto efficaci sono le contromisure.
Quando si parla di calcolo delle probabilità e di statistica spesso si entra (almeno io) in una valle di lacrime. Regole controintuitive, risultati che dipendono dalle definizioni, sottigliezze e garbugli di ogni tipo. Per esempio, la probabilità che tirando un dado esca 6 se è appena uscito un altro 6 è un sesto, che esca 6 due volte di fila è un trentaseiesimo, e basta cambiare pochissimo il testo del problema per dover dare risultati completamente diversi.
Tra gli aspetti che possono lasciare più perplessi in questo campo c’è la probabilità condizionata, ovvero la probabilità che si verifichi un certo evento sapendo che se ne è già verificato un altro. Facciamo un esempio che c’entri subito con l’attuale situazione sanitaria. Consideriamo un test per valutare la positività a Sars-Cov-2. Questo test avrà una certa efficienza, ovvero sarà in grado di identificare correttamente una certa percentuale, di solito inferiore al 100%, di infettati e una certa specificità, ovvero darà, in una piccola percentuale di casi, un risultato positivo anche su chi positivo non è. Diciamo, per dare numeri che possano aiutarci per capire meglio, che il nostro test sia efficace al 90% e dia lo 0.1% di falsi positivi. Questo vuol dire che se sono positivo e faccio il test ho il 90% di probabilità di essere identificato correttamente e se non lo sono ho lo 0.1% di probabilità di essere identificato erroneamente come positivo. Questi numeri hanno valore puramente teorico e non hanno nessuna pretesa di rappresentare la realtà.
Preso un caso singolo, questi numeri sembrano molto buoni, e in effetti lo sono: un test positivo mi dà la quasi certezza di essere veramente positivo, mentre un test negativo mi dà una ragionevole sicurezza di non esserlo. Se però consideriamo di fare questo test a moltissime persone, possiamo andare incontro a risultati inattesi. Consideriamo i numeri per il monitoraggio in Italia del 5 agosto 2021. Quel giorno la Protezione Civile dichiarò di aver identificato 7230 positivi su 212227 test effettuati. Possiamo calcolare quanti positivi ci aspettiamo in quel campione e quanti falsi positivi possiamo aver identificato. In realtà, la situazione è un poco più complicata: di quei 212227 test, soltanto 52259 sono stati effettuati su soggetti “nuovi”, gli altri erano o test di conferma o di ricerca della negativizzazione. Sostanzialmente, quindi, su poco più di 52000 persone testate alla ricerca di nuovi contagiati, circa 7200 sono risultate positive e circa 45000 negative.
Il Reverendo Thomas Bayes, vissuto in Inghilterra e Scozia nella prima metà del XVIII secolo, non pubblicò granché dei suoi studi matematici in vita: il massimo successo lo ottenne nel 1742, quando venne eletto alla Royal Society, grazie a un saggio in cui difendeva il lavoro di Isaac Newton sul calcolo differenziale.
Consideriamo prima i falsi positivi. Testando 45000 negativi, ci aspettiamo, con lo 0.1% di falsi positivi, 45 test con esito positivo. Questo non cambia di molto il numero totale di positivi, che potrebbe essere poco sotto i 7200, invece che poco sopra. Considerando questi, però,assumendo un’efficacia del 90%, dovremmo aspettarci di aver “perso” circa 800 contagiati, il cui test ha dato esito negativo. Se, invece di testate 52000 persone “seguendo una logica”, di contatto con persone risultate positive o simili, ne fossero state testate 5.2 milioni, il numero di falsi positivi atteso sarebbe stato superiore alle 5000 unità: assumendo per reali i nostri dati, quindi, il 5 agosto sono state testate 52000 persone, di cui 8000 positive. Di queste circa 7200 sono state correttamente identificate e una cinquantina potrebbe aver avuto un falso positivo. Ovviamente, questi numeri sono figli di assunzioni sull’efficacia e la specificità dei test completamente inventate, quindi non sono in nessun modo da considerare “realistici”. Inoltre, chi ha ricevuto un test positivo viene nei giorni successivi sottoposto a test di convalida e controllo, per cui i falsi positivi (se ci sono) vengono identificati rapidamente.
Usando le regole della statistica condizionata “di Bayes” (che, en passant, era un religioso e matematico inglese della prima metà del diciottesimo secolo, molto prima che si scoprissero i patogeni su cui stiamo applicando le sue formule), possiamo trovare altri dati interessanti, per esempio quale sia la probabilità di essere veramente positivi se si ha un test positivo. Di getto, potremmo dire 90%, ma non è così semplice. Abbiamo calcolato che, sulla base dei nostri numeri, dei 7230 positivi del 5 agosto 45 dovessero essere falsi positivi, quindi ci aspettiamo 7185 “veri” positivi: la probabilità di essere veramente positivi dopo un test positivo è quindi 7185/7230, circa 99.4%. Se avessimo testato 5.2 milioni di persone, prendendo gli stessi 8000 contagiati, avremmo però avuto circa 12400 positivi, di cui 7200 veri e 5200 falsi: la probabilità di essere davvero positivi dopo un test positivo sarebbe crollata a circa 7200/12400, il 58%.
Tutto questo ci dice che, anche in un contesto apparentemente chiaro, la probabilità è comunque in grado di giocarci qualche scherzo, per esempio, fare moltissimi test in presenza di una pur piccola percentuale di falsi positivi potrebbe, in situazione di bassa incidenza, portare una gran confusione. Molti meno scherzi ci stanno tirando i vaccini, che invece, anche alla prova della probabilità condizionata (probabilità di contagiarsi, ammalarsi o ammalarsi gravemente dopo essere stati vaccinati) confermano la loro efficacia. Nuovamente, per avere una stima, avremo bisogno di molti dati: il numero di persone vaccinate rispetto al totale, i nuovi casi tra vaccinati e non vaccinati, le diagnosi di malattia sintomatica e le ospedalizzazioni, sempre divise opportunamente, e solo allora potremmo andare a vedere, assumendo che non ci siano altri effetti significativi, quanto protegge il vaccino, “pesando” opportunamente gli eventi avversi in base al numero di soggetti suscettibili.
Potrebbe anche succedere, o meglio, con ogni probabilità succederà, che ci saranno più nuovi casi tra i vaccinati che tra i non vaccinati. Se, per esempio, il vaccino riducesse del 90% la probabilità di contagio, superato il 90% di vaccinati sarebbe comunque lecito aspettarsi questo sorpasso. Teniamolo a mente per quando succederà e qualche no-vax verrà a farcelo notare.
Per saperne di più:
Immagine di copertina: Probability via tomeqs/Shutterstock