Aggiornato al 21/01/2025

Non sono d’accordo con quello che dici, ma difenderò fino alla morte il tuo diritto a dirlo

Voltaire

Jasper Johns (Augusta, Georgia, USA, 1930 - ) - Numbers

 

Numeri, numeri, sempre numeri

di Silvio Hénin

 

Da ben quattro mesi siamo abituati a uno stillicidio quotidiano di cifre. Giornali, radio, televisione e social media ci sommergono con uno tsunami di numeri, tabelle e grafici, frutto della fantasia di designer creativi e sedicenti esperti di comunicazione, ma spesso mancanti della semplice indicazione di cosa rappresentino ordinate e ascisse. Il tutto affiancato da affermazioni lapidarie, spesso discordanti, di giornalisti ed esperti affetti dalla smania della visibilità mediatica. Non di rado le conclusioni sono inquinate da pregiudizi e opportunismi politici o economici. Non credo che gli esperti si mostrino così spesso in pubblico per il vil denaro, ma piuttosto per vanità, vizio che colpisce ben più persone dell’avidità. Questo lo sa bene il Diavolo, che di peccati se ne intende.

Come avrete capito, mi sto riferendo ai dati sulla diffusione della pandemia di COVID 19 nel nostro Paese e nel resto del Mondo. L’indice di attenzione verso queste informazioni credo superi quello delle più popolari trasmissioni televisive, tipo Festival di San Remo o il Grande Fratello. Devo ammettere che anch’io sono stato colpito da questa frenetica fame di numeri, ma sto cercando di ravvedermi. Le prime domande che mi sono posto sono state “Come sono stati ricavati questi dati?”, “Quanto sono affidabili?” e “ Che significato hanno?”, infine, “A cosa ci servono?”.

Si sa, un numero sembra qualcosa di molto più affidabile di una affermazione generica. Dire “Vi sono 247 nuovi casi” sembra più oggettivo e preciso, più ‘scientifico’ e affidabile di “Vi sono molti nuovi casi”. Ma non è affatto così. Tutto dipende dalla ‘certezza’ del numero, quindi dal metodo di rilevamento. Basta un errore di trascrizione o un breve ritardo nella raccolta di parte dei dati e il 247 potrebbe facilmente diventare 267 o 217. Esiste inoltre una variabilità casuale, stocastica, che colpisce qualunque tipo di misurazione, ma di statistica parleremo più avanti.

Vediamo gli errori più comuni dei dati sulla pandemia. Tutte le sere, da quasi quattro mesi, sentiamo ripetere la stessa litania: “Oggi si sono trovati 54 nuovi casi, contro i 62 di ieri, ben 11 in meno”. Undici in meno, evviva! Siamo fuori dal tunnel, riapriamo le discoteche! Poi segue “Il numero di tamponi è stato 24.545 contro 29.411 di ieri”. Si può allora concludere che le cose stanno andando meglio? Assolutamente no! Facciamo due conti: la percentuale di tamponi positivi è passato da 0,21 % (circa due su mille) a 0,22 % (circa due su mille). Si dovrebbero quindi enfatizzare i valori relativi, non quelli assoluti, che sono fuorvianti. Ovviamente, questo presuppone che la conoscenza aritmetica degli italiani permetta loro di distinguere tra valori assoluti e valori relativi, di sapere cosa sono le frazioni e le percentuali. Le indagini svolte sulla competenza matematica nel nostro Paese dimostrano che purtroppo non è così, ma sarebbe comunque meglio essere precisi, almeno per rispetto verso coloro che ne sanno qualcosa.

Fatta questa correzione, possiamo dedurre che il numero di italiani infettati è circa due persone su mille? E che c’è stato un lieve aumento? Anche qui la risposta è un secco ‘no’. L’aritmetica elementare infatti non basta più, ci vuole la statistica, disciplina in cui la competenza è ancora più scarsa, perfino tra i laureati in materie scientifiche. Bisogna chiedersi cosa rappresenta esattamente il numero di tamponi effettuati e la prima domanda da porsi è “Come si contano?”. Ogni tampone rappresenta un nuovo caso, cioè un individuo mai esaminato prima? Sappiamo che il tampone viene ripetuto almeno due volte sullo stesso individuo e, nei casi di ricovero o di quarantena, anche più di due volte. Quindi se un giorno si denunciano 24.545 tamponi, non vuol dire che sono stati esaminati 24.545 nuovi individui. Forse sono disattento, ma non ho mai trovato informazioni precise in merito. Anche se fossero tutti nuovi casi, però, sarebbero solo una frazione trascurabile della popolazione, poco più di uno su diecimila abitanti, anche nei giorni in cui i tamponi hanno raggiunto i 70.000 al giorno. Inoltre, i tamponi sono concentrati certamente sui casi più a rischio, gli operatori sanitari, i pazienti ricoverati e in quarantena. In termini tecnici si dice che la casistica dei tamponi non è rappresentativa dell’intera popolazione. Un campione rappresentativo è quello in cui la media di ogni parametro (ad esempio, età, genere, malattie, ceto, educazione ecc.) è la stessa dell’intera popolazione. Ad esempio, se nell’intera popolazione vi è il 5% di diabetici e il 20% di ultrasettantenni, così dovrà essere anche nel campione. Facendo i conti (vi risparmio formule e dimostrazioni) occorrerebbe un’indagine su un campione di un migliaio di persone scelte casualmente (ad esempio, estraendo a sorte mille codici fiscali) eseguita però in uno stesso giorno e ripetuta settimanalmente su nuovi campioni casuali. Quindi, quanti sono oggi gli italiani contagiati dal virus? Lo 0,4% che ci dicono i media? Nessuno lo può sapere. Per la verità, non lo si può sapere per nessun altro paese.

Un ulteriore problema dei numeri strombazzati dai media riguarda il loro incalzare quotidiano. Ogni giorno, si attira l’attenzione sui dieci casi in più o i venti in meno e se ne traggono ingiustificate conclusioni. Si dimentica ciò che ogni bravo scienziato sa bene, cioè che spesso le variazioni sono puramente casuali, come in qualunque altro fenomeno naturale, dalla temperatura dell’aria al numero di nuovi nati. È per questo che non esistono metodi certi per vincere al Lotto o alla roulette, e se così fosse i giochi d’azzardo non esisterebbero neppure. Leggo oggi su un noto quotidiano il titolone “Crollo delle vittime per COVID”, solo perché ieri i morti sono stati solo tre. Ma questo calo non significa nulla, domani potrebbero tornare a dieci o scendere a uno, per risalire a trenta il giorno dopo. Quello che conta è la tendenza su tempi lunghi, in cui le variazioni aleatorie giornaliere tendono a compensarsi. Bisognerebbe perciò limitarsi a bollettini settimanali o, meglio ancora, mensili.

Potrei fare altri esempi di numeri privi di significato, ma non voglio diventare apodittico e pedante. Mi limiterò a un altro dato che ha riscosso il mio interesse: la letalità da COVID 19. Prendiamo solo i paesi dell’Europa occidentale, abbastanza simili tra loro per alfabetismo, economia, libertà di espressione, sistemi di assistenza sociale e sanitaria e infrastrutture. Esaminando i dati si vede che la letalità varia da meno del 3% fino a superare il 16%. Analizzandoli meglio, sembra che vi siano due grossi raggruppamenti: i paesi in cui l’indice di mortalità è inferiore al 8% (Germania, Austria, Portogallo, Finlandia, Danimarca, Svizzera e Norvegia) e quelli in cui supera il 10% (Svezia, Spagna, Olanda, Regno Unito, Italia, Francia e Belgio). Alcuni esperti, intervistati in proposito, hanno suggerito che una mortalità elevata sia da imputare a una maggior presenza di anziani nella popolazione. Ho voluto verificare personalmente, ma non sembra esserci nessuna correlazione tra i due parametri (Fig. 1). Ho ipotizzato allora che potesse esserci una relazione con la spesa sanitaria pro capite nei diversi paesi, nell’ipotesi che più soldi ai sistemi sanitari garantissero maggiore efficienza, migliore qualità delle cure, maggiori risorse tecniche e umane. Neppure questo sembra vero (Fig. 2). È quindi probabile che la causa delle disparità sia proprio il metodo di conteggio e di selezione, soprattutto il criterio usato per identificare il COVID come ‘la causa’ del decesso. Anche qui i dati significano ben poco se non se ne elabora un’interpretazione. Sarebbe infatti utile un’indagine accurata fatta da specialisti che si rechino in loco per confrontare procedure, criteri, metodi di registrazione dei dati. Se ne potrebbe trarre qualche conclusione utile nella pratica.

Mi fermo qui, ma mi permetto di aggiungere almeno una breve considerazione. I numeri sono importanti, ma alla loro corretta raccolta deve seguire un’interpretazione razionale, affidata a veri esperti, competenti nella statistica, non solo nella medicina. Certamente non lasciata a giornalisti e politici. L’interpretazione è ciò che trasforma i dati in conoscenza, sulla cui base dovrebbero essere prese tutte le decisioni politiche (parlo di policy, non di politics) ed economiche, altrimenti la prossima ondata ci travolgerà.

Sulla probabilità della prossima ondata sarei disposto a scommettere, ma sarei incoerente : sarebbe un puro azzardo, visto che non conosco abbastanza numeri sicuri e non ho modo di interpretarli.

Figura 1 – Relazione tra percentuale di anziani e letalità da COVID 19

 

Figura 2 – Relazione tra spesa sanitaria pro capite e letalità da COVID 19

 

Letalità: Lab24, Il Sole 24 ore, https://lab24.ilsole24ore.com/coronavirus/. Dati del 19/6/2020.

Dati demografici: AdminStat, https://ugeo.urbistat.com/AdminStat

Spesa sanitaria: Eurostat, Healthcare expenditure statistics, https://ec.europa.eu/eurostat/statistics-explained/index.php?title=Healthcare_expenditure_statistics

 

Inserito il:21/07/2020 22:25:19
Ultimo aggiornamento:21/07/2020 22:32:06
Condividi su
ARCHIVIO ARTICOLI
nel futuro, archivio
Torna alla home
nel futuro, web magazine di informazione e cultura
Ho letto e accetto le condizioni sulla privacy *
(*obbligatorio)


Questo sito non ti chiede di esprimere il consenso dei cookie perché usiamo solo cookie tecnici e servizi di Google a scopo statistico

Cookie policy | Privacy policy

Associazione Culturale Nel Futuro – Corso Brianza 10/B – 22066 Mariano Comense CO – C.F. 90037120137

yost.technology | 04451716445