Coronavirus: il concetto di PICCO e attendibilità del modello
21/03/2020 – Coronavirus: breve spiegazione del concetto di picco in un’epidemia, e considerazioni sull’attendibilità del modello logistico a fini di previsione.
Negli ultimi tempi abbiamo proposto ai lettori alcuni articoli di analisi dei dati ufficiali sull’epidemia da COVID-19 in corso, per capire che tipo di andamento stessero seguendo le principali variabili come il numero di decessi e quello dei ricoveri in terapia intensiva, mostrando anche il trend successivo che il modello propone. Tuttavia è necessario approfondire la questione dell’attendibilità di tale proiezione, soprattutto perché come avrete notato, il numero finale di decessi stimato (o in generale della variabile in esame), indicato con k, cresce di giorno in giorno con le nuove simulazioni, come mostra il grafico sottostante.
Per capire come questo sia possibile è necessario introdurre il concetto di picco relativo ad una variabile osservata.
Curva logistica e definizione di picco
Si definisce picco come quel momento in cui l’aumento giornaliero della variabile in esame (decessi, terapia intensiva, etc.) raggiunge il massimo valore, per poi iniziare diminuire.
Rimarchiamo che la definizione parla dell’aumento giornaliero della variabile in esame che raggiunge il suo massimo, e non della variabile stessa. Chi ha letto le nostre precedenti analisi avrà ormai familiarizzato con la curva logistica, che indica l’andamento nel tempo delle variabili di interesse. Cerchiamo di analizzare un po’ meglio il comportamento di questa funzione, che può essere schematizzato nelle seguenti fasi:
- esponenziale: inizialmente vi è una crescita molto rapida della variabile e del suo aumento giornaliero, che in pochi giorni porta a numeri elevati;
- lockdown: il trend si sposta da quello esponenziale e diviene parabolico; l’aumento giornaliero della variabile è lineare nel tempo; questo significa che ogni giorno continua ad esserci un numero più alto di nuovi avvenimenti (decessi, ricoveri, contagi, etc.) rispetto al giorno precedente, e tale numero di nuovi avvenimenti giornalieri cresce in maniera costante;
- picco: come abbiamo visto pocanzi, si tratta del momento in cui si registra il numero massimo dei nuovi avvenimenti giornalieri. Dopo il picco, i nuovi avvenimenti iniziano a calare giorno per giorno, fino a divenire molto lentamente nulli;
- plateau: siamo giunti alla fine dell’epidemia e non si registrano più nuovi avvenimenti. Perciò la curva della variabile appare come una linea orizzontale nel tempo.
Nel linguaggio matematico, il picco è individuato dal punto di flesso della funzione logistica, come mostra il grafico seguente.
La linea blu indica una generica curva logistica, dove possiamo ora individuare le 4 fasi descritte sopra. Il punto rosso indica il momento di raggiungimento del picco, che è il punto di flesso della funzione. La linea verde mostra l’aumento giornaliero dei nuovi eventi che la curva descrive: notiamo che questo continua ad aumentare fintanto che non viene raggiunto il picco, cioè il punto di flesso della logistica.
L’Italia attualmente si trova nella fase 2 per tutte le variabili (decessi, ricoveri, contagi, etc.), e perciò il picco non è ancora stato raggiunto.
Le proiezioni
Veniamo ora alle proiezioni, e cerchiamo di capire perché si osserva quell’aumento del valore finale stimato ad ogni nuova simulazione di cui abbiamo parlato all’inizio. La risposta è in realtà abbastanza semplice.
La simulazione considera l’ultimo dato pervenuto come quello di picco, e perciò mostra un andamento futuro con i nuovi avvenimenti in diminuzione.
Per questo motivo, se in realtà ci troviamo ancora distanti dal picco, ogni nuova simulazione tenderà ad alzare il plateau della curva logistica, portando ad un aumento progressivo del valore finale stimato. D’altra parte, se invece il picco è stato effettivamente raggiunto, la simulazione mostrerebbe un andamento futuro piuttosto plausibile con un’ottima stima del valore finale indicato con k.
Esempio: la Cina
Possiamo mettere in evidenza questo comportamento andando a guardare i dati della Cina, dove il picco è stato ormai raggiunto e superato, prendendo in esame il numero di decessi. Osserviamo il seguente grafico.
Le barre verdi indicano i nuovi decessi registrati giorno per giorno (nota: i 3 picchi più alti avvengono dopo un giorno senza nuovi casi, e perciò contengono i dati di due giorni invece che uno e appaiono più alti) . Le curve blu mostrano alcune simulazioni logistiche dell’aumento giornaliero basate sui dati precedenti al raggiungimento del picco, considerando quelli pervenuti fino al 27-esimo giorno. In particolare le 4 curve blu sono simulazioni distanziate di 1 giorno l’una dall’altra (basate perciò sui dati fino al 24-esimo giorno, poi 25-esimo, fino al 27-esimo): si vede come il picco viene sempre più spostato a destra, cioè più avanti nel tempo.
La curva rossa indica invece la simulazione logistica fatta sulla base di tutti i dati, cioè quelli registrati fino al 59-esimo giorno da inizio epidemia. Non si può fare a meno di notare che tale curva è ben poco distante da quella simulata il 27-esimo giorno. Cosa è successo? semplicemente, intorno al 27-esimo giorno è stato raggiunto il picco effettivo, e da quel punto in poi le simulazioni non si discostano più in maniera significativa nel tempo, convergendo a una stessa funzione.
Questo è messo in ulteriore evidenza dal seguente grafico, che mostra l’andamento del punto di flesso (picco) della curva logistica con cui le simulazioni fatte giorno per giorno approssimano l’andamento dei dati pervenuti. Notiamo che da un certo momento in poi il picco è stimato trovarsi sempre nello stesso giorno.
Sulla base di queste considerazioni, possiamo dire che le simulazioni di questo tipo hanno valore prognostico (cioè previsionale) solamente dopo il raggiungimento del picco, mentre prima hanno solamente un valore diagnostico, cioè ci dicono come si stanno comportando i dati, dando una stima futura sottostimata e quindi di scarso valore.
L’utilità delle simulazioni prima del raggiungimento del picco si limita perciò ad aiutare a capire in che fase della curva logistica ci si trova: infatti nei precedenti articoli abbiamo potuto constatare l’avvenuto lockdown. Una volta che avremo raggiunto il picco, potremo utilizzare queste simulazioni anche a scopo prognostico.
A riprova di questo discorso è interessante guardare anche il grafico dell’andamento nel tempo della stima del valore finale dei decessi (indicato con k) in Cina.
Notiamo una prima fase di grande aumento della stima finale; superato il picco, le simulazioni iniziano a dare una stima finale molto più coerente.
Situazione attuale in Italia
Riportiamo ora un grafico a barre analogo a quello mostrato sopra per la Cina, che mostra il numero di nuovi decessi registrati ogni giorno fino ad oggi e le relative simulazioni.
Le curve blu mostrano le simulazioni fatte giorno per giorno a partire da 5 giorni fa, mentre quella rossa è l’ultima simulazione. Notiamo che il picco stimato continua a spostarsi avanti nel tempo, e questo ci indica che non abbiamo ancora raggiunto l’effettivo picco.
Questo è messo in evidenza anche dal grafico del picco stimato dalle simulazioni effettuate giorno per giorno: notiamo una crescita continua.
È importantissimo dire anche che queste simulazioni si basano su una ipotesi fondamentale, che è quella di condizioni invariate nel tempo. In altre parole, non è ammesso lo scoppio di un nuovo focolaio, o l’improvvisa cessazione dei provvedimenti messi in atto per contenere i contagi o ancora una eccessiva noncuranza di queste regole, che potrebbe far esplodere nuovi focolai. In Cina evidentemente questa ipotesi ha funzionato piuttosto bene. Funzionerà anche da noi?
Un’ultima considerazione che va fatta è che in Italia abbiamo uno sfasamento dell’epidemia tra regioni. Questi significa che le regioni da cui sono partiti i primi focolai, come la Lombardia, non dovrebbero essere ormai lontane dal picco, anche guardando l’andamento dei dati cinesi, mentre altre regioni, come il Lazio, hanno iniziato tutto con un ritardo di oltre una settimana, e perciò il picco dovrebbe essere ancora piuttosto lontano, anche se i dati si dovrebbero attestare su valori molto più bassi grazie alle misure di contenimento messe in atto. Per questo motivo è fondamentale continuare a rispettarle e in maniera sempre più seria.
Ringrazio Claudio Giulianelli per il suo supporto e consiglio nell’analisi dei dati e dei modelli, da cui è nato questo articolo.