Guida base per interpretare e archiviare dati meteorologici
Sei sicuro di saper interpretare al meglio i dati meteorologici che ti mostra la tua stazione? La questione è tutt’altro che banale, e cerchiamo di introdurla in questo articolo.
Possedere una stazione meteo consente di monitorare le condizioni del tempo istantaneamente nella propria zona, grazie ai dati meteorologici che ci vengono riportati su una comoda console o pagina web. Questi dati, tuttavia, non vanno visti come numeri illuminanti e infallibili, ma bisogna saperli interpretare in maniera scientifica. Di fatto, siamo in possesso di uno strumento di rilevazione scientifica, e bisogna conoscere almeno le basi della teoria della misura. Quest’ultima, per essere trattata in maniera completa, richiederebbe almeno un intero corso universitario dedicato; in questo articolo ci limiteremo a richiamarne gli aspetti fondamentali.
La verità… non la sappiamo mai
Cominciamo con un esempio banale. Pensiamo ad un righello che ha una tacca ogni millimetro, e supponiamo di voler misurare la lunghezza di un legnetto. Al primo tentativo, troviamo che il legnetto arriva tra una tacca e un’altra. Qual è la sua misura? se possedessimo un calibro, con una tacca ogni millesimo di millimetro (micron), forse sapremmo la risposta; o forse no. Magari, anche in quel caso, il legnetto arriva tra una tacca e un’altra.
Cominciamo a fare conoscenza dell’incertezza associata a una misura, strettamente legata all’accuratezza del nostro strumento. Proprio così: uno strumento, quanto più costoso che sia, non fornirà mai una misura esatta, ma a questa sarà sempre associata un’incertezza.
Quando compriamo uno strumento di misura, insieme ad esso è sempre presente un foglio (datasheet) che ci illustra qual è l’incertezza da associare alle misure. Il righello, che ha una tacca ogni millimetro (risoluzione di 1 mm), ha banalmente un’incertezza di 1 mm. Ovvero, se ad esempio leggiamo sullo strumento una misura di 34 mm, dobbiamo interpretarla come
\[\text{misura = }34\pm 1\text{ mm,}\]
ovvero il valore esatto della lunghezza del legnetto si trova tra 33 e 35 mm.
Un fatto interessante è che, se ripetessimo tante volte la misura della lunghezza del legnetto, troveremmo spesso valori diversi (provare per credere!). Si può pensare, allora, di annotare tutti questi valori diversi e farne la media, per ottenere una misura un po’ più accurata di quella singola. In effetti è proprio così che si fa, e si scopre che nella situazione più semplice, se abbiamo eseguito N misure, l’incertezza associata alla media è
\[\text{incertezza}/\sqrt{N}.\]
Se ad esempio abbiamo eseguito 9 misure (N=9), essendo la radice quadrata di 9 pari a 3, avremmo un’incertezza associata alla media di queste nove misure pari a 0.1/3 mm, ovvero 0.03 mm. Aumentando N l’incertezza sulla media diventa sempre più piccola, ma mai nulla.
Compatibilità tra le misure
Tornando quindi ai dati riportati dalla nostra stazione meteo, abbiamo capito che questi non possono mai essere i numeri della verità, ma sono valori sempre e comunque affetti da un’incertezza.
Nel mondo dei meteo-appassionati sono principalmente due le tipologie di stazione meteo utilizzate: le entry level (come Oregon Scientific WMR-88, WMR-100, Froggit WH1080SE, FineOffset HP1000, LaCrosse varie, et similia); le semi-professionali Davis (Vantage VUE e Vantage PRO2 con vari sottomodelli). Su queste tipologie di stazione ci soffermiamo.
Per fare un esempio pratico, le incertezze tipicamente associate ai valori di temperatura riportati da queste due tipologie di stazione, sono:
- entry level: ± 1°C;
- Davis: ± 0.5°C.
Quindi, se sulla console di una stazione entry level leggiamo che la temperatura esterna è di 25.7°C, il valore reale di temperatura si trova tra 24.7 e 26.7°C. Si tratta di un intervallo di 2°C, piuttosto ampio!
La prima conseguenza, importantissima, di questo fatto, è che, se affianchiamo due stazioni entry level, e leggiamo i valori di temperatura 25.7 e 26.3, queste misure sono compatibili tra loro, ovvero hanno lo stesso significato scientifico. Il valore reale per la prima si trova tra 24.7 e 26.7, mentre per la seconda tra 25.3 e 27.3, e quindi ci accorgiamo che la misura dell’una è contenuta nell’intervallo di incertezza dell’altra. Non possiamo affermare né che la prima sottostima, né che la seconda sovrastima. Possiamo solamente affermare che le temperature lette sono compatibili tra loro. Lo stesso discorso vale chiaramente anche per le stazioni Davis, con un intervallo di incertezza tuttavia pari alla metà.
La misura dei parametri atmosferici
Misurare i principali parametri atmosferici (temperatura, umidità relativa, velocità e direzione del vento, pioggia) è più complicato di misurare la lunghezza di un legnetto con un righello, per due motivi:
- i parametri atmosferici subiscono rapide variazioni nel tempo;
- le misure sono indirette, ovvero ciò che effettivamente viene misurato è un voltaggio, un segnale elettrico, successivamente convertito nei parametri letti sullo schermo, tramite equazioni teoriche.
Come prima conseguenza del primo punto, si nota come divenga difficile applicare il concetto di misure ripetute per ridurre l’incertezza, che abbiamo visto alla fine del primo paragrafo, in quanto di fatto ad ogni ripetizione della misura il parametro in esame potrebbe essere variato. Si pensi alla temperatura che, anche nella situazione più stabile possibile, come una giornata estiva, di base subisce una variazione dovuta allo spostarsi del sole sull’orizzonte;
o, ancora peggio, si pensi al vento, il parametro che per eccellenza mostra in maniera più evidente un andamento turbolento. Con la parola turbolento si intende un andamento che subisce grosse variazioni in piccolissimi intervalli di tempo, apparentemente casuali; nel caso del vento, basti considerare le raffiche, ovvero repentini aumenti della velocità del vento che appaiono in maniera che sembra casuale, per convincersi che il vento ha un comportamento turbolento. In realtà hanno un andamento turbolento anche temperatura e umidità relativa, ma in maniera meno evidenziabile dagli strumenti che abbiamo precedentemente citato.
L’intervallo di campionamento
Dobbiamo quindi accontentarci di misure singole, con incertezze di uno o mezzo grado? Qualcosa, seppur piccola, si può fare. Entra in gioco la seconda fondamentale caratteristica degli strumenti meteo: l’intervallo di campionamento. Si tratta dell’intervallo di tempo che intercorre tra una misura e l’altra.
L’idea è che se riuscissimo ad averlo molto piccolo, di qualche secondo, forse potremmo applicare il concetto di media su tante misure per ridurre l’incertezza, ipotizzando che in questo piccolo intervallo non ci sia stata una variazione poi così significativa. Inoltre, nel caso specifico dell’atmosfera, fare la media di più misure può aiutare a dare una certa regolarità all’andamento di parametri turbolenti.
L’archiviazione dei dati
Fatte queste considerazioni, vediamo qual è la maniera più scientificamente valida per leggere e interpretare i dati delle nostre stazioni entry level o semi-professionali.
Lo scopo delle misure che eseguiamo con tali stazioni è quello osservativo e a fini climatologici, ovvero vorremmo negli anni ingrandire il nostro database di dati per poter iniziare a parlare del clima della nostra zona.
La prima cosa che osserviamo è che i dati, sullo schermo della nostra stazione, si aggiornano con una certa rapidità (48 secondi per le stazioni entry level, 2.5 secondi per le stazioni Davis), che corrisponde proprio all’intervallo di campionamento dello strumento. Dobbiamo sfruttare al meglio questi dati che ci arrivano e cercare di utilizzarli tutti, per iniziare a trarre delle conclusioni.
Il primo errore che si tende a commettere, è quello di registrare solamente gli estremi dei parametri: temperatura massima e minima, massima raffica, etc. Questo è un errore gravissimo, perché di fatto stiamo utilizzando solamente pochi dei tantissimi dati giunti sulla nostra console, e stiamo cestinando il lavoro che il nostro strumento esegue. Ogni giorno abbiamo a disposizione:
[table id=5 /]
Ebbene, su almeno 1800 dati di cui disponiamo ogni giorno, ne salviamo solamente 2?! Tra l’altro, salvando solamente gli estremi, a queste misure va associata l’incertezza riportata sulle istruzioni del nostro strumento, ovvero 1°C per le entry level e 0.5°C per le semi-professionali. Può avere un senso scientifico un archivio dati con solamente estremi a cui è associata un’incertezza di ±1°C?!
Se vogliamo aspirare ad avere un archivio a fini climatologici, dobbiamo operare in maniera totalmente diversa. La maniera standard per misure con questi fini è calcolare la media ogni 5 minuti di tutti i dati giunti dai sensori in tale intervallo e archiviarli in un database; ogni record, inoltre, deve contenere anche gli estremi registrati in ciascun intervallo, in modo da poter anche archiviare gli estremi assoluti. Nelle due tabelle successive sono riportati il numero dei dati raccolti in 5 minuti dai due tipi di stazione che stiamo esaminando.
Stazioni semi-professionali Davis
[table id=6 /]
Stazioni entry level
[table id=7 /]
Il datalogger delle Davis esegue esattamente il lavoro descritto. Per applicare lo stesso tipo di archiviazione alle stazioni entry level, si può affiancarvi un micro-pc Raspberry Pi opportunamente programmato.
Dati medi e dati puntuali
Non deve passare inosservato che abbiamo scritto dati medi ogni 5 minuti, e non puntuali. La sottile differenza è che i dati medi riportano la media di tutti i dati giunti in 5 minuti dai sensori (es. 120 campionamenti di vento per una Davis), mentre i dati puntuali riportano ogni 5 minuti un solo dato campionato nel momento della creazione del record. E’ chiaro che quest’ultima scelta è da scartarsi: perché su 120 campionamenti prenderne solamente 1 ogni 5 minuti? Un esempio pratico di questa differenza è direttamente visualizzabile dai seguenti grafici:
Si osserva facilmente come nei dati medi il segnale appaia molto meno dispersivo e più regolare. Eseguendo la media a 5 minuti, gli effetti della turbolenza vengono resi meno evidenti e si hanno delle misure scientificamente valide. Un archivio con un singolo campionamento di vento ogni 5 minuti (a fronte della media su 120!) è da cestinare.
Il software è importante
Ora che abbiamo capito come sfruttare al meglio tutti i dati campionati dai nostri sensori, dobbiamo capire come mettere in pratica questa teoria. La risposta è banalmente quella di utilizzare un software di analisi e archiviazione adeguato, da collegarsi alla stazione meteo.
Il datalogger delle stazioni Davis mette direttamente in pratica la teoria qui esposta. Sul software Weatherlink in dotazione, i dati che andiamo a scaricare sono proprio i dati medi campionati in un intervallo a scelta (1, 2, 5, 10 o 30 minuti, si raccomanda di scegliere 5 minuti), e in ogni record sono contenuti anche gli estremi assoluti.
Per applicare lo stesso tipo di archiviazione alle stazioni entry level, si può affiancarvi un micro-pc Raspberry Pi opportunamente programmato con software WeeWX, l’unico in grado di eseguire un’analisi scientificamente valida di questo tipo.
Inviare i dati on-line
Quando decidiamo di inviare i dati della nostra stazione meteo on-line in tempo reale, per poterli consultare in qualsiasi momento, non è banale capire che tipo di dati mostrare e ogni quanto. Tipicamente si tende a commettere l’errore di scegliere un intervallo di aggiornamento dei dati il più real time possibile, senza curarsi di che tipo di dato stiamo parlando. La scelta più logica è quella di aggiornare i dati ogni 5 minuti e mostrare i dati medi degli ultimi 5 minuti. In questo modo avremo un quadro completo della situazione aggiornato praticamente in tempo reale e senza strani picchi.
L’andamento turbolento del vento preso da un timelapse con 1 fotogramma al minuto – webcam di Romaeurmeteo.it
Cosa si intende con quest’ultima affermazione? Pensate un momento al vento in una giornata particolarmente ventosa (VIDEO): sicuramente noterete la banderuola del vostro anemometro oscillare ogni tanto, e sulla console apparire qualche dato di direzione del vento fuori dal coro (ad esempio, se tira Scirocco, capita che per qualche istante la direzione del vento che viene mostrata è del tutto differente, ad esempio Tramontana). Questo è del tutto normale ed è dovuto allo strumento che per sua natura subisce delle oscillazioni. Tuttavia, se pensiamo di inviare i dati puntuali on-line sul nostro sito, durante la giornata con Scirocco, ogni tanto troveremo scritto che soffia Tramontana, perché magari il campionamento del dato singolo è stato fatto proprio nell’istante in cui la banderuola ha oscillato. Questo dato non apparirebbe se avessimo scelto di inviare i dati medi invece che quelli puntuali, perché quel dato fuori dal coro verrebbe mediato insieme ai tanti altri nel coro.
Lo stesso discorso vale per la velocità del vento. Capitano quegli istanti in cui è in atto una raffica, e sul sito ci appare una velocità del vento elevatissima. Allora, è bene dare delle definizioni:
- Velocità del vento = valore medio della velocità del vento negli ultimi 5 minuti, calcolato con quanti più campionamenti possibile (il valore di 120 campionamenti in 5 minuti delle Davis è ottimo);
- Raffica del vento = valore massimo raggiunto dalla velocità del vento negli ultimi 5 minuti;
- Direzione del vento = valore medio della direzione del vento negli ultimi 5 minuti, calcolato con quanti più campionamenti possibile.
E’ chiaro che il calcolo della raffica di vento viene più accurato se il nostro intervallo di campionamento è buono. Quello di 2.5 secondi della Davis è ad esempio buono, mentre quello di 48 secondi delle entry level è troppo elevato, e non fornisce misure adeguate.
Sul sito, ad ogni aggiornamento ogni 5 minuti, dobbiamo quindi intendere i tre valori prima elencati così come scritto. Allo stesso modo dobbiamo operare quando scriviamo un aggiornamento della situazione meteorologica: con velocità e direzione del vento dobbiamo sempre intendere quelle medie degli ultimi 5 minuti, e semmai specificare la raffica. In realtà, dobbiamo intendere anche i dati di temperatura umidità come mediati negli ultimi 5 minuti.
Se poi sul sito vogliamo anche avere i dati ancora più real time, conviene installare uno script che permette la visualizzazione in tempo reale dei pacchetti dati che giungono sulla console, come questo.
Se decidiamo di inviare i nostri dati a una rete di monitoraggio scientifica, come quella di Meteo Lazio, dobbiamo assolutamente scegliere di inviare i dati medi a 5 minuti piuttosto che quelli puntuali. In questo modo forniremo alla rete tutta l’informazione che abbiamo: infatti in questi dati sono raggruppate insieme le informazioni di ogni pacchetto dati giunto dai sensori, senza buttare nulla.
La temperatura media di un periodo
Un dato che spesso non viene neanche considerato quando si fa un report giornaliero, è quello di temperatura media. Spesso si tende a riportare semplicemente massima e minima. Come abbiamo visto, questo tipo di approccio è concettualmente errato e porta ad avere in mano solamente dati di pochissima rilevanza.
La temperatura media giornaliera, ovvero il valore medio di tutti i pacchetti dati ricevuti dai sensori nell’arco di un giorno (1800 per stazioni entry level, 8640 per stazioni Davis), dà un’idea molto più completa dell’andamento termico e tiene conto di tutti i dati che il nostro sensore ha campionato. Se registrassimo solo massima e minima, terremmo in conto solamente 2 pacchetti dati su almeno 1800. Come è facile intuire, la temperatura media giornaliera si discosta anche significativamente dalla semplice stima quale media = (massima+minima)/2, che quindi è da ritenersi completamente inattendibile.
La temperatura media di un periodo (giorno, mese, stagione, anno) è inoltre un parametro importante e di una potenza sorprendente: con un singolo numero siamo in grado di confrontare dove, sul periodo in esame, ha effettivamente fatto più caldo che freddo.
Lo stesso discorso, chiaramente, si può fare con gli altri parametri quali umidità e vento.
Il caso della pioggia
Leggere e interpretare i valori di pioggia campionati dal nostro sensore è leggermente diverso da quanto abbiamo fin qui esposto. Chiaramente, non andiamo a vedere il dato medio di pioggia giornaliera, non avrebbe alcun senso. Il valore della pioggia è cumulato, e perciò per archiviare queste misure si potrebbe anche banalmente prendere ogni giorno l’accumulo e segnarlo. Dobbiamo sempre ricordarci che non abbiamo in mano il numero della verità, ma una misura affetta dall’incertezza riportata nel foglio delle istruzioni.
Si consiglia inoltre di affiancare sempre un pluviometro manuale a quello elettronico, in quanto quest’ultimo potrebbe talvolta stararsi ed effettuare misure errate.
Conclusioni
Con la lettura di questo articolo abbiamo capito che misurare i parametri meteorologici è un’operazione tutt’altro che banale, che richiede delle riflessioni e considerazioni profonde. Abbiamo dato per scontato che gli strumenti che effettuano le misure siano posizionati a norma, un altro problema che ha bisogno di un ampio discorso a parte.
Il primo fondamentale concetto che abbiamo visto è che a qualsiasi misura è sempre associata un’incertezza, per cui nella pratica i numeri che la nostra stazione meteo riporta non vanno mai visti come assoluti e detentori della verità, che sfortunatamente non potremo mai conoscere. Oltretutto, prendendo come esempio principale le rilevazioni di temperatura, si è visto che l’incertezza associata alle misure operate da stazioni entry level e semi-professionali Davis non è per niente piccola!
Successivamente, abbiamo capito come di base si archiviano i dati, evidenziando che registrare solamente gli estremi dei parametri (temperatura e umidità massime e minime, raffica massima, etc.) ogni giorno è un approccio del tutto fuorviante ed errato, che ha come conseguenza la perdita gratuita della tantissima informazione che i nostri sensori ci offrono. Un archivio scientificamente e climatologicamente valido deve contenere record con dati mediati ogni 5 minuti ed estremi assoluti. Solo così possiamo sperare di farci un’idea del clima della nostra zona e confrontare i dati che prendiamo con altri.
Questo approccio è stato quindi applicato all’invio dei dati on-line e ai report meteorologici che potremmo operare in sede di nowcasting (segnalazioni in tempo reale). Anche in questi casi bisogna assolutamente prediligere i dati medi, segnalando eventualmente anche gli estremi.
Abbiamo poi capito l’importanza della temperatura media per studiare il clima di una zona.
Si potrebbe pensare che questo articolo riporta concetti avanzati, di cui un appassionato medio non ha necessariamente bisogno. Sbagliato! Queste nozioni sono quelle fondamentali, che chiunque possegga uno strumento meteo dovrebbe sapere. I concetti avanzati sono ben altro.
Parliamone!
Se hai dei dubbi o vuoi approfondire l’argomento, non esitare a chiedere sul nostro forum!