Introduzione all’uso dei dati telerilevati nel sistema informativo del settore agricolo
Le tecniche di osservazione della terra, meglio conosciute come tecniche di telerilevamento, hanno rappresentato, fin dalle prime sperimentazioni, efficaci sistemi per alimentare le basi di dati territoriali ed ambientali. Il settore agricolo, ha costituto un terreno fertile per inglobare nel suo sistema informativo dati di natura satellitare, al punto da modificare il modo di concepire l’informazione in questo campo, tradizionalmente basata su valutazioni estimative o su dati derivanti da rilevazione diretta.
Le motivazioni che hanno spinto gli istituiti statistici responsabili delle statistiche agricole, verso l’adozione dei dati telerilevati, ricadono nella soluzione dei classici problemi che caratterizzano una qualsiasi indagine statistica: essi vanno dalla tempestività, correttezza e affidabilità dei dati all’economicità dell’indagine.
Al fine di raggiungere tali obiettivi, gli enti responsabili della produzione di statistiche agricole, hanno intrapreso cooperazioni con gli istituti responsabili della raccolta ed elaborazione dei dati satellitari (per esempio, Telespazio S.p.A. per quel che riguarda le indagini sulle superfici del suolo) che spesso sono entrati a far parte del team di progetto dell’indagine stessa.
In generale, l’uso dei dati satellitari nel settore agricolo non ha consentito di affrancarsi del tutto dalle rilevazioni dirette per i problemi connessi alle tecnologie di rilevazione satellitari, che non assicurano la completezza dei dati e tanto meno sono sufficienti per le stime di previsione delle rese, per le quali è indispensabile la rilevazione diretta.
In quasi tutte le applicazioni di telerilevamento, non solo è necessario eseguire misure al suolo con altre tecniche, per la validazione dei risultati delle immagini, per le correzioni atmosferiche, per le calibrazioni radiometriche dei dati o per la georeferenziazione delle immagini, ma in alcuni casi è necessario intervenire con opportuni strumenti statistici, quali i metodi d’imputazione (Rubin, 1987) per ottenere data set completi, in fase di stima; questo perché (come si analizzerà nel seguito), le immagini da satellite, sono generalmente impiegate come informazioni ausiliarie nelle stime modellistiche, che costituiscono il legame tra dati satellitari e rilevati al suolo.
Nel seguito saranno analizzati alcuni metodi, sperimentati nel campo delle statistiche agricole, in cui si utilizzano le informazioni satellitari, avendo cura di specificare in quale fase di analisi è auspicabile tale utilizzo. Particolare attenzione sarà rivolta all’indagine sulle stime di superficie del suolo e delle rese delle principali colture (di cui si occupa il progetto Agrit, del Mipaaf in Italia) che rappresenta il campo di applicazione delle immagini satellitari più innovativo tra tutte quelle esistenti attualmente, nel settore agricolo.
L’Agrit è una rilevazione campionaria, la cui caratteristica fondamentale, è rappresentata dalla modalità di rilevazione che si basa su tecniche di campionamento spaziale, in cui le stime sono effettuate su unità fisiche (porzioni di territorio: punti o, in passato, poligoni), piuttosto che su unità economico-gestionali (aziende agricole).
La possibilità di sfruttare i dati telerilevati, ripresi da aereo o da satellite artificiale è offerta in modo del tutto innovativo proprio in quest’indagine, giacché le strategie miranti al miglioramento delle stime a costi vantaggiosi, hanno spinto verso l’integrazione tra dati campionari rilevati al suolo, in accordo allo specifico piano campionario adottato, e dati acquisiti mediante telerilevamento. Prima di analizzare lo specifico uso dei dati telerilevati nelle indagini sulle stime di superficie del suolo e delle rese, vale la pena di citare un tradizionale campo di applicazione delle immagini da satellite, in cui si sono compiuti consistenti miglioramenti al fine di garantire come risultato carte di uso del suolo ottimali (Benedetti R. et al., 1994), per la conoscenza delle caratteristiche territoriali. È inevitabile il riferimento all'esperienza del progetto Corine Land Cover, che ha rappresentato un grande sforzo a livello comunitario per la costruzione di un database della copertura del suolo, omogeneo per l'area europea.
Vantaggi e svantaggi sull’uso dei dati telerilevati
Le statistiche realizzate con il supporto del telerilevamento satellitare consentono di superare i principali ostacoli derivanti dalle peculiarità del paesaggio agricolo e dalle caratteristiche strutturali delle aziende agricole del nostro Paese, che in generale, rendono poco efficaci le strategie che basano l'indagine statistica su campioni estratti da lista di aziende.
Se si considera che spesso questi archivi sono incompleti e soggetti ad una rapida obsolescenza e che la diffidenza degli imprenditori agricoli a fornire dati sulla propria azienda rende pressoché impossibile realizzare statistiche coerenti con le esigenze di un Paese moderno, le indagini attuate con il supporto del telerilevamento satellitare consentono invece di superare tutti questi ostacoli, perché si evita il contatto con l’agricoltore e, quello che più conta, risulta fortemente ridotta la numerosità dei punti da visitare al suolo, per effetto dell’utilizzo del telerilevamento; a ciò si aggiunge che questa metodologia consente di realizzare un controllo di qualità dei dati raccolti, altrimenti inattuabile se s’intervistasse l'agricoltore, per la concreta impossibilità di verificare i dati forniti.
L’aspetto metodologico che caratterizza l’indagine territoriale, secondo le specifiche Agrit, comprende la definizione di una frame di tipo puntuale, un campionamento stratificato a due fasi per la selezione delle unità campionarie, il ricorso al campionamento ottimo multivariato per determinare l’ampiezza campionaria minima all’interno dei singoli domini di stima, l’uso di stimatori di Horvitz-Thompson (Cochran W.G., 1977) per le stime di superficie, rilevazioni in campo per stimare le rese (anche se è offerto l’ausilio di dati da satellite per le stime di resa, si veda ad esempio Benedetti R., Rossini P., 1993).
Seppure articolata e complessa, questa metodologia di indagine non assicura l’efficienza delle stime, il cui raggiungimento, perseguibile attraverso l’aumento della numerosità campionaria, si scontra con problemi di costi e tempi di rilevazione.
La necessità di ottenere risultati efficienti, puntuali e validi, ha costretto a trovare soluzioni che, agendo in modo complementare e non alternativo alle strategie campionarie finora citate, convergono verso questi obiettivi. Nel corso del tempo, i perfezionamenti apportati al campionamento areale in agricoltura hanno prodotto come risultato l’incremento d’efficienza del disegno campionario e riduzioni dei tempi e dei costi dell’indagine.
I dati telerilevati contengono un’enorme quantità d’informazioni che riguardano il suolo (da cui si possono anche desumere la copertura superficiale, l’altimetria e l’idrografia), prestandosi sia ad analisi di tipo statico, in quanto è possibile desumere la tipologia di coltura presente al momento dell’interpretazione, sia ad analisi dinamiche, in quanto dal confronto multitemporale delle immagini riprese si possono estrarre successive informazioni sulle variazioni nel tempo come l'avvicendamento delle colture agrarie. Essendo adottate come informazione ausiliaria nelle indagini congiunturali dell’agricoltura, le immagini satellitari possono prevedere un duplice impiego: uno ex ante la rilevazione dei dati e uno ex post, in fase di stima.
L’uso ex ante dell’informazione ausiliaria satellitare
Appartiene a questa tipologia d’impiego, la stratificazione, uno dei metodi più utilizzati per migliorare la precisione di una stima; in particolare le immagini remote rispondono a questa esigenza con costi piuttosto bassi.
Stratificare una superficie agricola, consente sia di dedurre dall’interpretazione delle immagini remote (fotointerpretazione) la percentuale di una data coltura presente al suolo in un dato momento, sia di suddividere il territorio di analisi in aree omogenee, dalle quali estrarre i punti campionari. Questo modo di compiere la selezione all’interno di strati omogenei, consente di ridurre il numero di unità da investigare e di aumentare l’efficienza delle stime, in quanto risultano minimizzate le varianze all’interno degli strati.
La tecnica di stratificazione si presenta nell’indagine Agrit nello specifico disegno campionario, definito “stratificato a due fasi” in cui dalle immagini da satellite sono dedotte le variabili di stratificazione. Inoltre, il campione di prima fase, è ottenuto attraverso una selezione di tipo sistematico spaziale. Trattandosi di stime concernenti l’uso del suolo, l’individuazione delle aree specifiche per il problema in esame avviene attraverso un processo preliminare di fotointerpretazione che consiste nella circoscrizione del territorio d’analisi, dal quale sarà estratto il campione di prima fase, con il supporto di foto aeree (ortofoto) disponibili per tutto il territorio italiano (Figura 1).
Figura 1 - Materiale di fotointerpretazione, tassello quadrato di 200*200 m. centrato sul punto da interpretare ritagliato dalle ortofoto digitali AIMA1:10000
Fonte: Consorzio ITA, 2001
La frame di riferimento per la produzione di stime di superficie è una griglia regolare di punti con passo 500 metri, che copre tutta la superficie d’interesse.
La fotointerpretazione, riguarda ogni punto del reticolo, e avviene sovrapponendolo (previa georeferenziazione) all’immagine satellitare e adottando come criterio d’inclusione al campione quello di appartenere ad un particolare territorio agricolo, di cui si vuole stimare la superficie. In altri termini, con questa tecnica, si vogliono escludere dal campione i punti con usi del suolo che non appartengono al dominio inventariale, al fine di riservare per le rilevazioni solo i punti che sicuramente o presumibilmente presentano colture d’interesse (seminativi, colture protette, colture legnose agrarie, piantagioni a gestione intensiva). Tuttavia la discriminazione dei punti di prima fase, non può riguardare tutte le colture, in quanto in base ad immagini da satellite primaverili, appaiono punti privi di vegetazione (seminativi non ancora o da poco seminati, coltivazioni legnose agrarie prive di colture in atto). Il problema viene risolto attraverso l’esclusione di questi punti dalla prima fase di rilevazione, orientata alla stima delle colture a semina autunno-vernina; essi verranno rilevati nel corso della seconda fase di rilevazione, orientata alle colture a semina primaverile-estiva. Accanto alla stratificazione per codici di variabili ausiliarie, un valido utilizzo delle immagini telerilevate in sede di selezione delle unità campionarie dall’archivio di riferimento, in grado di garantire un’efficienza delle stime maggiore rispetto agli approcci più tradizionali, riguarda il campionamento con probabilità proporzionali ad una variabile (pps) (Cicchitelli G., Herzel A., Montanari G.E., 1997).
Un campionamento pps è efficiente, solo se le informazioni dimensionali, in base alle quali determinare le probabilità d’inclusione, sono accurate. Di solito questi dati sono desunti dagli archivi per l’estrazione delle unità campionarie; le indagini areali tuttavia, la cui natura è quella di non possedere una lista e dunque un archivio contenete dati ausiliari, escluderebbe la possibilità di adottare un campionamento pps. Tuttavia, il ricorso alla costruzione di un reticolo regolare che ricopre l’area oggetto di analisi, consente di calcolare, un indice di intensità della coltura, sulla base delle informazioni desunte da dati telerilevati. Le celle sono così estratte con probabilità proporzionale all’indice adottato (Carfagna E., 1999, per altri metodi di campionamento di unità areali si veda ad esempio Benedetti R., Palma D., 1995).
L’uso ex post dell’informazione ausiliaria satellitare
A differenza dei metodi che impiegano l’informazione ausiliaria per estrarre le unità dall’archivio di riferimento, si realizza l’uso a posteriori, quando le variabili ausiliarie entrano in gioco in fase di stima.
In generale, nelle indagini di tipo areale, lo scopo è raggiunto attraverso l’uso combinato di dati rilevati al suolo e dati provenienti dal telerilevamento che consentano di ottenere precisi inventari delle principali colture d’interesse. L’integrazione delle due fonti avveniva, in passato, attraverso lo stimatore di regressione (Cochran W.G., 1977) e produceva un notevole miglioramento nelle stime delle superfici agricole.
Ad oggi, la necessità di ottenere stime a livello provinciale ha permesso di inquadrare il problema, nell’ambito di un particolare tipo d’analisi noto come Small Area Estimation, a cui si ricorre, quando le stime, che sono prodotte attraverso un’indagine campionaria, si riferiscono a sottoinsiemi d’unità della popolazione, noti come “domini” di studio.
In particolare le Small Area, sono definite come “sottopopolazioni per le quali, non possono essere ottenute stime accurate attraverso le sole informazioni derivanti dalle indagini campionarie correnti”; risultando pertanto necessari specifici metodi di stima (Rao J.N.K, 2003). Rao (2003), che ha approfondito la letteratura in materia, considera come piccole aree sia le circoscrizioni geografiche, per esempio Comuni, Province, divisioni di Censimento, identificabili da precostituiti confini amministrativi, sia unità raggruppate sulla base di specifici criteri di omogeneità rispetto ad una variabile qualitativa e/o quantitativa (età, sesso, razza) individuabili nell’ambito di un’ampia estensione territoriale.
Dal momento che per il settore agricolo è importante disporre di informazioni statistiche relative a particolari partizioni territoriali, come provincie e/o comuni o addirittura a partizioni geografiche sub-comunali, la stima per piccole aree risulta particolarmente pertinente, perché da essa è possibile applicare metodi di stima alternativi ai tradizionali metodi basati sulla teoria dei campioni classica, le cosiddette small area statistic, appunto. In generale, la caratteristica distintiva di tali metodi, consiste nella possibilità di sfruttare le informazioni relative ad aree simili a quelle di studio, attraverso dei modelli che instaurano una relazione tra i differenti domini, mediante informazioni ausiliarie, desunte, per esempio, da indagini censuarie precedenti, da documenti amministrativi, da immagini satellitari.
Si ritiene necessario utilizzare stime modellistiche di questo genere per correggere i problemi di stima derivanti da un’esigua numerosità campionaria conseguente da combinazioni di province e strati. In particolare per le stime a livello provinciale in cui, per alcune culture, non tutte le province hanno una numerosità sufficiente a garantire stime affidabili.
La necessità di conoscere la rilevanza del fenomeno su scala provinciale con un’accuratezza maggiore rispetto a quella di cui godono le statistiche congiunturali, determina la possibilità di inserire in un particolare modello di stima tutte le informazioni ausiliarie a disposizione, derivanti da dati acquisiti da piattaforme satellitari, allo scopo di ottenere stime più dettagliate e di migliore qualità.
Per la soluzione del problema conoscitivo in questione si è deciso di ricorrere, tra le varie metodologie proposte nella letteratura specialistica, ad una classe di metodi di stima per piccoli domini nota come classe dei “predittori empirici ottimi lineari e corretti” (Eblup nella dizione anglosassone). In estrema sintesi tale tecnica di stima si sostanzia nell’uso di una combinazione lineare di una componente di stima diretta (lo stimatore diretto) con una componente modellistica (lo stimatore di regressione, formulata quest’ultima a partire da variabili ausiliarie, come quelle derivanti da immagini ad alta risoluzione), con pesi delle due componenti proporzionali alla precisione dei due diversi metodi di stima.
I benefici derivanti dall’uso delle informazioni delle varie piattaforme satellitari derivano dalla maggiore efficienza delle stime che si ottiene dalla coniugazione della stima campionaria e modellistica, in un unico stimatore (Figura 2).
Figura 2 - Confronto tra varianza dello stimatore di Horvitz-Thompson e MSE dello stimatore EBLUP, nelle stime delle principali colture, relative a dati AGRIT 2005
Fonte AGRIT 2005
L’Eblup realizza un compromesso tra l’errore campionario e quello modellistico: assegna infatti un perso maggiore alla stima campionaria, quando la sua varianza è bassa, in caso contrario spinge verso la stima modellistica.
Conclusioni
Il lancio del primo satellite LANDSAT, nel 1972 ha dato vita a tutta una serie di sperimentazione per l’acquisizione di informazioni sull’utilizzo del suolo, fino a che nel 1987 il Consorzio ITA, a seguito di un progetto commissionato dall’allora Ministero dell’Agricoltura e Foreste ha utilizzato il telerilevamento per stimare le superfici e le produzioni delle principali colture d’interesse (frumento duro, frumento tenero, orzo, colza, mais, girasole, pomodoro, barbabietola, tabacco).
Nel corso del tempo gli Istituti Statistici, hanno maturato la consapevolezza che il miglioramento della qualità dei dati, poteva essere ottenuto grazie all’integrazione di più fonti. L’ISTAT in varie occasioni, come per il quarto Censimento Generale dell’Agricoltura o per la soluzione del dibattito aperto circa la territorializzazione dei dati censuari (emerso nella fase di progettazione del Censimento) ha visto nel telerilevamento un mezzo per la soluzione di molte problematiche. Si ricorda che l’ISTAT ha prodotto una carta di copertura del suolo italiano, a livello comunale in cui l’uso del telerilevamento ha costituito un valido ausilio.
Nonostante questi richiami, sottolineino come i dati da satellite trovano numerose applicazioni, anche in contesti differenti dall’indagine areale, l’attenzione che è stata posta all’Agrit, non è priva di fondamento, dal momento che il telerilevamento trova in essa una collocazione che attraversa tutte le fasi critiche dell’indagine (estrazione del campione e fase di stima) e produce notevoli vantaggi.
Alla maggiore efficienza delle stime, prodotta dai modelli che impiegano immagini ausiliarie satellitari e dati direttamente rilevati al suolo, si aggiungono ulteriori benefici, come la riduzione del numero dei punti da visitare sul terreno, che direttamente produce la diminuzione dei costi dell’indagine, e la velocizzazione della fase dei rilievi in campo.
Riferimenti bibliografici
- Benedetti R., Rossini P., (1993), “On the use of NDVI profiles as a tool for agricultural statistics: the case study of wheat yield estimate and forecast in Emilia Romagna.”, Remote Sensing of Environment, 45, 3, 311-326.
- Benedetti R., Rossini P., Taddei R., (1994), “Vegetation classification in the Middle Mediterranean area by satellite data” International Journal of Remote Sensing, 15, 3, 583-596.
- Benedetti R., Palma D., (1995), “Optimal sampling designs for dependent spatial units” (in collaborazione con D. Palma), Environmetrics, 6, 101-114.
- Carfagna E., (1999), “The use of area frames and remote sensing for agricultural statistics”, Meeting on Food and Agricultural Statistics in Europe, Genova.
- Cochran W.G. (1977), Sampling Tecniques, Wiley, New York.
- Cicchitelli G., Herzel A., Montanari G.E. (1997), Il campionamento statistico, Il Mulino, Bologna.
- Rao, J.N.K., (2003), Small Area Estimation. Wiley, London.
- Rubin D.B., (1987), “Multiple Imputation for Nonresponse in Survey”, Wiley, New York.