I dati iperspettrali sono sempre più disponibili e quindi crescono anche le applicazioni che cominciano a farne uso [1-3]. Molte di queste applicazioni sono sicuramente promettenti, ma molti studi sono specifici solo ad alcune di esse e si focalizzano quindi su uno specifico problema. Un risultato del workshop organizzato da progetto HyRESSA [4] è il fatto che non esiste ancora consenso su quale sia la migliore catena di elaborazione per applicazioni di base per l’estrazione di mappe di copertura del suolo. A sua volta, questo rende difficile per gli utenti finali capire come utilizzare i dati iperspettrali. Gli algoritmi infatti in molti casi sono troppo difficili e poco chiari sono i loro vantaggi e i loro limiti. Per questo motivo la ricerca presentata in questo lavoro è dedicata alla definizione di una catena abbastanza generica per ottenere mappe di copertura vegetale utilizzando dati iperspettrali, sfruttando al massimo le informazioni disponibili ma rendendo il sistema il più semplice e il più facile possibile da utilizzare. Alla base della ricerca c’è la catena di elaborazione generica già presentata in [5], la quale, a partire da dati corretti geometricamente e radiometricamente, consiste di un primo passo di riduzione dei dati mediante calcolo e selezione delle loro caratteristiche più utili, un successivo passo di classificazione e, nel caso, uno di post-processing [6]. Durante la ricerca sono stati considerati molti diversi algoritmi per implementare ciascuno di questi passaggi, con l’idea di verificare se esista una metodologia migliore delle altre per applicazioni legate all’estrazione di mappe di copertura vegetale, oppure se si possa trovare un metodo per scegliere le procedure migliori in modo (semi)automatico. Per questo motivo, in questo studio si presenterà un metodo innovativo per l’utilizzo di sistemi tipo Decision Tree [7], che è stato trovato capace di ottenere risultati soddisfacenti in diversi casi e ha quindi mostrato di possedere una sufficiente flessibilità per adattarsi a diverse esigenze. In questo lavoro si presenterà inoltre una procedura di ottimizzazione di un classificatore multilivello [8] a partire da un numero limitato di classificazioni su un training set altrettanto limitato. L’obiettivo è di combinare le migliori metodologie definite per i passi di cui sopra in modo da trovare un sistema flessibile e capace di adattarsi al problema in maniera automatica. Lo scopo dello studio effettuato è stato quindi per prima cosa una prima selezione delle catene di elaborazione adatte all’estrazione di mappe di coperture vegetali. Per questo motivo (si veda la Fig. 1) sono state definite e confrontate diverse catene di analisi. Figura 1. Rappresentazione grafica della metodologia utilizzata per progettare le diverse catene di analisi dei dati iperspettrali. I cammini con le frecce più spesse corrispondono alle catene considerate più promettenti. (FS-TD=Feature Selection con Transformed Divergence; MNF=Minimum Noise Fraction; PCA=Principal Components Analysis; SAM=Spectral Angle Mapper; NN=Neural Net). L’insieme di dati utilizzato per questa ricerca è stato ottenuto dal sensore aviotrasportato DAIS 7915 del DLR e gentilmente fornito dall’Università di Varsavia. L’area di studio corrisponde ad una parte del Parco Nazionale dei monti Tatra in Polonia e definisce un ottimo caso di studio per l’estrazione di mappe di coperture vegetali in ecosistemi di alta montagna. Quest’area è stata identificata come un buon caso d’analisi a causa dell’alta complessità delle coperture vegetali, sia come caratteristiche spettrali che come pattern spaziali, e l’inacessibilità dell’area [9]. Inoltre, il paesaggio frammentato e i forti dislivelli limitano in quest’area l’utilizzo di altri tipi di dati telerilevati, come quelli multispettrali. Più precisamente, l’area interessata è quella della Valle Gasienicowa, che corrisponde a diverse unità geobotaniche tipiche dell’areas dei Carpazi Occidentali: una fascia montuosa superiore (1200 - 1550 m) - foreste di abete rosso, con un clima fresco; fascia subalpina (1550 - 1800 m) – pino nano, clima molto fresco; fascia alpina (1800 - 2250 m) – tundra alpina con predominanza di prati di alta montagna e clima moderatamente freddo; fascia subnivale (sopra 2250 m) – macchie di licheni e muschi, assieme ai prati, con un basso numero di specie, disperse in mezzo alle rocce. Secondo quanto indicato in Fig.1, sono state considerate diverse catene di elaborazione. Usando le metriche legate alla matrice di confusione, si è poi implementato uno schema innovativo che è in grado di ottimizzare un classificatore multilvell. In particolare, il metodo permette di valutare a priori quale sia la combinazione delle migliori caratteristiche utili per estrarre una particolare copertura vegetale e contemporaneamente quale sia il metodo migliore per estrarre questa copertura. I risultati ottenuti mostrano che alcune catene di elaborazione sorpassano costantemente le altre nella estrazione di coperture vegetali caratterizzate da caratteristiche spettrali simili e una elevata dispersione sul territorio. Nell’ambito di questo studio la migliore accuratezza complessiva è stata ottenuta utilizzando l’elaborazione MNF seguita da una classificazione mediante rete neurale fuzzy. Utilizzando poi un algoritmo di post-processing adeguato l’accuratezza può essere migliorata ancora, anche se in maniera limitata. Più specificatamente, i risultati di alcune delle catene valutate sono mostrate in Tabella I. Si può osservare che, come detto sopra, per quanto riguarda la riduzione della dimensione dei dati MNF sembra essere l’algoritmo migliore, mentre in generale le reti neurali risultano migliori degli altri algoritmi di classificazione. Tabella 1. Accuratezze complessive ottenute a valle di diverse catene di elaborazione. Dati in ingresso Riduzione delle dimensioni Classificazione Post processing Accuratezza MNF 15 band NN + 87,96% Original data FS TD ML + 87,92% Original data FS TD SAM - 57,77% Original data DAFE ML - 72,08% Classificazione multilivello 84,37% L’uso del classificatore multilivello ha permesso di ottenere risultati simili ai migliori della tabella (84.37%), ma con l’aggiunta, che nn si evince dall’accuratezza totale, che vengono classificate meglio classi che sono particolarmente difficili da distinguere utilizzando un classificatore singolo. Il risultato indica che la metdologia testata è potenzialmente utile per classificazione di coperture vegetali, problema che spesso risulta in errori di commistione tra specie vegetali dalle caratteristiche spettrali molto simili [10]. [1] V.L. Kamalesh, A. Luckman, W.M.F. Grey, and E.J. Milton, “Estimation of leaf area index from PROBA/CHRIS hyperspectral multi-angular data”, Proc. of the Remote Sensing and Photogramm. Soc. Conference 2008, Exeter, 15-17 September 2008. [2] E. Belluco, M. Camuffo, S. Ferrari, L. Modenese, S. Silvestri, A. Marani, M. Marani, “Mapping salt-marsh vegetation by multispectral and hyperspectral remote sensing”, Remote Sensing of Environment, Vol. 105, No. 1, pp. 54-67, Nov.2006. [3] J. Ham, Y. Chen, M.M. Crawford and J. Ghosh, Investigation of the Random Forest framework for classification of hyperspectral data, IEEE Transactions on Geoscience and Remote Sensing 43 (2005), pp. 492–501. [4] HYRESSA SWOT and User Needs workshop report, accessed on line at http://www.hyressa.net/documents/, April 2007 [5] P. Gamba, A. Plaza, J. Benediktsson, J. Chanussot,, “European perspectives in hyperspectral data analysis”, 2007 IEEE Geoscience and Remote Sensing Symposium, 23-28 July 2007pp. 4794-4797. [6] J. A. Richards X. Jia Remote sensing digital image analysis 3rd Edition, pp. 196 Springer, 2005. [7] C. R. P. Hartmann, P. K. Varshney, K. G. Mehrotra, and C. L. Gerberich, "Application of information theory to the construction of efficient decision trees," IEEE Trans. Inform. Theory, vol. IT-28, No.4, pp. 565-577, 1982. [8] A. V. Kulkarni and L. N. Kanal, "An optimization approach to hierarchical classifier design," Proc. 3rd Int. Joint Conf. on Pattern Recognition, San Diego, CA, 1976. [9] B. Zagajewski, A. Kozlowska, M. Krowczynska, M. Sobczak and M. Wrzesien, “Mapping High Mountain vegetation using hyperspectral data,” EARSeL eProceedings 4, 1/2005. [10] J. Franklin Predictive vegetation mapping: geographic modelling of biospatial patterns in relation to environmental gradients Janet Franklin. Progress in Physical Geography, Vol. 19, No. 4, 474-499 (1995) DOI: 10.1177/030913339501900403

UNA CATENA PER L’INTERPRETAZIONE DI DATI IPERSPETTRALI TELERILEVATI PER LA DEFINIZIONE DI MAPPE DI COPERTURE VEGETALI

DELL'ACQUA, FABIO;GAMBA, PAOLO ETTORE;BAKOS, KAROLY
2009-01-01

Abstract

I dati iperspettrali sono sempre più disponibili e quindi crescono anche le applicazioni che cominciano a farne uso [1-3]. Molte di queste applicazioni sono sicuramente promettenti, ma molti studi sono specifici solo ad alcune di esse e si focalizzano quindi su uno specifico problema. Un risultato del workshop organizzato da progetto HyRESSA [4] è il fatto che non esiste ancora consenso su quale sia la migliore catena di elaborazione per applicazioni di base per l’estrazione di mappe di copertura del suolo. A sua volta, questo rende difficile per gli utenti finali capire come utilizzare i dati iperspettrali. Gli algoritmi infatti in molti casi sono troppo difficili e poco chiari sono i loro vantaggi e i loro limiti. Per questo motivo la ricerca presentata in questo lavoro è dedicata alla definizione di una catena abbastanza generica per ottenere mappe di copertura vegetale utilizzando dati iperspettrali, sfruttando al massimo le informazioni disponibili ma rendendo il sistema il più semplice e il più facile possibile da utilizzare. Alla base della ricerca c’è la catena di elaborazione generica già presentata in [5], la quale, a partire da dati corretti geometricamente e radiometricamente, consiste di un primo passo di riduzione dei dati mediante calcolo e selezione delle loro caratteristiche più utili, un successivo passo di classificazione e, nel caso, uno di post-processing [6]. Durante la ricerca sono stati considerati molti diversi algoritmi per implementare ciascuno di questi passaggi, con l’idea di verificare se esista una metodologia migliore delle altre per applicazioni legate all’estrazione di mappe di copertura vegetale, oppure se si possa trovare un metodo per scegliere le procedure migliori in modo (semi)automatico. Per questo motivo, in questo studio si presenterà un metodo innovativo per l’utilizzo di sistemi tipo Decision Tree [7], che è stato trovato capace di ottenere risultati soddisfacenti in diversi casi e ha quindi mostrato di possedere una sufficiente flessibilità per adattarsi a diverse esigenze. In questo lavoro si presenterà inoltre una procedura di ottimizzazione di un classificatore multilivello [8] a partire da un numero limitato di classificazioni su un training set altrettanto limitato. L’obiettivo è di combinare le migliori metodologie definite per i passi di cui sopra in modo da trovare un sistema flessibile e capace di adattarsi al problema in maniera automatica. Lo scopo dello studio effettuato è stato quindi per prima cosa una prima selezione delle catene di elaborazione adatte all’estrazione di mappe di coperture vegetali. Per questo motivo (si veda la Fig. 1) sono state definite e confrontate diverse catene di analisi. Figura 1. Rappresentazione grafica della metodologia utilizzata per progettare le diverse catene di analisi dei dati iperspettrali. I cammini con le frecce più spesse corrispondono alle catene considerate più promettenti. (FS-TD=Feature Selection con Transformed Divergence; MNF=Minimum Noise Fraction; PCA=Principal Components Analysis; SAM=Spectral Angle Mapper; NN=Neural Net). L’insieme di dati utilizzato per questa ricerca è stato ottenuto dal sensore aviotrasportato DAIS 7915 del DLR e gentilmente fornito dall’Università di Varsavia. L’area di studio corrisponde ad una parte del Parco Nazionale dei monti Tatra in Polonia e definisce un ottimo caso di studio per l’estrazione di mappe di coperture vegetali in ecosistemi di alta montagna. Quest’area è stata identificata come un buon caso d’analisi a causa dell’alta complessità delle coperture vegetali, sia come caratteristiche spettrali che come pattern spaziali, e l’inacessibilità dell’area [9]. Inoltre, il paesaggio frammentato e i forti dislivelli limitano in quest’area l’utilizzo di altri tipi di dati telerilevati, come quelli multispettrali. Più precisamente, l’area interessata è quella della Valle Gasienicowa, che corrisponde a diverse unità geobotaniche tipiche dell’areas dei Carpazi Occidentali: una fascia montuosa superiore (1200 - 1550 m) - foreste di abete rosso, con un clima fresco; fascia subalpina (1550 - 1800 m) – pino nano, clima molto fresco; fascia alpina (1800 - 2250 m) – tundra alpina con predominanza di prati di alta montagna e clima moderatamente freddo; fascia subnivale (sopra 2250 m) – macchie di licheni e muschi, assieme ai prati, con un basso numero di specie, disperse in mezzo alle rocce. Secondo quanto indicato in Fig.1, sono state considerate diverse catene di elaborazione. Usando le metriche legate alla matrice di confusione, si è poi implementato uno schema innovativo che è in grado di ottimizzare un classificatore multilvell. In particolare, il metodo permette di valutare a priori quale sia la combinazione delle migliori caratteristiche utili per estrarre una particolare copertura vegetale e contemporaneamente quale sia il metodo migliore per estrarre questa copertura. I risultati ottenuti mostrano che alcune catene di elaborazione sorpassano costantemente le altre nella estrazione di coperture vegetali caratterizzate da caratteristiche spettrali simili e una elevata dispersione sul territorio. Nell’ambito di questo studio la migliore accuratezza complessiva è stata ottenuta utilizzando l’elaborazione MNF seguita da una classificazione mediante rete neurale fuzzy. Utilizzando poi un algoritmo di post-processing adeguato l’accuratezza può essere migliorata ancora, anche se in maniera limitata. Più specificatamente, i risultati di alcune delle catene valutate sono mostrate in Tabella I. Si può osservare che, come detto sopra, per quanto riguarda la riduzione della dimensione dei dati MNF sembra essere l’algoritmo migliore, mentre in generale le reti neurali risultano migliori degli altri algoritmi di classificazione. Tabella 1. Accuratezze complessive ottenute a valle di diverse catene di elaborazione. Dati in ingresso Riduzione delle dimensioni Classificazione Post processing Accuratezza MNF 15 band NN + 87,96% Original data FS TD ML + 87,92% Original data FS TD SAM - 57,77% Original data DAFE ML - 72,08% Classificazione multilivello 84,37% L’uso del classificatore multilivello ha permesso di ottenere risultati simili ai migliori della tabella (84.37%), ma con l’aggiunta, che nn si evince dall’accuratezza totale, che vengono classificate meglio classi che sono particolarmente difficili da distinguere utilizzando un classificatore singolo. Il risultato indica che la metdologia testata è potenzialmente utile per classificazione di coperture vegetali, problema che spesso risulta in errori di commistione tra specie vegetali dalle caratteristiche spettrali molto simili [10]. [1] V.L. Kamalesh, A. Luckman, W.M.F. Grey, and E.J. Milton, “Estimation of leaf area index from PROBA/CHRIS hyperspectral multi-angular data”, Proc. of the Remote Sensing and Photogramm. Soc. Conference 2008, Exeter, 15-17 September 2008. [2] E. Belluco, M. Camuffo, S. Ferrari, L. Modenese, S. Silvestri, A. Marani, M. Marani, “Mapping salt-marsh vegetation by multispectral and hyperspectral remote sensing”, Remote Sensing of Environment, Vol. 105, No. 1, pp. 54-67, Nov.2006. [3] J. Ham, Y. Chen, M.M. Crawford and J. Ghosh, Investigation of the Random Forest framework for classification of hyperspectral data, IEEE Transactions on Geoscience and Remote Sensing 43 (2005), pp. 492–501. [4] HYRESSA SWOT and User Needs workshop report, accessed on line at http://www.hyressa.net/documents/, April 2007 [5] P. Gamba, A. Plaza, J. Benediktsson, J. Chanussot,, “European perspectives in hyperspectral data analysis”, 2007 IEEE Geoscience and Remote Sensing Symposium, 23-28 July 2007pp. 4794-4797. [6] J. A. Richards X. Jia Remote sensing digital image analysis 3rd Edition, pp. 196 Springer, 2005. [7] C. R. P. Hartmann, P. K. Varshney, K. G. Mehrotra, and C. L. Gerberich, "Application of information theory to the construction of efficient decision trees," IEEE Trans. Inform. Theory, vol. IT-28, No.4, pp. 565-577, 1982. [8] A. V. Kulkarni and L. N. Kanal, "An optimization approach to hierarchical classifier design," Proc. 3rd Int. Joint Conf. on Pattern Recognition, San Diego, CA, 1976. [9] B. Zagajewski, A. Kozlowska, M. Krowczynska, M. Sobczak and M. Wrzesien, “Mapping High Mountain vegetation using hyperspectral data,” EARSeL eProceedings 4, 1/2005. [10] J. Franklin Predictive vegetation mapping: geographic modelling of biospatial patterns in relation to environmental gradients Janet Franklin. Progress in Physical Geography, Vol. 19, No. 4, 474-499 (1995) DOI: 10.1177/030913339501900403
File in questo prodotto:
Non ci sono file associati a questo prodotto.

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/11571/146324
Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact