Natura 2000 is the main instrument of European Union for the conservation of biodiversity, as well as the largest coordinated network of protected areas in the world. In this scenario, phytosociology is a fundamental tool available to Member States and the entire scientific community for constant periodic observation of the evolutionary dynamics of natural and semi-natural environments. The phytosociological maps of vegetation use plant communities, described by the topographical distribution and by the organization in phytocoenosis, as environmental indicators and ecological investigation tools. In the last forty years satellite remote sensing has acquired a fundamental role in the study of the evolutionary dynamics of vegetation and better understanding of habitat diversity. Starting from the availability of a multi-temporal datum, it is possible to construct historical series that allow to quantify the seasonal and inter-annual changes in phenology. These changes are useful in distinguishing different types of habitats, by a classification process aimed at producing maps. The spectral reflectance values are subject to impurities, often caused by adverse weather conditions and cloud cover, but also disturbances induced by the effect of the ground, shading or sensor malfunctions. Therefore, for the correct processing of the dataset, it is necessary to carry out a phase of data cleaning (identification and elimination of anomalous values) and smoothing (smoothing of the discrete data). This work aims to evaluate the effects on the classification of vegetation by supervised learning procedures that provide for different pre-processing methodologies of the time series. 2 ways of identifying anomalous values and 2 ways of applying the smoothing algorithm are tested. From these 4 blocks of time series are extracted to be used directly as prediction variables and, subsequently, to be subjected to Functional Principal Component Analysis (FPCA). FPCA is a statistical technique that allows the information related to the temporal variability of the curves to be summarized in a certain number of main components. The coefficients that quantify the value of each single component are called scores, these embody the chronological order of functional variations and can be used in subsequent analyzes allowing the comparison and interpretation of the results from different points of view for the same habitat. The scores extracted are used, in total and in a fraction of them, as second and third prediction variables for the classification. Finally, the original time series are reconstructed from the latter, to be classified as fourth and last variables of prediction. The images, acquired by the Sentinel-2 satellite platform, refer to a four-year period (2017 - 2020). The phenological variables used are seven vegetation indices: Normalized Difference Vegetation Index (NDVI), Modified Chlorophyll Absorption in Reflectance Index (MCARI), Green Normalized Difference Vegetation Index (GNDVI), Normalized Difference Red / Green Redness Index (RI), Normalized Difference Red-Edge (NDRE), Normalized DIfference Moisture Index (NDMI), Modified Normalized Difference Water Index (MNDWI). The proposed classification algorithm is Random Forest and the training data are provided by phytosociological surveys previously carried out in the study areas (Monte Conero and Gola di Frasassi).

Natura 2000 è il principale strumento della politica dell'Unione Europea per la conservazione della biodiversità, nonché la più grande rete coordinata di aree protette al mondo. In questo scenario, la fitosociologia si dimostra essere uno strumento fondamentale a disposizione degli Stati Membri e di tutta la comunità scientifica per un’osservazione periodica costante delle dinamiche evolutive degli ambienti naturali e semi-naturali. Le mappe fitosociologiche della vegetazione consentono di utilizzare le comunità vegetali, descritte dalla distribuzione topografica e dall’organizzazione in fitocenosi, come indicatori ambientali e strumenti di indagine ecologica. Negli ultimi quarant'anni il telerilevamento satellitare ha acquisito un ruolo fondamentale nello studio delle dinamiche evolutive della vegetazione in funzione di una migliore comprensione della diversità degli habitat. A partire dalla disponibilità di un dato multi-temporale è possibile costruire delle serie storiche che permettano di quantificare i cambiamenti stagionali e inter-annuali nella fenologia. Questi cambiamenti sono utili a distinguere differenti tipologie di habitat, per mezzo di un processo di classificazione finalizzato alla produzione di mappe. I valori di riflettanza spettrale sono soggetti ad impurità, spesso causate da condizioni atmosferiche avverse e copertura nuvolosa, ma anche disturbi indotti dall’effetto del suolo, dall’ombreggiamento o malfunzionamenti del sensore. Pertanto, ai fini del corretto processamento del dataset, è necessario operare una fase di data cleaning (individuazione ed eliminazione dei valori anomali) e smoothing (lisciamento del dato discreto). Questo lavoro si pone l’obbiettivo di valutare gli effetti sulla classificazione della vegetazione mediante procedimenti di apprendimento supervisionato che prevedono differenti metodologie di pre-processamento delle serie temporali. Vengono testate 2 modalità di individuazione dei valori anomali e 2 modalità di applicazione dell’algoritmo di smoothing. Da queste si estraggono 4 blocchi di serie temporali da utilizzare direttamente come variabili di predizione e, in un secondo momento, da assoggettare a Fuctional Principal Component Analysis (FPCA). La FPCA è una tecnica statistica che permette di riassumere l’informazione legata alla variabilità temporale delle curve in un certo numero di componenti principali. I coefficienti che quantificano il valore di ogni singola componente sono chiamati scores, questi incarnano l'ordine cronologico delle variazioni funzionali e possono essere utilizzati in analisi successive consentendo il confronto e l'interpretazione dei risultati da diversi punti di vista per lo stesso habitat. Gli scores estratti vengono utilizzati, nel totale e in una loro frazione, come seconde e terze variabili di predizione per la classificazione. Infine, da queste ultime si ricostruiscono le serie temporali originali, da classificare come quarte e ultime variabili di predizione. Le immagini, acquisite dalla piattaforma satellitare Sentinel-2, si riferiscono a un periodo di quattro anni (2017 – 2020). Le variabili fenologiche utilizzate sono sette indici di vegetazione: Normalized Difference Vegetation Index (NDVI), Modified Chlorophyll Absorption in Reflectance Index (MCARI), Green Normalized Difference Vegetation Index (GNDVI), Normalized Difference Red/Green Redness Index (RI), Normalized Difference Red-Edge (NDRE), Normalized DIfference Moisture Index (NDMI), Modified Normalized Difference Water Index (MNDWI). L’algoritmo di classificazione proposto è Random Forest e i dati per l’addestramento vengono forniti dai rilievi fitosociologici precedentemente effettuati nelle aree di studio (Monte Conero e Gola di Frasassi).

Preprocessamento delle serie temporali telerilevate per l'efficientamento della mappatura della vegetazione

CESARETTI, LORENZO
2020/2021

Abstract

Natura 2000 is the main instrument of European Union for the conservation of biodiversity, as well as the largest coordinated network of protected areas in the world. In this scenario, phytosociology is a fundamental tool available to Member States and the entire scientific community for constant periodic observation of the evolutionary dynamics of natural and semi-natural environments. The phytosociological maps of vegetation use plant communities, described by the topographical distribution and by the organization in phytocoenosis, as environmental indicators and ecological investigation tools. In the last forty years satellite remote sensing has acquired a fundamental role in the study of the evolutionary dynamics of vegetation and better understanding of habitat diversity. Starting from the availability of a multi-temporal datum, it is possible to construct historical series that allow to quantify the seasonal and inter-annual changes in phenology. These changes are useful in distinguishing different types of habitats, by a classification process aimed at producing maps. The spectral reflectance values are subject to impurities, often caused by adverse weather conditions and cloud cover, but also disturbances induced by the effect of the ground, shading or sensor malfunctions. Therefore, for the correct processing of the dataset, it is necessary to carry out a phase of data cleaning (identification and elimination of anomalous values) and smoothing (smoothing of the discrete data). This work aims to evaluate the effects on the classification of vegetation by supervised learning procedures that provide for different pre-processing methodologies of the time series. 2 ways of identifying anomalous values and 2 ways of applying the smoothing algorithm are tested. From these 4 blocks of time series are extracted to be used directly as prediction variables and, subsequently, to be subjected to Functional Principal Component Analysis (FPCA). FPCA is a statistical technique that allows the information related to the temporal variability of the curves to be summarized in a certain number of main components. The coefficients that quantify the value of each single component are called scores, these embody the chronological order of functional variations and can be used in subsequent analyzes allowing the comparison and interpretation of the results from different points of view for the same habitat. The scores extracted are used, in total and in a fraction of them, as second and third prediction variables for the classification. Finally, the original time series are reconstructed from the latter, to be classified as fourth and last variables of prediction. The images, acquired by the Sentinel-2 satellite platform, refer to a four-year period (2017 - 2020). The phenological variables used are seven vegetation indices: Normalized Difference Vegetation Index (NDVI), Modified Chlorophyll Absorption in Reflectance Index (MCARI), Green Normalized Difference Vegetation Index (GNDVI), Normalized Difference Red / Green Redness Index (RI), Normalized Difference Red-Edge (NDRE), Normalized DIfference Moisture Index (NDMI), Modified Normalized Difference Water Index (MNDWI). The proposed classification algorithm is Random Forest and the training data are provided by phytosociological surveys previously carried out in the study areas (Monte Conero and Gola di Frasassi).
2020
2021-12-17
Remotely sensed time series preprocessing for efficient vegetation mapping
Natura 2000 è il principale strumento della politica dell'Unione Europea per la conservazione della biodiversità, nonché la più grande rete coordinata di aree protette al mondo. In questo scenario, la fitosociologia si dimostra essere uno strumento fondamentale a disposizione degli Stati Membri e di tutta la comunità scientifica per un’osservazione periodica costante delle dinamiche evolutive degli ambienti naturali e semi-naturali. Le mappe fitosociologiche della vegetazione consentono di utilizzare le comunità vegetali, descritte dalla distribuzione topografica e dall’organizzazione in fitocenosi, come indicatori ambientali e strumenti di indagine ecologica. Negli ultimi quarant'anni il telerilevamento satellitare ha acquisito un ruolo fondamentale nello studio delle dinamiche evolutive della vegetazione in funzione di una migliore comprensione della diversità degli habitat. A partire dalla disponibilità di un dato multi-temporale è possibile costruire delle serie storiche che permettano di quantificare i cambiamenti stagionali e inter-annuali nella fenologia. Questi cambiamenti sono utili a distinguere differenti tipologie di habitat, per mezzo di un processo di classificazione finalizzato alla produzione di mappe. I valori di riflettanza spettrale sono soggetti ad impurità, spesso causate da condizioni atmosferiche avverse e copertura nuvolosa, ma anche disturbi indotti dall’effetto del suolo, dall’ombreggiamento o malfunzionamenti del sensore. Pertanto, ai fini del corretto processamento del dataset, è necessario operare una fase di data cleaning (individuazione ed eliminazione dei valori anomali) e smoothing (lisciamento del dato discreto). Questo lavoro si pone l’obbiettivo di valutare gli effetti sulla classificazione della vegetazione mediante procedimenti di apprendimento supervisionato che prevedono differenti metodologie di pre-processamento delle serie temporali. Vengono testate 2 modalità di individuazione dei valori anomali e 2 modalità di applicazione dell’algoritmo di smoothing. Da queste si estraggono 4 blocchi di serie temporali da utilizzare direttamente come variabili di predizione e, in un secondo momento, da assoggettare a Fuctional Principal Component Analysis (FPCA). La FPCA è una tecnica statistica che permette di riassumere l’informazione legata alla variabilità temporale delle curve in un certo numero di componenti principali. I coefficienti che quantificano il valore di ogni singola componente sono chiamati scores, questi incarnano l'ordine cronologico delle variazioni funzionali e possono essere utilizzati in analisi successive consentendo il confronto e l'interpretazione dei risultati da diversi punti di vista per lo stesso habitat. Gli scores estratti vengono utilizzati, nel totale e in una loro frazione, come seconde e terze variabili di predizione per la classificazione. Infine, da queste ultime si ricostruiscono le serie temporali originali, da classificare come quarte e ultime variabili di predizione. Le immagini, acquisite dalla piattaforma satellitare Sentinel-2, si riferiscono a un periodo di quattro anni (2017 – 2020). Le variabili fenologiche utilizzate sono sette indici di vegetazione: Normalized Difference Vegetation Index (NDVI), Modified Chlorophyll Absorption in Reflectance Index (MCARI), Green Normalized Difference Vegetation Index (GNDVI), Normalized Difference Red/Green Redness Index (RI), Normalized Difference Red-Edge (NDRE), Normalized DIfference Moisture Index (NDMI), Modified Normalized Difference Water Index (MNDWI). L’algoritmo di classificazione proposto è Random Forest e i dati per l’addestramento vengono forniti dai rilievi fitosociologici precedentemente effettuati nelle aree di studio (Monte Conero e Gola di Frasassi).
File in questo prodotto:
File Dimensione Formato  
Tesi_CesarettiLorenzo_magistrale.pdf

Open Access dal 18/12/2023

Descrizione: Tesi
Dimensione 15.97 MB
Formato Adobe PDF
15.97 MB Adobe PDF Visualizza/Apri

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.12075/7501