The thesis focuses on the introduction of a new methodological approach for clustering territorial data based on ISPRA (Institute for Environmental Protection and Research) data on land consumption in Italian provinces. The proposed technique uses a combination of penalized geometric mean, Canberra distance, and Ward's method to achieve a more effective and accurate clustering of observations. The clustering analysis based on ISPRA data on land consumption demonstrates that the use of penalized geometric mean allows for a more precise distinction of observation groups, offering an innovative perspective to evaluate relationships within the context of land consumption. In addition, an empirical analysis of clustering reveals a total of four groups, two of which differ significantly in land consumption, with provinces repeating within them over the years. Group A is characterized by excessive land consumption and includes provinces with high economic development, while Group B is located in mountainous areas with sustainable land consumption. The other two groups, C and D, exhibit respectively satisfactory and unsatisfactory consumption, with some provinces showing the risk of developing excessive land consumption. Furthermore, a linear regression analysis is conducted to compare the results obtained using the classical geometric mean and the penalized geometric mean. Various univariate and multivariate models are examined, including both the number of agricultural companies and the number of manufacturing companies as independent variables. The linear regression demonstrates that, compared to models using the Classical Mean variable, models utilizing the Penalized Mean variable have a better ability to explain data variation. The analysis results indicate a significant impact of the number of agricultural and industrial companies on land consumption. An increase in the number of agricultural companies is associated with a decrease in land consumption, while an increase in the number of industrial companies leads to an increase in land consumption.

La tesi si concentra sull'introduzione di un nuovo approccio metodologico per il clustering dei dati territoriali basato sui dati ISPRA (Istituto Superiore per la Protezione e la Ricerca Ambientale) sul consumo di suolo nelle province italiane. La tecnica proposta utilizza una combinazione della media geometrica penalizzata, la distanza di Canberra e il metodo di Ward al fine di ottenere una clusterizzazione più efficace e precisa delle osservazioni. L'analisi del clustering basata sui dati ISPRA sul consumo di suolo dimostra che l'utilizzo della media geometrica penalizzata consente di distinguere con maggiore precisione i gruppi di osservazioni, offrendo una prospettiva innovativa per valutare le relazioni nel contesto del consumo di suolo. Nell'analisi empirica del clustering, i risultati evidenziano un totale di quattro gruppi, due dei quali differiscono significativamente nel consumo di suolo, con province che si ripetono all'interno di essi nel corso degli anni. Il gruppo A è caratterizzato da un consumo di suolo eccessivo e comprende province popolate con un alto sviluppo economico, mentre il gruppo B è localizzato in zone montane con un consumo di suolo sostenibile. Gli altri due gruppi, C e D, presentano rispettivamente un consumo soddisfacente e insoddisfacente, con alcune province che mostrano il rischio di sviluppare un consumo di suolo eccessivo. Inoltre, viene condotta un'analisi di regressione lineare per confrontare i risultati ottenuti utilizzando la media geometrica classica e la media geometrica penalizzata. Vengono esaminati diversi modelli univariati e multivariati, includendo sia il numero delle aziende agricole che il numero delle aziende manifatturiere come variabili indipendenti. La regressione lineare dimostra che rispetto ai modelli con la variabile Media Classica, i modelli con la variabile Media Penalizzata presentano una migliore capacità di spiegare la variazione dei dati. I risultati dell'analisi indicano un significativo impatto del numero di aziende agricole e industriali sul consumo di suolo. Un aumento del numero di aziende agricole è associato a una diminuzione del consumo di suolo, mentre un aumento del numero di aziende industriali comporta un aumento del consumo di suolo.

Clustering con Media Geometrica Penalizzata: dati ISPRA sul consumo del suolo

ZINOVYEVA, ANASTASIA
2022/2023

Abstract

The thesis focuses on the introduction of a new methodological approach for clustering territorial data based on ISPRA (Institute for Environmental Protection and Research) data on land consumption in Italian provinces. The proposed technique uses a combination of penalized geometric mean, Canberra distance, and Ward's method to achieve a more effective and accurate clustering of observations. The clustering analysis based on ISPRA data on land consumption demonstrates that the use of penalized geometric mean allows for a more precise distinction of observation groups, offering an innovative perspective to evaluate relationships within the context of land consumption. In addition, an empirical analysis of clustering reveals a total of four groups, two of which differ significantly in land consumption, with provinces repeating within them over the years. Group A is characterized by excessive land consumption and includes provinces with high economic development, while Group B is located in mountainous areas with sustainable land consumption. The other two groups, C and D, exhibit respectively satisfactory and unsatisfactory consumption, with some provinces showing the risk of developing excessive land consumption. Furthermore, a linear regression analysis is conducted to compare the results obtained using the classical geometric mean and the penalized geometric mean. Various univariate and multivariate models are examined, including both the number of agricultural companies and the number of manufacturing companies as independent variables. The linear regression demonstrates that, compared to models using the Classical Mean variable, models utilizing the Penalized Mean variable have a better ability to explain data variation. The analysis results indicate a significant impact of the number of agricultural and industrial companies on land consumption. An increase in the number of agricultural companies is associated with a decrease in land consumption, while an increase in the number of industrial companies leads to an increase in land consumption.
2022
2023-07-14
Clustering via Penalized Geometric Mean: ISPRA land use data
La tesi si concentra sull'introduzione di un nuovo approccio metodologico per il clustering dei dati territoriali basato sui dati ISPRA (Istituto Superiore per la Protezione e la Ricerca Ambientale) sul consumo di suolo nelle province italiane. La tecnica proposta utilizza una combinazione della media geometrica penalizzata, la distanza di Canberra e il metodo di Ward al fine di ottenere una clusterizzazione più efficace e precisa delle osservazioni. L'analisi del clustering basata sui dati ISPRA sul consumo di suolo dimostra che l'utilizzo della media geometrica penalizzata consente di distinguere con maggiore precisione i gruppi di osservazioni, offrendo una prospettiva innovativa per valutare le relazioni nel contesto del consumo di suolo. Nell'analisi empirica del clustering, i risultati evidenziano un totale di quattro gruppi, due dei quali differiscono significativamente nel consumo di suolo, con province che si ripetono all'interno di essi nel corso degli anni. Il gruppo A è caratterizzato da un consumo di suolo eccessivo e comprende province popolate con un alto sviluppo economico, mentre il gruppo B è localizzato in zone montane con un consumo di suolo sostenibile. Gli altri due gruppi, C e D, presentano rispettivamente un consumo soddisfacente e insoddisfacente, con alcune province che mostrano il rischio di sviluppare un consumo di suolo eccessivo. Inoltre, viene condotta un'analisi di regressione lineare per confrontare i risultati ottenuti utilizzando la media geometrica classica e la media geometrica penalizzata. Vengono esaminati diversi modelli univariati e multivariati, includendo sia il numero delle aziende agricole che il numero delle aziende manifatturiere come variabili indipendenti. La regressione lineare dimostra che rispetto ai modelli con la variabile Media Classica, i modelli con la variabile Media Penalizzata presentano una migliore capacità di spiegare la variazione dei dati. I risultati dell'analisi indicano un significativo impatto del numero di aziende agricole e industriali sul consumo di suolo. Un aumento del numero di aziende agricole è associato a una diminuzione del consumo di suolo, mentre un aumento del numero di aziende industriali comporta un aumento del consumo di suolo.
File in questo prodotto:
File Dimensione Formato  
Tesi_Zinovyeva_Anastasia.pdf

accesso aperto

Descrizione: Tesi di laurea magistrale Anastasia Zinovyeva, titolo: Clustering con Media Geometrica penalizzata: dati ISPRA sul consumo del suolo
Dimensione 3.71 MB
Formato Adobe PDF
3.71 MB Adobe PDF Visualizza/Apri

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.12075/13660