Diabetes mellitus is one of the most common chronic diseases worldwide, whose effective management relies on accurate glycemic control. Continuous glucose monitoring systems have revolutionized diabetes management but have limitations due to the presence of compression artifacts (PISAs) that can compromise data reliability and lead to incorrect therapeutic decisions, including inappropriate insulin interventions that can trigger real hypoglycemia. This thesis work addresses the development of an algorithm for the real-time detection of such measurement errors in sensors. The approach was based on the use of Isolation Forest, a machine learning algorithm known for its effectiveness in identifying outliers. The method involved the extraction and analysis of nine features, coming from both the time and frequency domains. The developed algorithm has shown promising capabilities in the detection of PISAs. The evaluation metrics showed an accuracy of 98.72%, a specificity of 99.21%, a sensitivity (recall) of 62.89%, a precision of 51.70% and an F1-score of 56.74%. Although the accuracy and specificity values ​​are high, the results indicate room for improvement in precision and sensitivity, suggesting the possibility of false positives or missed detections of PISA events. These results appear to be promising, suggesting the usefulness of the selected features. Future studies could improve the performance of the algorithm, for example, by increasing the number of extracted features, using other machine learning techniques or through a data labeling operation performed by multiple experts for greater accuracy and reliability.

Il diabete mellito è una delle più comuni malattie croniche in tutto il mondo, la cui gestione efficace si basa su un accurato controllo glicemico. I sistemi di monitoraggio continuo della glicemia hanno rivoluzionato la gestione del diabete ma presentano limitazioni dovute alla presenza di artefatti da compressione (PISAs) che possono compromettere l'affidabilità dei dati e portare a decisioni terapeutiche errate, inclusi interventi insulinici inappropriati che possono scatenare ipoglicemie reali. In questo lavoro di tesi si affronta lo sviluppo di un algoritmo per il rilevamento in tempo reale di tali errori di misurazione nei sensori. L'approccio si è basato sull'utilizzo di Isolation Forest, un algoritmo di machine learning noto per la sua efficacia nell'identificazione degli outlier. Il metodo ha previsto l'estrazione e l'analisi di nove feature, provenienti sia dal dominio del tempo sia da quello della frequenza. L'algoritmo sviluppato ha dimostrato capacità promettenti nel rilevamento dei PISAs. Le metriche di valutazione hanno mostrato un'accuratezza del 98,72%, una specificità del 99,21%, una sensibilità (recall) del 62,89%, una precisione del 51,70% e un F1-score del 56,74%. Sebbene i valori di accuratezza e specificità siano elevati, i risultati indicano margini di miglioramento nella precisione e nella sensibilità, suggerendo la possibilità di falsi positivi o rilevazioni mancate di eventi PISA. Questi risultati sembrano essere promettenti, suggerendo l’utilità delle feature selezionate. Studi futuri potrebbero migliorare le prestazioni dell’algoritmo, ad esempio, attraverso l’incremento del numero di feature estratte, l’utilizzo di altre tecniche di machine learning oppure tramite un’operazione di labelling dei dati svolta da più esperti per una maggiore precisione ed affidabilità.

RILEVAMENTO DI ARTEFATTI DA COMPRESSIONE NEI SEGNALI DI MONITORAGGIO CONTINUO DEL GLUCOSIO VERSO LA COSTRUZIONE DI MODELLI ROBUSTI DI IDENTIFICAZIONE DELL’IPOGLICEMIA

PELAGALLI, DENNIS
2024/2025

Abstract

Diabetes mellitus is one of the most common chronic diseases worldwide, whose effective management relies on accurate glycemic control. Continuous glucose monitoring systems have revolutionized diabetes management but have limitations due to the presence of compression artifacts (PISAs) that can compromise data reliability and lead to incorrect therapeutic decisions, including inappropriate insulin interventions that can trigger real hypoglycemia. This thesis work addresses the development of an algorithm for the real-time detection of such measurement errors in sensors. The approach was based on the use of Isolation Forest, a machine learning algorithm known for its effectiveness in identifying outliers. The method involved the extraction and analysis of nine features, coming from both the time and frequency domains. The developed algorithm has shown promising capabilities in the detection of PISAs. The evaluation metrics showed an accuracy of 98.72%, a specificity of 99.21%, a sensitivity (recall) of 62.89%, a precision of 51.70% and an F1-score of 56.74%. Although the accuracy and specificity values ​​are high, the results indicate room for improvement in precision and sensitivity, suggesting the possibility of false positives or missed detections of PISA events. These results appear to be promising, suggesting the usefulness of the selected features. Future studies could improve the performance of the algorithm, for example, by increasing the number of extracted features, using other machine learning techniques or through a data labeling operation performed by multiple experts for greater accuracy and reliability.
2024
2025-07-17
DETECTION OF COMPRESSION ARTIFACTS IN CONTINUOUS GLUCOSE MONITORING SIGNALS TOWARDS BUILDING ROBUST HYPOGLYCEMIA IDENTIFICATION MODELS
Il diabete mellito è una delle più comuni malattie croniche in tutto il mondo, la cui gestione efficace si basa su un accurato controllo glicemico. I sistemi di monitoraggio continuo della glicemia hanno rivoluzionato la gestione del diabete ma presentano limitazioni dovute alla presenza di artefatti da compressione (PISAs) che possono compromettere l'affidabilità dei dati e portare a decisioni terapeutiche errate, inclusi interventi insulinici inappropriati che possono scatenare ipoglicemie reali. In questo lavoro di tesi si affronta lo sviluppo di un algoritmo per il rilevamento in tempo reale di tali errori di misurazione nei sensori. L'approccio si è basato sull'utilizzo di Isolation Forest, un algoritmo di machine learning noto per la sua efficacia nell'identificazione degli outlier. Il metodo ha previsto l'estrazione e l'analisi di nove feature, provenienti sia dal dominio del tempo sia da quello della frequenza. L'algoritmo sviluppato ha dimostrato capacità promettenti nel rilevamento dei PISAs. Le metriche di valutazione hanno mostrato un'accuratezza del 98,72%, una specificità del 99,21%, una sensibilità (recall) del 62,89%, una precisione del 51,70% e un F1-score del 56,74%. Sebbene i valori di accuratezza e specificità siano elevati, i risultati indicano margini di miglioramento nella precisione e nella sensibilità, suggerendo la possibilità di falsi positivi o rilevazioni mancate di eventi PISA. Questi risultati sembrano essere promettenti, suggerendo l’utilità delle feature selezionate. Studi futuri potrebbero migliorare le prestazioni dell’algoritmo, ad esempio, attraverso l’incremento del numero di feature estratte, l’utilizzo di altre tecniche di machine learning oppure tramite un’operazione di labelling dei dati svolta da più esperti per una maggiore precisione ed affidabilità.
File in questo prodotto:
File Dimensione Formato  
Tesi Dennis Pelagalli.pdf

embargo fino al 16/07/2028

Dimensione 1.71 MB
Formato Adobe PDF
1.71 MB Adobe PDF

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.12075/22105