Constant and persistent physical activity over time is recognized as a treatment for better glycemic control in patients with type 1 diabetes (T1D). Despite this, the current therapeutic approach does not yet have effective tools to mitigate hypoglycemia caused by physical exercise. In this context, decision support for the management of T1D is provided by approaches based on machine learning which, applied to data from continuous glucose monitoring (CGM), offers favorable horizons in the pre-exercise prediction of possible dangerous conditions, such as hypoglycemia. The aim of this thesis is to obtain a specific configuration of CGM metrics evaluated before the training session with which to implement a composite metric that allows, through a single parameter, to predict the onset of hypoglycemic episodes in adolescents diagnosed with DT1 following physical exercise. For this purpose, 47 CGM acquisitions were used labeled as HYPO, if belonging to subjects who had experienced hypoglycemia or as NO-HYPO, if belonging to subjects who did not experience episodes of hypoglycemia following the activity. The physical parameters of each subject and the extracted features were used as input to a classification algorithm for a selection of the metrics that best optimized the results for the problem of interest. The selected metrics were then further evaluated with respect to the classification problem by providing them as input for other classification models: Logistic Regression, Knn, SVM, Adaboost, Naive Bayes, Tree, Random Forest, Gradient Boosting. All classification models used were validated through the Leave-One-Subject-Out cross-validation procedure. The identified set of metrics was subsequently used to implement the final metric, the formulation of which was obtained using a linear logistic regression model. The model performance results in terms of accuracy, sensitivity, specificity and area under the curve (AUC) were: 72.34%, 76.47%, 53.85%, 65.16%, respectively. To evaluate the performance of the metric in discriminating subjects at risk of hypoglycemia, the confusion matrix was used whose results were: 26 true positives (TP), 6 false positives (FP), 7 false negatives (FN) and 8 true negatives (TN). The composite metric implementation procedure was also used with the configuration of metrics identified in a previous study. The model performance results in terms of accuracy, sensitivity, specificity and area under the curve (AUC) were: 74.47%, 94.12%, 23.08%, 58.60%, respectively. The confusion matrix identifies: 32 true positives (TP), 10 false positives (FP), 3 false negatives (FN) and 2 true negatives (TN). In conclusion, the implemented metric provides useful information to prevent hypoglycemia during physical activity in patients with T1D. This model offers practical guidance for taking precautions before physical activity, reducing the risk of hypoglycemia and improving overall management of T1D.

L'attività fisica costante e persistente nel tempo è riconosciuta come trattamento per un miglior controllo glicemico nei pazienti affetti da diabete di tipo 1 (DT1). Malgrado ciò, l'approccio terapeutico attuale non dispone ancora di strumenti efficaci per mitigare l'ipoglicemia causata dall'esercizio fisico. In questo contesto, un supporto decisionale per la gestione del DT1 è fornito da approcci basati sull’apprendimento automatico che, applicato ai dati provenienti dal monitoraggio continuo del glucosio (CGM), offre orizzonti favorevoli nella predizione pre-esercizio di possibili condizioni pericolose, come l'ipoglicemia. Lo scopo di questa tesi è quello di ottenere una specifica configurazione di metriche CGM valutate prima della sessione di allenamento con la quale implementare una metrica composita che consenta, attraverso un unico parametro, di predire l’insorgenza di episodi di ipoglicemia negli adolescenti con diagnosi di DT1 a seguito di esercizio fisico. A tale scopo, sono state utilizzate 47 acquisizioni CGM etichettate come HYPO, se appartenenti a soggetti che avevano manifestato ipoglicemia o come NO-HYPO, se appartenenti a soggetti che non hanno manifestato episodi di ipoglicemia a seguito dell’attività. I parametri fisici di ciascun soggetto e le caratteristiche estratte sono state utilizzate come input a un algoritmo di classificazione per una selezione delle metriche che meglio ottimizzavano i risultati per il problema di interesse. Le metriche selezionate sono poi state valutate ulteriormente rispetto al problema di classificazione fornendole come input per altri modelli di classificazione: Logistic Regression, Knn, SVM, Adaboost, Naive Bayes, Tree, Random Forest, Gradient Boosting. Tutti i modelli di classificazione utilizzati sono stati validati attraverso la procedura di cross-validazione Leave-One-Subject-Out. Il set di metriche individuato è stato successivamente utilizzato per implementare la metrica finale, la cui formulazione è stata ottenuta impiegando un modello di regressione logistica lineare. I risultati delle prestazioni del modello in termini di accuratezza, sensibilità, specificità e area sotto la curva (AUC) sono stati rispettivamente: 72,34%, 76,47%, 53,85%, 65,16%. Per valutare le prestazioni della metrica nel discriminare i soggetti a rischio di ipoglicemia è stata utilizzata la matrice di confusione i cui risultati sono: 26 veri positivi (TP), 6 falsi positivi (FP), 7 falsi negativi (FN) e 8 veri negativi (TN). La procedura di implementazione della metrica composita è stata utilizzata anche con la configurazione di metriche individuate in uno studio precedente. I risultati delle prestazioni del modello in termini di accuratezza, sensibilità, specificità e area sotto la curva (AUC) sono stati rispettivamente: 74,47%, 94,12%, 23,08%, 58,60%. La matrice di confusione individua: 32 veri positivi (TP), 10 falsi positivi (FP),3 falsi negativi (FN) e 2 veri negativi (TN). In conclusione, la metrica implementata fornisce informazioni utili per prevenire l’ipoglicemia durante l’attività fisica nei pazienti con DT1. Questo modello offre una guida pratica per adottare precauzioni prima dell'attività fisica, riducendo il rischio di ipoglicemia e migliorando la gestione complessiva del DT1.

Sviluppo di una metrica composita da dati di monitoraggio continuo di glucosio per la predizione di ipoglicemie da esercizio fisico in soggetti con diabete di tipo 1: un approccio di machine learning.

MANES, GAIA MARIA
2022/2023

Abstract

Constant and persistent physical activity over time is recognized as a treatment for better glycemic control in patients with type 1 diabetes (T1D). Despite this, the current therapeutic approach does not yet have effective tools to mitigate hypoglycemia caused by physical exercise. In this context, decision support for the management of T1D is provided by approaches based on machine learning which, applied to data from continuous glucose monitoring (CGM), offers favorable horizons in the pre-exercise prediction of possible dangerous conditions, such as hypoglycemia. The aim of this thesis is to obtain a specific configuration of CGM metrics evaluated before the training session with which to implement a composite metric that allows, through a single parameter, to predict the onset of hypoglycemic episodes in adolescents diagnosed with DT1 following physical exercise. For this purpose, 47 CGM acquisitions were used labeled as HYPO, if belonging to subjects who had experienced hypoglycemia or as NO-HYPO, if belonging to subjects who did not experience episodes of hypoglycemia following the activity. The physical parameters of each subject and the extracted features were used as input to a classification algorithm for a selection of the metrics that best optimized the results for the problem of interest. The selected metrics were then further evaluated with respect to the classification problem by providing them as input for other classification models: Logistic Regression, Knn, SVM, Adaboost, Naive Bayes, Tree, Random Forest, Gradient Boosting. All classification models used were validated through the Leave-One-Subject-Out cross-validation procedure. The identified set of metrics was subsequently used to implement the final metric, the formulation of which was obtained using a linear logistic regression model. The model performance results in terms of accuracy, sensitivity, specificity and area under the curve (AUC) were: 72.34%, 76.47%, 53.85%, 65.16%, respectively. To evaluate the performance of the metric in discriminating subjects at risk of hypoglycemia, the confusion matrix was used whose results were: 26 true positives (TP), 6 false positives (FP), 7 false negatives (FN) and 8 true negatives (TN). The composite metric implementation procedure was also used with the configuration of metrics identified in a previous study. The model performance results in terms of accuracy, sensitivity, specificity and area under the curve (AUC) were: 74.47%, 94.12%, 23.08%, 58.60%, respectively. The confusion matrix identifies: 32 true positives (TP), 10 false positives (FP), 3 false negatives (FN) and 2 true negatives (TN). In conclusion, the implemented metric provides useful information to prevent hypoglycemia during physical activity in patients with T1D. This model offers practical guidance for taking precautions before physical activity, reducing the risk of hypoglycemia and improving overall management of T1D.
2022
2023-12-15
Development of a composite metric from continuous glucose monitoring data for the prediction of exercise-induced hypoglycaemia in subjects with type 1 diabetes: a machine learning approach.
L'attività fisica costante e persistente nel tempo è riconosciuta come trattamento per un miglior controllo glicemico nei pazienti affetti da diabete di tipo 1 (DT1). Malgrado ciò, l'approccio terapeutico attuale non dispone ancora di strumenti efficaci per mitigare l'ipoglicemia causata dall'esercizio fisico. In questo contesto, un supporto decisionale per la gestione del DT1 è fornito da approcci basati sull’apprendimento automatico che, applicato ai dati provenienti dal monitoraggio continuo del glucosio (CGM), offre orizzonti favorevoli nella predizione pre-esercizio di possibili condizioni pericolose, come l'ipoglicemia. Lo scopo di questa tesi è quello di ottenere una specifica configurazione di metriche CGM valutate prima della sessione di allenamento con la quale implementare una metrica composita che consenta, attraverso un unico parametro, di predire l’insorgenza di episodi di ipoglicemia negli adolescenti con diagnosi di DT1 a seguito di esercizio fisico. A tale scopo, sono state utilizzate 47 acquisizioni CGM etichettate come HYPO, se appartenenti a soggetti che avevano manifestato ipoglicemia o come NO-HYPO, se appartenenti a soggetti che non hanno manifestato episodi di ipoglicemia a seguito dell’attività. I parametri fisici di ciascun soggetto e le caratteristiche estratte sono state utilizzate come input a un algoritmo di classificazione per una selezione delle metriche che meglio ottimizzavano i risultati per il problema di interesse. Le metriche selezionate sono poi state valutate ulteriormente rispetto al problema di classificazione fornendole come input per altri modelli di classificazione: Logistic Regression, Knn, SVM, Adaboost, Naive Bayes, Tree, Random Forest, Gradient Boosting. Tutti i modelli di classificazione utilizzati sono stati validati attraverso la procedura di cross-validazione Leave-One-Subject-Out. Il set di metriche individuato è stato successivamente utilizzato per implementare la metrica finale, la cui formulazione è stata ottenuta impiegando un modello di regressione logistica lineare. I risultati delle prestazioni del modello in termini di accuratezza, sensibilità, specificità e area sotto la curva (AUC) sono stati rispettivamente: 72,34%, 76,47%, 53,85%, 65,16%. Per valutare le prestazioni della metrica nel discriminare i soggetti a rischio di ipoglicemia è stata utilizzata la matrice di confusione i cui risultati sono: 26 veri positivi (TP), 6 falsi positivi (FP), 7 falsi negativi (FN) e 8 veri negativi (TN). La procedura di implementazione della metrica composita è stata utilizzata anche con la configurazione di metriche individuate in uno studio precedente. I risultati delle prestazioni del modello in termini di accuratezza, sensibilità, specificità e area sotto la curva (AUC) sono stati rispettivamente: 74,47%, 94,12%, 23,08%, 58,60%. La matrice di confusione individua: 32 veri positivi (TP), 10 falsi positivi (FP),3 falsi negativi (FN) e 2 veri negativi (TN). In conclusione, la metrica implementata fornisce informazioni utili per prevenire l’ipoglicemia durante l’attività fisica nei pazienti con DT1. Questo modello offre una guida pratica per adottare precauzioni prima dell'attività fisica, riducendo il rischio di ipoglicemia e migliorando la gestione complessiva del DT1.
File in questo prodotto:
File Dimensione Formato  
tesi_manes_definitiva (4) (2).pdf

embargo fino al 14/12/2026

Dimensione 826.68 kB
Formato Adobe PDF
826.68 kB Adobe PDF

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.12075/16139