GENERAZIONE DI DATI DI MONITORAGGIO CONTINUO DELLA GLICEMIA TRAMITE RETI GAN RICORRENTI: ANALISI DELLA CAPACITÀ DI GENERAZIONE A PARTIRE DA DATASET LIMITATI

Al giorno d’oggi, l’impiego di dati da monitoraggio continuo del glucosio (CGM) risulta essere di fondamentale importanza nell’ambito della cura e della gestione del diabete, permettendo di modellare la dinamica del glucosio e di valutare strategie di controllo e previsione. Tuttavia, la disponibilità di dataset completi e accurati è ancora limitata. Per questo motivo, l’utilizzo dell’intelligenza artificiale generativa rappresenta un supporto concreto per mitigare la scarsità di dati e ampliare i dataset attualmente a disposizione. In particolare, le reti generative avversarie (GAN) risultano essere un valido strumento di generazione e si sono dimostrate adatte a modellare serie temporali continue come il segnale CGM. La presente tesi introduce e valuta un modello di GAN ricorsivo implementato come una Long Short-Term Memory (LSTM), e impiegato nella generazione di tracciati CGM durante l’assunzione di un pasto standardizzato: carbo, protein, fat. In particolare, è stata valutata sia la capacità della rete ricorsiva di generare dei dati sintetici simili a quelli reali, sia la capacità di generare un numero elevato di dati partendo da un numero di dati scarso. Sono state prese in considerazione 12 metriche (media, mediana, deviazione standard, coefficiente di variazione, massimo, indice del massimo, minimo, indice del minimo, pendenza dell’ascesa post-prandiale, area sottesa alla curva, tempo nell’intervallo e tempo nell’intervallo stretto) al fine di valutare le differenze statistiche tra le distribuzioni reali e generate (Test di Wilcoxon). Inoltre, la distanza di Wasserstein è stata valutata come metrica di distanza. Per tutte le tipologie di pasto, le metriche che non presentano mai differenze statisticamente significative con la popolazione sono media, mediana, area sottesa alla curva glicemica e valore massimo di glucosio. La distanza di Wasserstein è pari a 6.92, 9.97 e 10.21 per le categorie carbo, protein e fat rispettivamente; non varia in modo rilevante all’aumentare del numero di generazioni. In conclusione, il modello GAN proposto ha mostrato di poter generare numerosi segnali CGM sintetici, riproducendo l’andamento glicemico relativo all’assunzione di diverse tipologie di pasti.

GENERAZIONE DI DATI DI MONITORAGGIO CONTINUO DELLA GLICEMIA TRAMITE RETI GAN RICORRENTI: ANALISI DELLA CAPACITÀ DI GENERAZIONE A PARTIRE DA DATASET LIMITATI

ADORANTE, GIULIO

2024/2025

Abstract

Al giorno d’oggi, l’impiego di dati da monitoraggio continuo del glucosio (CGM) risulta essere di fondamentale importanza nell’ambito della cura e della gestione del diabete, permettendo di modellare la dinamica del glucosio e di valutare strategie di controllo e previsione. Tuttavia, la disponibilità di dataset completi e accurati è ancora limitata. Per questo motivo, l’utilizzo dell’intelligenza artificiale generativa rappresenta un supporto concreto per mitigare la scarsità di dati e ampliare i dataset attualmente a disposizione. In particolare, le reti generative avversarie (GAN) risultano essere un valido strumento di generazione e si sono dimostrate adatte a modellare serie temporali continue come il segnale CGM. La presente tesi introduce e valuta un modello di GAN ricorsivo implementato come una Long Short-Term Memory (LSTM), e impiegato nella generazione di tracciati CGM durante l’assunzione di un pasto standardizzato: carbo, protein, fat. In particolare, è stata valutata sia la capacità della rete ricorsiva di generare dei dati sintetici simili a quelli reali, sia la capacità di generare un numero elevato di dati partendo da un numero di dati scarso. Sono state prese in considerazione 12 metriche (media, mediana, deviazione standard, coefficiente di variazione, massimo, indice del massimo, minimo, indice del minimo, pendenza dell’ascesa post-prandiale, area sottesa alla curva, tempo nell’intervallo e tempo nell’intervallo stretto) al fine di valutare le differenze statistiche tra le distribuzioni reali e generate (Test di Wilcoxon). Inoltre, la distanza di Wasserstein è stata valutata come metrica di distanza. Per tutte le tipologie di pasto, le metriche che non presentano mai differenze statisticamente significative con la popolazione sono media, mediana, area sottesa alla curva glicemica e valore massimo di glucosio. La distanza di Wasserstein è pari a 6.92, 9.97 e 10.21 per le categorie carbo, protein e fat rispettivamente; non varia in modo rilevante all’aumentare del numero di generazioni. In conclusione, il modello GAN proposto ha mostrato di poter generare numerosi segnali CGM sintetici, riproducendo l’andamento glicemico relativo all’assunzione di diverse tipologie di pasti.

Scheda breve

Scheda completa

Scheda completa (DC)

	Facoltà/Dipartimento
	
				Dipartimento Ingegneria dell'Informazione
			
	Corso di studio
	
				INGEGNERIA BIOMEDICA
			
	Anno Accademico
	
				2024
			
	Data dell'esame finale
	
				2026-02-19
			
	Titolo inglese
	
				GENERATION OF CONTINUOUS GLUCOSE MONITORING DATA VIA RECURRENT GAN NETWORKS: ANALYSIS OF GENERATION CAPACITY FROM LIMITED DATASET
			
	Relatore
	
				MORETTINI, MICAELA
			
	Correlatore
	
				DEL GIUDICE, LIBERA LUCIA
PIERSANTI, AGNESE
			
	Appare nelle tipologie:
	
				Laurea triennale, diploma universitario

File in questo prodotto:

File	Dimensione	Formato
Tesi Giulio Adorante.pdf non disponibili Dimensione 997.15 kB Formato Adobe PDF	997.15 kB	Adobe PDF

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.12075/25626

UNITesiUniversità Politecnica delle Marche