Al giorno d’oggi, l’impiego di dati da monitoraggio continuo del glucosio (CGM) risulta essere di fondamentale importanza nell’ambito della cura e della gestione del diabete, permettendo di modellare la dinamica del glucosio e di valutare strategie di controllo e previsione. Tuttavia, la disponibilità di dataset completi e accurati è ancora limitata. Per questo motivo, l’utilizzo dell’intelligenza artificiale generativa rappresenta un supporto concreto per mitigare la scarsità di dati e ampliare i dataset attualmente a disposizione. In particolare, le reti generative avversarie (GAN) risultano essere un valido strumento di generazione e si sono dimostrate adatte a modellare serie temporali continue come il segnale CGM. La presente tesi introduce e valuta un modello di GAN ricorsivo implementato come una Long Short-Term Memory (LSTM), e impiegato nella generazione di tracciati CGM durante l’assunzione di un pasto standardizzato: carbo, protein, fat. In particolare, è stata valutata sia la capacità della rete ricorsiva di generare dei dati sintetici simili a quelli reali, sia la capacità di generare un numero elevato di dati partendo da un numero di dati scarso. Sono state prese in considerazione 12 metriche (media, mediana, deviazione standard, coefficiente di variazione, massimo, indice del massimo, minimo, indice del minimo, pendenza dell’ascesa post-prandiale, area sottesa alla curva, tempo nell’intervallo e tempo nell’intervallo stretto) al fine di valutare le differenze statistiche tra le distribuzioni reali e generate (Test di Wilcoxon). Inoltre, la distanza di Wasserstein è stata valutata come metrica di distanza. Per tutte le tipologie di pasto, le metriche che non presentano mai differenze statisticamente significative con la popolazione sono media, mediana, area sottesa alla curva glicemica e valore massimo di glucosio. La distanza di Wasserstein è pari a 6.92, 9.97 e 10.21 per le categorie carbo, protein e fat rispettivamente; non varia in modo rilevante all’aumentare del numero di generazioni. In conclusione, il modello GAN proposto ha mostrato di poter generare numerosi segnali CGM sintetici, riproducendo l’andamento glicemico relativo all’assunzione di diverse tipologie di pasti.
GENERAZIONE DI DATI DI MONITORAGGIO CONTINUO DELLA GLICEMIA TRAMITE RETI GAN RICORRENTI: ANALISI DELLA CAPACITÀ DI GENERAZIONE A PARTIRE DA DATASET LIMITATI
ADORANTE, GIULIO
2024/2025
Abstract
Al giorno d’oggi, l’impiego di dati da monitoraggio continuo del glucosio (CGM) risulta essere di fondamentale importanza nell’ambito della cura e della gestione del diabete, permettendo di modellare la dinamica del glucosio e di valutare strategie di controllo e previsione. Tuttavia, la disponibilità di dataset completi e accurati è ancora limitata. Per questo motivo, l’utilizzo dell’intelligenza artificiale generativa rappresenta un supporto concreto per mitigare la scarsità di dati e ampliare i dataset attualmente a disposizione. In particolare, le reti generative avversarie (GAN) risultano essere un valido strumento di generazione e si sono dimostrate adatte a modellare serie temporali continue come il segnale CGM. La presente tesi introduce e valuta un modello di GAN ricorsivo implementato come una Long Short-Term Memory (LSTM), e impiegato nella generazione di tracciati CGM durante l’assunzione di un pasto standardizzato: carbo, protein, fat. In particolare, è stata valutata sia la capacità della rete ricorsiva di generare dei dati sintetici simili a quelli reali, sia la capacità di generare un numero elevato di dati partendo da un numero di dati scarso. Sono state prese in considerazione 12 metriche (media, mediana, deviazione standard, coefficiente di variazione, massimo, indice del massimo, minimo, indice del minimo, pendenza dell’ascesa post-prandiale, area sottesa alla curva, tempo nell’intervallo e tempo nell’intervallo stretto) al fine di valutare le differenze statistiche tra le distribuzioni reali e generate (Test di Wilcoxon). Inoltre, la distanza di Wasserstein è stata valutata come metrica di distanza. Per tutte le tipologie di pasto, le metriche che non presentano mai differenze statisticamente significative con la popolazione sono media, mediana, area sottesa alla curva glicemica e valore massimo di glucosio. La distanza di Wasserstein è pari a 6.92, 9.97 e 10.21 per le categorie carbo, protein e fat rispettivamente; non varia in modo rilevante all’aumentare del numero di generazioni. In conclusione, il modello GAN proposto ha mostrato di poter generare numerosi segnali CGM sintetici, riproducendo l’andamento glicemico relativo all’assunzione di diverse tipologie di pasti.| File | Dimensione | Formato | |
|---|---|---|---|
|
Tesi Giulio Adorante.pdf
non disponibili
Dimensione
997.15 kB
Formato
Adobe PDF
|
997.15 kB | Adobe PDF |
I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/20.500.12075/25626