In questa tesi sono state progettate ed implementate architetture di Federated Learning (FL) per la segmentazione automatica di immagini di cellule ottenute da microscopio, un'attività fondamentale in ambito medico e biologico per la diagnosi ed il monitoraggio di diverse patologie. Attualmente l'analisi di queste immagini viene condotta principalmente in modo manuale, con problematiche legate a soggettività dell'annotazione e a un elevato dispendio di tempo e risorse. Ulteriori criticità si riscontrano nella condivisione sicura delle immagini tra laboratori ed organizzazioni differenti. In questo lavoro sono state valutate diverse reti neurali per segmentare immagini ottenute da un esperimento che coinvolge linee cellulari di Non-Small Cell Lung Cancer (NSCLC), trattate con la citochina TGF-β per indurre la trasformazione epitelio-mesenchimale. Individuato il modello più performante in relazione a tali immagini e affinati i parametri, è stato sviluppato un tool per la segmentazione cellulare e per l'analisi automatica dei parametri morfologici e di fluorescenza. Per affrontare le criticità legate alla privacy e alla condivisione di grandi dataset di training tipiche dell'addestramento centralizzato di reti neurali, è stato implementato un approccio distribuito di Federated Learning. Il FL è una tecnica sicura di training distribuito in cui il task di addestramento è trasferito tra diversi client, senza la condivisione di dati tra gli stessi. Questo permette di mantenere i dati sensibili nei laboratori locali, garantendo la privacy dei pazienti, facilitando la collaborazione tra enti di ricerca e distribuendo il carico di lavoro tra diverse strutture interconnesse. I risultati ottenuti con l'architettura di addestramento distribuito dimostrano che le prestazioni del modello addestrato con FL sono comparabili a quelle dell'addestramento centralizzato, con loss finale del modello distribuito perciò molto vicina a quella del modello centralizzato. Questo dimostra che il Federated Learning è in grado di garantire performance simili all'approccio classico, assicurando al contempo vantaggi legati alla privacy e alla gestione decentralizzata dei dati. Il lavoro illustrato rappresenta, dunque, un passo in avanti nell'utilizzo di tecniche di intelligenza artificiale sicure ed efficienti in ambito medico e biologico, con particolare focus sull'ottimizzazione di aspetti quali la condivisione dei dati, l'apprendimento continuo (continual learning) e la semplificazione dei task manuali di annotazione.
Studio, analisi e sviluppo di architetture di Federated Learning per la segmentazione di immagini di colture cellulari
BRUSCHI, SARA
2023/2024
Abstract
In questa tesi sono state progettate ed implementate architetture di Federated Learning (FL) per la segmentazione automatica di immagini di cellule ottenute da microscopio, un'attività fondamentale in ambito medico e biologico per la diagnosi ed il monitoraggio di diverse patologie. Attualmente l'analisi di queste immagini viene condotta principalmente in modo manuale, con problematiche legate a soggettività dell'annotazione e a un elevato dispendio di tempo e risorse. Ulteriori criticità si riscontrano nella condivisione sicura delle immagini tra laboratori ed organizzazioni differenti. In questo lavoro sono state valutate diverse reti neurali per segmentare immagini ottenute da un esperimento che coinvolge linee cellulari di Non-Small Cell Lung Cancer (NSCLC), trattate con la citochina TGF-β per indurre la trasformazione epitelio-mesenchimale. Individuato il modello più performante in relazione a tali immagini e affinati i parametri, è stato sviluppato un tool per la segmentazione cellulare e per l'analisi automatica dei parametri morfologici e di fluorescenza. Per affrontare le criticità legate alla privacy e alla condivisione di grandi dataset di training tipiche dell'addestramento centralizzato di reti neurali, è stato implementato un approccio distribuito di Federated Learning. Il FL è una tecnica sicura di training distribuito in cui il task di addestramento è trasferito tra diversi client, senza la condivisione di dati tra gli stessi. Questo permette di mantenere i dati sensibili nei laboratori locali, garantendo la privacy dei pazienti, facilitando la collaborazione tra enti di ricerca e distribuendo il carico di lavoro tra diverse strutture interconnesse. I risultati ottenuti con l'architettura di addestramento distribuito dimostrano che le prestazioni del modello addestrato con FL sono comparabili a quelle dell'addestramento centralizzato, con loss finale del modello distribuito perciò molto vicina a quella del modello centralizzato. Questo dimostra che il Federated Learning è in grado di garantire performance simili all'approccio classico, assicurando al contempo vantaggi legati alla privacy e alla gestione decentralizzata dei dati. Il lavoro illustrato rappresenta, dunque, un passo in avanti nell'utilizzo di tecniche di intelligenza artificiale sicure ed efficienti in ambito medico e biologico, con particolare focus sull'ottimizzazione di aspetti quali la condivisione dei dati, l'apprendimento continuo (continual learning) e la semplificazione dei task manuali di annotazione.File | Dimensione | Formato | |
---|---|---|---|
Tesi_Sara_Bruschi.pdf
accesso aperto
Descrizione: Tesi definitiva Sara Bruschi
Dimensione
32.73 MB
Formato
Adobe PDF
|
32.73 MB | Adobe PDF | Visualizza/Apri |
I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/20.500.12075/19209