In questa tesi sono state progettate ed implementate architetture di Federated Learning (FL) per la segmentazione automatica di immagini di cellule ottenute da microscopio, un'attività fondamentale in ambito medico e biologico per la diagnosi ed il monitoraggio di diverse patologie. Attualmente l'analisi di queste immagini viene condotta principalmente in modo manuale, con problematiche legate a soggettività dell'annotazione e a un elevato dispendio di tempo e risorse. Ulteriori criticità si riscontrano nella condivisione sicura delle immagini tra laboratori ed organizzazioni differenti. In questo lavoro sono state valutate diverse reti neurali per segmentare immagini ottenute da un esperimento che coinvolge linee cellulari di Non-Small Cell Lung Cancer (NSCLC), trattate con la citochina TGF-β per indurre la trasformazione epitelio-mesenchimale. Individuato il modello più performante in relazione a tali immagini e affinati i parametri, è stato sviluppato un tool per la segmentazione cellulare e per l'analisi automatica dei parametri morfologici e di fluorescenza. Per affrontare le criticità legate alla privacy e alla condivisione di grandi dataset di training tipiche dell'addestramento centralizzato di reti neurali, è stato implementato un approccio distribuito di Federated Learning. Il FL è una tecnica sicura di training distribuito in cui il task di addestramento è trasferito tra diversi client, senza la condivisione di dati tra gli stessi. Questo permette di mantenere i dati sensibili nei laboratori locali, garantendo la privacy dei pazienti, facilitando la collaborazione tra enti di ricerca e distribuendo il carico di lavoro tra diverse strutture interconnesse. I risultati ottenuti con l'architettura di addestramento distribuito dimostrano che le prestazioni del modello addestrato con FL sono comparabili a quelle dell'addestramento centralizzato, con loss finale del modello distribuito perciò molto vicina a quella del modello centralizzato. Questo dimostra che il Federated Learning è in grado di garantire performance simili all'approccio classico, assicurando al contempo vantaggi legati alla privacy e alla gestione decentralizzata dei dati. Il lavoro illustrato rappresenta, dunque, un passo in avanti nell'utilizzo di tecniche di intelligenza artificiale sicure ed efficienti in ambito medico e biologico, con particolare focus sull'ottimizzazione di aspetti quali la condivisione dei dati, l'apprendimento continuo (continual learning) e la semplificazione dei task manuali di annotazione.

Studio, analisi e sviluppo di architetture di Federated Learning per la segmentazione di immagini di colture cellulari

BRUSCHI, SARA
2023/2024

Abstract

In questa tesi sono state progettate ed implementate architetture di Federated Learning (FL) per la segmentazione automatica di immagini di cellule ottenute da microscopio, un'attività fondamentale in ambito medico e biologico per la diagnosi ed il monitoraggio di diverse patologie. Attualmente l'analisi di queste immagini viene condotta principalmente in modo manuale, con problematiche legate a soggettività dell'annotazione e a un elevato dispendio di tempo e risorse. Ulteriori criticità si riscontrano nella condivisione sicura delle immagini tra laboratori ed organizzazioni differenti. In questo lavoro sono state valutate diverse reti neurali per segmentare immagini ottenute da un esperimento che coinvolge linee cellulari di Non-Small Cell Lung Cancer (NSCLC), trattate con la citochina TGF-β per indurre la trasformazione epitelio-mesenchimale. Individuato il modello più performante in relazione a tali immagini e affinati i parametri, è stato sviluppato un tool per la segmentazione cellulare e per l'analisi automatica dei parametri morfologici e di fluorescenza. Per affrontare le criticità legate alla privacy e alla condivisione di grandi dataset di training tipiche dell'addestramento centralizzato di reti neurali, è stato implementato un approccio distribuito di Federated Learning. Il FL è una tecnica sicura di training distribuito in cui il task di addestramento è trasferito tra diversi client, senza la condivisione di dati tra gli stessi. Questo permette di mantenere i dati sensibili nei laboratori locali, garantendo la privacy dei pazienti, facilitando la collaborazione tra enti di ricerca e distribuendo il carico di lavoro tra diverse strutture interconnesse. I risultati ottenuti con l'architettura di addestramento distribuito dimostrano che le prestazioni del modello addestrato con FL sono comparabili a quelle dell'addestramento centralizzato, con loss finale del modello distribuito perciò molto vicina a quella del modello centralizzato. Questo dimostra che il Federated Learning è in grado di garantire performance simili all'approccio classico, assicurando al contempo vantaggi legati alla privacy e alla gestione decentralizzata dei dati. Il lavoro illustrato rappresenta, dunque, un passo in avanti nell'utilizzo di tecniche di intelligenza artificiale sicure ed efficienti in ambito medico e biologico, con particolare focus sull'ottimizzazione di aspetti quali la condivisione dei dati, l'apprendimento continuo (continual learning) e la semplificazione dei task manuali di annotazione.
2023
2024-10-24
Study, analysis and development of Federated Learning architectures for the segmentation of cell culture images
File in questo prodotto:
File Dimensione Formato  
Tesi_Sara_Bruschi.pdf

accesso aperto

Descrizione: Tesi definitiva Sara Bruschi
Dimensione 32.73 MB
Formato Adobe PDF
32.73 MB Adobe PDF Visualizza/Apri

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.12075/19209