Studio, analisi e sviluppo di architetture di Federated Learning per la segmentazione di immagini di colture cellulari

In questa tesi sono state progettate ed implementate architetture di Federated Learning (FL) per la segmentazione automatica di immagini di cellule ottenute da microscopio, un'attività fondamentale in ambito medico e biologico per la diagnosi ed il monitoraggio di diverse patologie. Attualmente l'analisi di queste immagini viene condotta principalmente in modo manuale, con problematiche legate a soggettività dell'annotazione e a un elevato dispendio di tempo e risorse. Ulteriori criticità si riscontrano nella condivisione sicura delle immagini tra laboratori ed organizzazioni differenti. In questo lavoro sono state valutate diverse reti neurali per segmentare immagini ottenute da un esperimento che coinvolge linee cellulari di Non-Small Cell Lung Cancer (NSCLC), trattate con la citochina TGF-β per indurre la trasformazione epitelio-mesenchimale. Individuato il modello più performante in relazione a tali immagini e affinati i parametri, è stato sviluppato un tool per la segmentazione cellulare e per l'analisi automatica dei parametri morfologici e di fluorescenza. Per affrontare le criticità legate alla privacy e alla condivisione di grandi dataset di training tipiche dell'addestramento centralizzato di reti neurali, è stato implementato un approccio distribuito di Federated Learning. Il FL è una tecnica sicura di training distribuito in cui il task di addestramento è trasferito tra diversi client, senza la condivisione di dati tra gli stessi. Questo permette di mantenere i dati sensibili nei laboratori locali, garantendo la privacy dei pazienti, facilitando la collaborazione tra enti di ricerca e distribuendo il carico di lavoro tra diverse strutture interconnesse. I risultati ottenuti con l'architettura di addestramento distribuito dimostrano che le prestazioni del modello addestrato con FL sono comparabili a quelle dell'addestramento centralizzato, con loss finale del modello distribuito perciò molto vicina a quella del modello centralizzato. Questo dimostra che il Federated Learning è in grado di garantire performance simili all'approccio classico, assicurando al contempo vantaggi legati alla privacy e alla gestione decentralizzata dei dati. Il lavoro illustrato rappresenta, dunque, un passo in avanti nell'utilizzo di tecniche di intelligenza artificiale sicure ed efficienti in ambito medico e biologico, con particolare focus sull'ottimizzazione di aspetti quali la condivisione dei dati, l'apprendimento continuo (continual learning) e la semplificazione dei task manuali di annotazione.

Studio, analisi e sviluppo di architetture di Federated Learning per la segmentazione di immagini di colture cellulari

BRUSCHI, SARA

2023/2024

Abstract

In questa tesi sono state progettate ed implementate architetture di Federated Learning (FL) per la segmentazione automatica di immagini di cellule ottenute da microscopio, un'attività fondamentale in ambito medico e biologico per la diagnosi ed il monitoraggio di diverse patologie. Attualmente l'analisi di queste immagini viene condotta principalmente in modo manuale, con problematiche legate a soggettività dell'annotazione e a un elevato dispendio di tempo e risorse. Ulteriori criticità si riscontrano nella condivisione sicura delle immagini tra laboratori ed organizzazioni differenti. In questo lavoro sono state valutate diverse reti neurali per segmentare immagini ottenute da un esperimento che coinvolge linee cellulari di Non-Small Cell Lung Cancer (NSCLC), trattate con la citochina TGF-β per indurre la trasformazione epitelio-mesenchimale. Individuato il modello più performante in relazione a tali immagini e affinati i parametri, è stato sviluppato un tool per la segmentazione cellulare e per l'analisi automatica dei parametri morfologici e di fluorescenza. Per affrontare le criticità legate alla privacy e alla condivisione di grandi dataset di training tipiche dell'addestramento centralizzato di reti neurali, è stato implementato un approccio distribuito di Federated Learning. Il FL è una tecnica sicura di training distribuito in cui il task di addestramento è trasferito tra diversi client, senza la condivisione di dati tra gli stessi. Questo permette di mantenere i dati sensibili nei laboratori locali, garantendo la privacy dei pazienti, facilitando la collaborazione tra enti di ricerca e distribuendo il carico di lavoro tra diverse strutture interconnesse. I risultati ottenuti con l'architettura di addestramento distribuito dimostrano che le prestazioni del modello addestrato con FL sono comparabili a quelle dell'addestramento centralizzato, con loss finale del modello distribuito perciò molto vicina a quella del modello centralizzato. Questo dimostra che il Federated Learning è in grado di garantire performance simili all'approccio classico, assicurando al contempo vantaggi legati alla privacy e alla gestione decentralizzata dei dati. Il lavoro illustrato rappresenta, dunque, un passo in avanti nell'utilizzo di tecniche di intelligenza artificiale sicure ed efficienti in ambito medico e biologico, con particolare focus sull'ottimizzazione di aspetti quali la condivisione dei dati, l'apprendimento continuo (continual learning) e la semplificazione dei task manuali di annotazione.

Scheda breve

Scheda completa

Scheda completa (DC)

	Facoltà/Dipartimento
	
				Dipartimento Ingegneria dell'Informazione
			
	Corso di studio
	
				INGEGNERIA ELETTRONICA
			
	Anno Accademico
	
				2023
			
	Data dell'esame finale
	
				2024-10-24
			
	Titolo inglese
	
				Study, analysis and development of Federated Learning architectures for the segmentation of cell culture images
			
	Relatore
	
				PIERLEONI, PAOLA
			
	Correlatore
	
				ESPOSITO, MARCO
RAGGIUNTO, SARA
			
	Appare nelle tipologie:
	
				Laurea specialistica, magistrale, ciclo unico

File in questo prodotto:

File	Dimensione	Formato
Tesi_Sara_Bruschi.pdf accesso aperto Descrizione: Tesi definitiva Sara Bruschi Dimensione 32.73 MB Formato Adobe PDF Visualizza/Apri	32.73 MB	Adobe PDF	Visualizza/Apri

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.12075/19209

UNITesiUniversità Politecnica delle Marche