The increasing demand for deep learning models in semantic segmentation has highlighted the need for extensive and diverse training datasets. This study proposes an innovative approach for dataset augmentation in segmentation, employing a Generative Adversarial Network (GAN) called COIGAN (Controllable Object Inpainting GAN). COIGAN is designed to generate defects on undamaged surfaces, providing an efficient method for augmenting defect datasets. The model, based on LaMa (Large Mask Inpainting), utilizes a series of specifically designed loss functions and multiple discriminators to optimize various aspects of generation. The proposed approach offers an effective method for dataset augmentation in segmentation, enabling the generation of synthetic data that enhances the diversity of training data, ensuring better generalization of segmentation models. This work contributes to bridging the gap between dataset availability and the needs of deep learning models for semantic segmentation.
La crescente richiesta di modelli di deep learning per la segmentazione semantica ha evidenziato la necessità di dataset di addestramento ampi e diversificati. Questo studio propone un approccio innovativo per l'augmentation di dataset per la segmentazione, utilizzando una Generative Adversarial Network (GAN) denominata COIGAN (Controllable Object Inpainting GAN). COIGAN è progettata per generare difetti su superfici non danneggiate, fornendo un metodo efficiente per l'augmentation dei dataset di difetti. Il modello, basato su LaMa (Large Mask Inpainting), utilizza una serie di loss appositamente progettate e discriminatori multipli per ottimizzare diversi aspetti della generazione. L'approccio proposto offre un metodo efficace per l'augmentation di dataset per la segmentazione, consentendo la generazione di dati sintetici che migliorano la diversità dei dati di addestramento, garantendo una migliore generalizzazione dei modelli di segmentazione. Questo lavoro contribuisce a colmare il divario tra la disponibilità di dataset e le esigenze dei modelli di deep learning per la segmentazione semantica.
Progettazione e sviluppo di un modello GAN per l'augmentation adattiva di dataset per la segmentazione.
BIANCUCCI, MASSIMILIANO
2022/2023
Abstract
The increasing demand for deep learning models in semantic segmentation has highlighted the need for extensive and diverse training datasets. This study proposes an innovative approach for dataset augmentation in segmentation, employing a Generative Adversarial Network (GAN) called COIGAN (Controllable Object Inpainting GAN). COIGAN is designed to generate defects on undamaged surfaces, providing an efficient method for augmenting defect datasets. The model, based on LaMa (Large Mask Inpainting), utilizes a series of specifically designed loss functions and multiple discriminators to optimize various aspects of generation. The proposed approach offers an effective method for dataset augmentation in segmentation, enabling the generation of synthetic data that enhances the diversity of training data, ensuring better generalization of segmentation models. This work contributes to bridging the gap between dataset availability and the needs of deep learning models for semantic segmentation.File | Dimensione | Formato | |
---|---|---|---|
Tesi_Massimiliano_Biancucci_definitiva.pdf
accesso aperto
Dimensione
18.35 MB
Formato
Adobe PDF
|
18.35 MB | Adobe PDF | Visualizza/Apri |
I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/20.500.12075/16704