Disturbi neurologici e neurodegenerativi come paralisi cerebrale, Parkinson e SLA possono compromettere la produzione del linguaggio, causando disartria. Sebbene i pazienti conservino le capacità cognitive e linguistiche, il parlato disartrico risulta spesso poco intellegibile. La valutazione uditivo-percettiva è il gold standard nella valutazione dei pazienti affetti da disartria. Tuttavia, strumenti di supporto per la decisione clinica in fase di diagnosi e pianificazione di strategie di trattamento della patologia sono essenziali. Questa tesi propone tecniche basate sul deep learning per la classificazione automatica dei livelli di disartria, affrontando il problema della scarsità di dati disponibili. A tal fine, sono stati sintetizzati nuovi dati a partire dai due corpora, TORGO e UA-Speech, sfruttando un modello generativo basato su Diffusion Probabilistic Models (DPM). Il dataset risultante, integrato con i dati originali, ha permesso l’addestramento di reti ResNet-50 e ResNet-152 per la classificazione binaria e multiclasse dei diversi livelli di severità della disartria. I risultati evidenziano un generale miglioramento delle prestazioni dei modelli all'aumentare della numerosità e variabilità dei dati di training, confermando l’utilità dei dati generati artificialmente per potenziare i dataset esistenti. Il lavoro apre la strada a sviluppi futuri orientati all’uso di Generative AI per rendere gli strumenti di valutazione clinica più accurati e inclusivi.

Classificazione automatica della disartria con tecniche di Generative AI applicate a segnali vocali

BASILI, TERESA
2024/2025

Abstract

Disturbi neurologici e neurodegenerativi come paralisi cerebrale, Parkinson e SLA possono compromettere la produzione del linguaggio, causando disartria. Sebbene i pazienti conservino le capacità cognitive e linguistiche, il parlato disartrico risulta spesso poco intellegibile. La valutazione uditivo-percettiva è il gold standard nella valutazione dei pazienti affetti da disartria. Tuttavia, strumenti di supporto per la decisione clinica in fase di diagnosi e pianificazione di strategie di trattamento della patologia sono essenziali. Questa tesi propone tecniche basate sul deep learning per la classificazione automatica dei livelli di disartria, affrontando il problema della scarsità di dati disponibili. A tal fine, sono stati sintetizzati nuovi dati a partire dai due corpora, TORGO e UA-Speech, sfruttando un modello generativo basato su Diffusion Probabilistic Models (DPM). Il dataset risultante, integrato con i dati originali, ha permesso l’addestramento di reti ResNet-50 e ResNet-152 per la classificazione binaria e multiclasse dei diversi livelli di severità della disartria. I risultati evidenziano un generale miglioramento delle prestazioni dei modelli all'aumentare della numerosità e variabilità dei dati di training, confermando l’utilità dei dati generati artificialmente per potenziare i dataset esistenti. Il lavoro apre la strada a sviluppi futuri orientati all’uso di Generative AI per rendere gli strumenti di valutazione clinica più accurati e inclusivi.
2024
2025-10-16
AUTOMATIC DYSARTHRIA CLASSIFICATION USING GENERATIVE AI TECHNIQUES APPLIED TO SPEECH SIGNALS
File in questo prodotto:
File Dimensione Formato  
Tesi_TeresaBasili_pdfa.pdf

embargo fino al 19/04/2027

Dimensione 1.22 MB
Formato Adobe PDF
1.22 MB Adobe PDF

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.12075/23231