Il problema dell'elaborazione delle immagini, mirata all’interpretazione e alla classificazione del contenuto delle stesse, ha attirato l'attenzione dei ricercatori dai primi tempi della nascita e diffusione dei calcolatori. Con il progredire della tecnologia dei sistemi di calcolo, la categorizzazione di immagini ha trovato applicazioni sempre più vaste, riguardando discipline di nuova generazione come l’Object Recognition e la Computer Vision. È proprio in quest’ultima disciplina che si vuole inserire il lavoro di tesi, il cui tema centrale è il Deep Learning e le possibili applicazioni della classificazione di immagini nel settore della moda. Il lavoro svolto si articola in 3 macro-sezioni. Nella prima parte è stato fatto un approfondimento generale sul Machine Learning, per poi specializzarsi sui vari algoritmi di apprendimento automatico, tra cui proprio quello dell’apprendimento profondo, o Deep Learning. Poi si è passati ad analizzare e a descrivere il concetto di rete neurale artificiale, approfondendo le reti neurali convolutive (CNN) con alcuni cenni matematici e strutturali. Queste ultime sono state il fulcro del progetto, grazie alle quali è stato possibile portare a termine l’intera classificazione. La seconda sezione del lavoro è stata quella inerente all’estrazione delle feature, con conseguente elaborazione e interpretazione delle immagini da parte delle CNN appena anticipate. Tutto questo è stato attuabile grazie all’implementazione di metodi e tecniche che hanno come fine quello di spiegare la percezione delle reti neurali, e come queste prendano decisioni nel momento in cui gli vengono dati degli input, in questo specifico caso delle immagini. Infine, la fase finale ha preso il via con l’addestramento di queste reti su due dataset di immagini il cui unico fattore in comune era quello di contenere delle borse. Successivamente sono stati studiati e valutati i comportamenti derivanti dal post classificazione, tramite dei grafici appositamente costruiti durante questa fase e attraverso quelle tecniche di interpretabilità anticipate prima. Tutto questo cercando di dare sempre un collegamento teorico a tutto quello che veniva osservato. Questo documento, articolato su 5 capitoli, ha come fine quello di fornire un buon punto di partenza sulle potenzialità, che al giorno d’oggi, il deep learning sta fornendo al settore dell’informatica e in generale nelle applicazioni che vengono utilizzate quotidianamente.
Analisi di algoritmi di supervised learning applicati nell’ambito della moda
MANCINI, RICCARDO
2020/2021
Abstract
Il problema dell'elaborazione delle immagini, mirata all’interpretazione e alla classificazione del contenuto delle stesse, ha attirato l'attenzione dei ricercatori dai primi tempi della nascita e diffusione dei calcolatori. Con il progredire della tecnologia dei sistemi di calcolo, la categorizzazione di immagini ha trovato applicazioni sempre più vaste, riguardando discipline di nuova generazione come l’Object Recognition e la Computer Vision. È proprio in quest’ultima disciplina che si vuole inserire il lavoro di tesi, il cui tema centrale è il Deep Learning e le possibili applicazioni della classificazione di immagini nel settore della moda. Il lavoro svolto si articola in 3 macro-sezioni. Nella prima parte è stato fatto un approfondimento generale sul Machine Learning, per poi specializzarsi sui vari algoritmi di apprendimento automatico, tra cui proprio quello dell’apprendimento profondo, o Deep Learning. Poi si è passati ad analizzare e a descrivere il concetto di rete neurale artificiale, approfondendo le reti neurali convolutive (CNN) con alcuni cenni matematici e strutturali. Queste ultime sono state il fulcro del progetto, grazie alle quali è stato possibile portare a termine l’intera classificazione. La seconda sezione del lavoro è stata quella inerente all’estrazione delle feature, con conseguente elaborazione e interpretazione delle immagini da parte delle CNN appena anticipate. Tutto questo è stato attuabile grazie all’implementazione di metodi e tecniche che hanno come fine quello di spiegare la percezione delle reti neurali, e come queste prendano decisioni nel momento in cui gli vengono dati degli input, in questo specifico caso delle immagini. Infine, la fase finale ha preso il via con l’addestramento di queste reti su due dataset di immagini il cui unico fattore in comune era quello di contenere delle borse. Successivamente sono stati studiati e valutati i comportamenti derivanti dal post classificazione, tramite dei grafici appositamente costruiti durante questa fase e attraverso quelle tecniche di interpretabilità anticipate prima. Tutto questo cercando di dare sempre un collegamento teorico a tutto quello che veniva osservato. Questo documento, articolato su 5 capitoli, ha come fine quello di fornire un buon punto di partenza sulle potenzialità, che al giorno d’oggi, il deep learning sta fornendo al settore dell’informatica e in generale nelle applicazioni che vengono utilizzate quotidianamente.File | Dimensione | Formato | |
---|---|---|---|
Tesi Mancini Riccardo (1084412).pdf
embargo fino al 27/10/2024
Descrizione: Tesi sperimentale scritta da Mancini Riccardo (matricola: 1084412).
Dimensione
16.01 MB
Formato
Adobe PDF
|
16.01 MB | Adobe PDF |
I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/20.500.12075/1368