This thesis concerns the methods and technologies used within the algorithms that deal with Natural Language Processing (NLP), a subject of study and research to which more and more companies are drawing, in the global scenario, in order to develop cutting-edge solutions to solve situations of various kinds. This project was born from an internship activity in collaboration with Air Bag Studio, a company from Ascoli Piceno, in which the most used techniques in the NLP and Sentiment Analysis panorama were deepened. The goal is to create an application that puts into practice these mechanisms in the medical-health field, in particular in the analysis of a conversation, through a messaging application, between a doctor and his patient in care. In this scenario it is possible to run into urgent situations that require immediate intervention by the physician and it is essential, in case of asynchronous messaging, that the application is able to determine the feelings or emotions transmitted by the message. I describe the birth of the first Natural Language Processing techniques and their subsequent development, through Artificial Intelligence and Machine Learning, up to the most modern and current techniques that allow to perform Sentiment Analysis. I analyze the differences between the various existing machine learning algorithms, describing the two types of learning: Supervised and Unsupervised. I present and examine the different solutions proposed by the big players in the global market and the Open-Source ones available for free on the net. I describe, subsequently, the program that I developed in all phases of design and development, starting from the analysis of the scenario and the data involved, continuing with the description of the libraries included in the software and comparing the results of these choices with those obtained by the classic Machine Learning algorithms, in order to identify the best method to carry out the Sentiment Analysis. I present the developed codes, paying particular attention to the functions that compose them and the way in which I manage and analyze the data, to allow NLP and Sentiment Analysis operations to be carried out, with the consequent identification of any emergency situations within the message. I expose the advantages granted by the development and use of Natural Language Processing and Sentiment Analysis techniques in the business environment. I also present the possible future developments in which it is possible to involve the application, developed for this thesis, through customization with respect to the objective classification or for the creation of a starting dataset for the training of learning models, to be submitted to experts to verify the correctness of the forecasts. In conclusion, this thesis concerned a topic of crucial importance for IT companies that develop products for the world of healthcare interested in enhancing and improving the quality of messaging between patient and doctor through the use of modern Natural Language Processing solutions.

Questa tesi riguarda i metodi e le tecnologie utilizzate all’interno degli algoritmi che si occupano di Natural Language Processing (NLP), materia di studio e ricerca a cui stanno attingendo sempre più aziende, nello scenario globale, al fine di sviluppare soluzioni all’avanguardia per risolvere situazioni di varia natura. Questo progetto è nato da un’attività di tirocinio in collaborazione con Air Bag Studio, un’azienda di Ascoli Piceno, in cui sono state approfondite le tecniche più usate nel panorama del NLP e della Sentiment Analysis. L’obiettivo consiste nel creare un applicativo che metta in pratica tali meccanismi in ambito medico-sanitario, in particolare nell’analisi di una conversazione, attraverso un’applicazione di messaggistica, tra un medico e il proprio paziente in cura. In tale scenario è possibile incorrere in situazioni urgenti che necessitino di un intervento immediato da parte del medico ed è fondamentale, in caso di messaggistica asincrona, che l’applicazione sia in grado di determinare i sentimenti o le emozioni trasmessi dal messaggio. Descrivo la nascita delle prime tecniche di Natural Language Processing e il loro successivo sviluppo, attraverso l’Intelligenza Artificiale e il Machine Learning, fino alle tecniche più moderne ed attuali che permettono di eseguire la Sentiment Analysis. Analizzo le differenze tra i vari algoritmi di apprendimento automatico esistenti, descrivendo le due tipologie di apprendimento: Supervisionato (Supervised) e Non Supervisionato (Unsupervised). Presento ed esamino le diverse soluzioni proposte dai grandi player del mercato globale e quelle Open-Source disponibili gratuitamente in rete. Descrivo, successivamente, il programma che ho sviluppato in tutte le fasi di progettazione e sviluppo, a partire dall’analisi dello scenario e dei dati coinvolti, proseguendo con la descrizione delle librerie inserite nel software e confrontando i risultati di tali scelte con quelli ottenuti dagli algoritmi di Machine Learning classici, al fine di identificare il metodo migliore per portare avanti la Sentiment Analysis. Presento i codici sviluppati, ponendo particolare attenzione sulle funzioni che li compongono e sul modo in cui gestisco e analizzo i dati, per permettere di effettuare le operazioni di NLP e Sentiment Analysis, con la conseguente individuazione di eventuali situazioni emergenziali all’interno del messaggio. Espongo i vantaggi concessi dallo sviluppo e dall’utilizzo di tecniche di Natural Language Processing e Sentiment Analysis in ambito aziendale. Presento, inoltre, i possibili sviluppi futuri in cui è possibile coinvolgere l’applicativo, sviluppato per questa tesi, tramite la personalizzazione rispetto alla classificazione obiettivo oppure per la creazione di un dataset di partenza per l’addestramento dei modelli di apprendimento, da sottoporre a degli esperti per verificare la correttezza delle previsioni. In conclusione, questa tesi ha riguardato un tema di cruciale importanza per le aziende informatiche che sviluppano prodotti per il mondo della sanità interessate a potenziare e migliorare la qualità della messaggistica tra paziente e medico mediante l’utilizzo di soluzioni moderne di Natural Language Processing.

Compilatori senzienti: un esempio applicativo di Sentiment Analysis nell’elaborazione del linguaggio naturale

GIOSTRA, FRANCESCO
2021/2022

Abstract

This thesis concerns the methods and technologies used within the algorithms that deal with Natural Language Processing (NLP), a subject of study and research to which more and more companies are drawing, in the global scenario, in order to develop cutting-edge solutions to solve situations of various kinds. This project was born from an internship activity in collaboration with Air Bag Studio, a company from Ascoli Piceno, in which the most used techniques in the NLP and Sentiment Analysis panorama were deepened. The goal is to create an application that puts into practice these mechanisms in the medical-health field, in particular in the analysis of a conversation, through a messaging application, between a doctor and his patient in care. In this scenario it is possible to run into urgent situations that require immediate intervention by the physician and it is essential, in case of asynchronous messaging, that the application is able to determine the feelings or emotions transmitted by the message. I describe the birth of the first Natural Language Processing techniques and their subsequent development, through Artificial Intelligence and Machine Learning, up to the most modern and current techniques that allow to perform Sentiment Analysis. I analyze the differences between the various existing machine learning algorithms, describing the two types of learning: Supervised and Unsupervised. I present and examine the different solutions proposed by the big players in the global market and the Open-Source ones available for free on the net. I describe, subsequently, the program that I developed in all phases of design and development, starting from the analysis of the scenario and the data involved, continuing with the description of the libraries included in the software and comparing the results of these choices with those obtained by the classic Machine Learning algorithms, in order to identify the best method to carry out the Sentiment Analysis. I present the developed codes, paying particular attention to the functions that compose them and the way in which I manage and analyze the data, to allow NLP and Sentiment Analysis operations to be carried out, with the consequent identification of any emergency situations within the message. I expose the advantages granted by the development and use of Natural Language Processing and Sentiment Analysis techniques in the business environment. I also present the possible future developments in which it is possible to involve the application, developed for this thesis, through customization with respect to the objective classification or for the creation of a starting dataset for the training of learning models, to be submitted to experts to verify the correctness of the forecasts. In conclusion, this thesis concerned a topic of crucial importance for IT companies that develop products for the world of healthcare interested in enhancing and improving the quality of messaging between patient and doctor through the use of modern Natural Language Processing solutions.
2021
2022-10-21
Sentient compilers: an application example of Sentiment Analysis in natural language processing
Questa tesi riguarda i metodi e le tecnologie utilizzate all’interno degli algoritmi che si occupano di Natural Language Processing (NLP), materia di studio e ricerca a cui stanno attingendo sempre più aziende, nello scenario globale, al fine di sviluppare soluzioni all’avanguardia per risolvere situazioni di varia natura. Questo progetto è nato da un’attività di tirocinio in collaborazione con Air Bag Studio, un’azienda di Ascoli Piceno, in cui sono state approfondite le tecniche più usate nel panorama del NLP e della Sentiment Analysis. L’obiettivo consiste nel creare un applicativo che metta in pratica tali meccanismi in ambito medico-sanitario, in particolare nell’analisi di una conversazione, attraverso un’applicazione di messaggistica, tra un medico e il proprio paziente in cura. In tale scenario è possibile incorrere in situazioni urgenti che necessitino di un intervento immediato da parte del medico ed è fondamentale, in caso di messaggistica asincrona, che l’applicazione sia in grado di determinare i sentimenti o le emozioni trasmessi dal messaggio. Descrivo la nascita delle prime tecniche di Natural Language Processing e il loro successivo sviluppo, attraverso l’Intelligenza Artificiale e il Machine Learning, fino alle tecniche più moderne ed attuali che permettono di eseguire la Sentiment Analysis. Analizzo le differenze tra i vari algoritmi di apprendimento automatico esistenti, descrivendo le due tipologie di apprendimento: Supervisionato (Supervised) e Non Supervisionato (Unsupervised). Presento ed esamino le diverse soluzioni proposte dai grandi player del mercato globale e quelle Open-Source disponibili gratuitamente in rete. Descrivo, successivamente, il programma che ho sviluppato in tutte le fasi di progettazione e sviluppo, a partire dall’analisi dello scenario e dei dati coinvolti, proseguendo con la descrizione delle librerie inserite nel software e confrontando i risultati di tali scelte con quelli ottenuti dagli algoritmi di Machine Learning classici, al fine di identificare il metodo migliore per portare avanti la Sentiment Analysis. Presento i codici sviluppati, ponendo particolare attenzione sulle funzioni che li compongono e sul modo in cui gestisco e analizzo i dati, per permettere di effettuare le operazioni di NLP e Sentiment Analysis, con la conseguente individuazione di eventuali situazioni emergenziali all’interno del messaggio. Espongo i vantaggi concessi dallo sviluppo e dall’utilizzo di tecniche di Natural Language Processing e Sentiment Analysis in ambito aziendale. Presento, inoltre, i possibili sviluppi futuri in cui è possibile coinvolgere l’applicativo, sviluppato per questa tesi, tramite la personalizzazione rispetto alla classificazione obiettivo oppure per la creazione di un dataset di partenza per l’addestramento dei modelli di apprendimento, da sottoporre a degli esperti per verificare la correttezza delle previsioni. In conclusione, questa tesi ha riguardato un tema di cruciale importanza per le aziende informatiche che sviluppano prodotti per il mondo della sanità interessate a potenziare e migliorare la qualità della messaggistica tra paziente e medico mediante l’utilizzo di soluzioni moderne di Natural Language Processing.
File in questo prodotto:
File Dimensione Formato  
Tesi Giostra Francesco - Compilatori senzienti - un esempio applicativo di Sentiment Analysis nell’elaborazione del linguaggio naturale.pdf

non disponibili

Descrizione: Tesi di Laurea Giostra Francesco - Compilatori senzienti: un esempio applicativo di Sentiment Analysis nell’elaborazione del linguaggio naturale
Dimensione 1.29 MB
Formato Adobe PDF
1.29 MB Adobe PDF

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.12075/10390