Rappresentazione, estrazione e utilizzo della semantica dei contenuti di commenti in una piattaforma sociale

The analysis of people's comments on social platforms is a widely investigated topic because comments represent the place where people show their spontaneity most clearly. In this thesis, we show a network-based data structure and a related approach to represent and manage the underlying semantics of a set of comments. Our approach is based on the extraction of text patterns that take into account not only the frequency but also the usefulness, of the analyzed comments. The data structure and approach are ``multi-dimensional'' and ``holistic'', because they can simultaneously handle multiple ways of capturing content semantics. They are also easily extensible, in the sense that additional ways of capturing content semantics can be easily added to them. Finally, our approach can evaluate the semantic similarity of two sets of comments. In this thesis, we also illustrate the results of several tests we conducted on Reddit comments, even if our approach can be applied to any social platform.

L'analisi dei commenti delle persone in una piattaforma social è un argomento ampiamente studiato perchè i commenti rappresentano il luogo in cui le persone manifestano più chiaramente la loro spontaneità. In questa tesi mostriamo una struttura basata sul concetto di rete e un approccio correlato per rappresentare e gestire la semantica sottostante ad un insieme di commenti. Il nostro approccio si basa sull'estrazione di pattern testuali che tengono conto non solo della frequenza ma anche dell'utilità dei commenti analizzati. La struttura dei dati e l'approccio sono ``multidimensionali'' e ``olistici'', nel senso che possono gestire simultaneamente più modi di catturare la semantica dei contenuti. Sono anche facilmente estensibili, nel senso che possono essere facilmente aggiunti altri modi di catturare la semantica dei contenuti. Infine, il nostro approccio è in grado di valutare la somiglianza semantica di due insiemi di commenti. In questa tesi, illustriamo, anche, i risultati di diversi test che abbiamo condotto sui commenti di Reddit, anche se il nostro approccio può essere applicato a qualsiasi piattaforma sociale.

Rappresentazione, estrazione e utilizzo della semantica dei contenuti di commenti in una piattaforma sociale

MARCHETTI, MICHELE

2020/2021

Abstract

The analysis of people's comments on social platforms is a widely investigated topic because comments represent the place where people show their spontaneity most clearly. In this thesis, we show a network-based data structure and a related approach to represent and manage the underlying semantics of a set of comments. Our approach is based on the extraction of text patterns that take into account not only the frequency but also the usefulness, of the analyzed comments. The data structure and approach are ``multi-dimensional'' and ``holistic'', because they can simultaneously handle multiple ways of capturing content semantics. They are also easily extensible, in the sense that additional ways of capturing content semantics can be easily added to them. Finally, our approach can evaluate the semantic similarity of two sets of comments. In this thesis, we also illustrate the results of several tests we conducted on Reddit comments, even if our approach can be applied to any social platform.

Scheda breve

Scheda completa

Scheda completa (DC)

	Facoltà/Dipartimento
	
				Dipartimento Ingegneria dell'Informazione
			
	Corso di studio
	
				INGEGNERIA INFORMATICA E DELL'AUTOMAZIONE
			
	Anno Accademico
	
				2020
			
	Data dell'esame finale
	
				2021-07-16
			
	Titolo inglese
	
				Representation, detection and usage of the content semantics of comments in a social platform
			
	Abstract in italiano
	
				L'analisi dei commenti delle persone in una piattaforma social è un argomento ampiamente studiato perchè i commenti rappresentano il luogo in cui le persone manifestano più chiaramente la loro spontaneità. In questa tesi mostriamo una struttura basata sul concetto di rete e un approccio correlato per rappresentare e gestire la semantica sottostante ad un insieme di commenti. Il nostro approccio si basa sull'estrazione di pattern testuali che tengono conto non solo della frequenza ma anche dell'utilità dei commenti analizzati. La struttura dei dati e l'approccio sono ``multidimensionali'' e ``olistici'', nel senso che possono gestire simultaneamente più modi di catturare la semantica dei contenuti. Sono anche facilmente estensibili, nel senso che possono essere facilmente aggiunti altri modi di catturare la semantica dei contenuti. Infine, il nostro approccio è in grado di valutare la somiglianza semantica di due insiemi di commenti. In questa tesi, illustriamo, anche, i risultati di diversi test che abbiamo condotto sui commenti di Reddit, anche se il nostro approccio può essere applicato a qualsiasi piattaforma sociale.
			
	Relatore
	
				URSINO, DOMENICO
			
	Correlatore
	
				VIRGILI, LUCA
			
	Appare nelle tipologie:
	
				Laurea specialistica, magistrale, ciclo unico

File in questo prodotto:

File	Dimensione	Formato
Tesi_Michele_Marchetti_Luglio_2021.pdf Open Access dal 17/07/2023 Descrizione: Tesi di Laurea Magistrale di Michele Marchetti - A.A. 2020/2021 - Sessione Luglio 2021 Dimensione 1.32 MB Formato Adobe PDF Visualizza/Apri	1.32 MB	Adobe PDF	Visualizza/Apri

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.12075/1492