The analysis of people's comments on social platforms is a widely investigated topic because comments represent the place where people show their spontaneity most clearly. In this thesis, we show a network-based data structure and a related approach to represent and manage the underlying semantics of a set of comments. Our approach is based on the extraction of text patterns that take into account not only the frequency but also the usefulness, of the analyzed comments. The data structure and approach are ``multi-dimensional'' and ``holistic'', because they can simultaneously handle multiple ways of capturing content semantics. They are also easily extensible, in the sense that additional ways of capturing content semantics can be easily added to them. Finally, our approach can evaluate the semantic similarity of two sets of comments. In this thesis, we also illustrate the results of several tests we conducted on Reddit comments, even if our approach can be applied to any social platform.

L'analisi dei commenti delle persone in una piattaforma social è un argomento ampiamente studiato perchè i commenti rappresentano il luogo in cui le persone manifestano più chiaramente la loro spontaneità. In questa tesi mostriamo una struttura basata sul concetto di rete e un approccio correlato per rappresentare e gestire la semantica sottostante ad un insieme di commenti. Il nostro approccio si basa sull'estrazione di pattern testuali che tengono conto non solo della frequenza ma anche dell'utilità dei commenti analizzati. La struttura dei dati e l'approccio sono ``multidimensionali'' e ``olistici'', nel senso che possono gestire simultaneamente più modi di catturare la semantica dei contenuti. Sono anche facilmente estensibili, nel senso che possono essere facilmente aggiunti altri modi di catturare la semantica dei contenuti. Infine, il nostro approccio è in grado di valutare la somiglianza semantica di due insiemi di commenti. In questa tesi, illustriamo, anche, i risultati di diversi test che abbiamo condotto sui commenti di Reddit, anche se il nostro approccio può essere applicato a qualsiasi piattaforma sociale.

Rappresentazione, estrazione e utilizzo della semantica dei contenuti di commenti in una piattaforma sociale

MARCHETTI, MICHELE
2020/2021

Abstract

L'analisi dei commenti delle persone in una piattaforma social è un argomento ampiamente studiato perchè i commenti rappresentano il luogo in cui le persone manifestano più chiaramente la loro spontaneità. In questa tesi mostriamo una struttura basata sul concetto di rete e un approccio correlato per rappresentare e gestire la semantica sottostante ad un insieme di commenti. Il nostro approccio si basa sull'estrazione di pattern testuali che tengono conto non solo della frequenza ma anche dell'utilità dei commenti analizzati. La struttura dei dati e l'approccio sono ``multidimensionali'' e ``olistici'', nel senso che possono gestire simultaneamente più modi di catturare la semantica dei contenuti. Sono anche facilmente estensibili, nel senso che possono essere facilmente aggiunti altri modi di catturare la semantica dei contenuti. Infine, il nostro approccio è in grado di valutare la somiglianza semantica di due insiemi di commenti. In questa tesi, illustriamo, anche, i risultati di diversi test che abbiamo condotto sui commenti di Reddit, anche se il nostro approccio può essere applicato a qualsiasi piattaforma sociale.
2020
2021-07-16
Representation, detection and usage of the content semantics of comments in a social platform
The analysis of people's comments on social platforms is a widely investigated topic because comments represent the place where people show their spontaneity most clearly. In this thesis, we show a network-based data structure and a related approach to represent and manage the underlying semantics of a set of comments. Our approach is based on the extraction of text patterns that take into account not only the frequency but also the usefulness, of the analyzed comments. The data structure and approach are ``multi-dimensional'' and ``holistic'', because they can simultaneously handle multiple ways of capturing content semantics. They are also easily extensible, in the sense that additional ways of capturing content semantics can be easily added to them. Finally, our approach can evaluate the semantic similarity of two sets of comments. In this thesis, we also illustrate the results of several tests we conducted on Reddit comments, even if our approach can be applied to any social platform.
File in questo prodotto:
File Dimensione Formato  
Frontespizio Michele Marchetti FIRMATO.pdf

embargo fino al 16/07/2023

Descrizione: Frontespizio firmato Tesi di Laurea Magistrale Michele Marchetti - A.A. 2020/2021 - Sessione Luglio2021
Dimensione 254.97 kB
Formato Adobe PDF
254.97 kB Adobe PDF
Tesi_Michele_Marchetti_Luglio_2021.pdf

embargo fino al 16/07/2023

Descrizione: Tesi di Laurea Magistrale di Michele Marchetti - A.A. 2020/2021 - Sessione Luglio 2021
Dimensione 1.32 MB
Formato Adobe PDF
1.32 MB Adobe PDF

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.12075/1492