The analysis of people's comments on social platforms is a widely investigated topic because comments represent the place where people show their spontaneity most clearly. In this thesis, we show a network-based data structure and a related approach to represent and manage the underlying semantics of a set of comments. Our approach is based on the extraction of text patterns that take into account not only the frequency but also the usefulness, of the analyzed comments. The data structure and approach are ``multi-dimensional'' and ``holistic'', because they can simultaneously handle multiple ways of capturing content semantics. They are also easily extensible, in the sense that additional ways of capturing content semantics can be easily added to them. Finally, our approach can evaluate the semantic similarity of two sets of comments. In this thesis, we also illustrate the results of several tests we conducted on Reddit comments, even if our approach can be applied to any social platform.

L'analisi dei commenti delle persone in una piattaforma social è un argomento ampiamente studiato perchè i commenti rappresentano il luogo in cui le persone manifestano più chiaramente la loro spontaneità. In questa tesi mostriamo una struttura basata sul concetto di rete e un approccio correlato per rappresentare e gestire la semantica sottostante ad un insieme di commenti. Il nostro approccio si basa sull'estrazione di pattern testuali che tengono conto non solo della frequenza ma anche dell'utilità dei commenti analizzati. La struttura dei dati e l'approccio sono ``multidimensionali'' e ``olistici'', nel senso che possono gestire simultaneamente più modi di catturare la semantica dei contenuti. Sono anche facilmente estensibili, nel senso che possono essere facilmente aggiunti altri modi di catturare la semantica dei contenuti. Infine, il nostro approccio è in grado di valutare la somiglianza semantica di due insiemi di commenti. In questa tesi, illustriamo, anche, i risultati di diversi test che abbiamo condotto sui commenti di Reddit, anche se il nostro approccio può essere applicato a qualsiasi piattaforma sociale.

Rappresentazione, estrazione e utilizzo della semantica dei contenuti di commenti in una piattaforma sociale

MARCHETTI, MICHELE
2020/2021

Abstract

The analysis of people's comments on social platforms is a widely investigated topic because comments represent the place where people show their spontaneity most clearly. In this thesis, we show a network-based data structure and a related approach to represent and manage the underlying semantics of a set of comments. Our approach is based on the extraction of text patterns that take into account not only the frequency but also the usefulness, of the analyzed comments. The data structure and approach are ``multi-dimensional'' and ``holistic'', because they can simultaneously handle multiple ways of capturing content semantics. They are also easily extensible, in the sense that additional ways of capturing content semantics can be easily added to them. Finally, our approach can evaluate the semantic similarity of two sets of comments. In this thesis, we also illustrate the results of several tests we conducted on Reddit comments, even if our approach can be applied to any social platform.
2020
2021-07-16
Representation, detection and usage of the content semantics of comments in a social platform
L'analisi dei commenti delle persone in una piattaforma social è un argomento ampiamente studiato perchè i commenti rappresentano il luogo in cui le persone manifestano più chiaramente la loro spontaneità. In questa tesi mostriamo una struttura basata sul concetto di rete e un approccio correlato per rappresentare e gestire la semantica sottostante ad un insieme di commenti. Il nostro approccio si basa sull'estrazione di pattern testuali che tengono conto non solo della frequenza ma anche dell'utilità dei commenti analizzati. La struttura dei dati e l'approccio sono ``multidimensionali'' e ``olistici'', nel senso che possono gestire simultaneamente più modi di catturare la semantica dei contenuti. Sono anche facilmente estensibili, nel senso che possono essere facilmente aggiunti altri modi di catturare la semantica dei contenuti. Infine, il nostro approccio è in grado di valutare la somiglianza semantica di due insiemi di commenti. In questa tesi, illustriamo, anche, i risultati di diversi test che abbiamo condotto sui commenti di Reddit, anche se il nostro approccio può essere applicato a qualsiasi piattaforma sociale.
File in questo prodotto:
File Dimensione Formato  
Tesi_Michele_Marchetti_Luglio_2021.pdf

Open Access dal 17/07/2023

Descrizione: Tesi di Laurea Magistrale di Michele Marchetti - A.A. 2020/2021 - Sessione Luglio 2021
Dimensione 1.32 MB
Formato Adobe PDF
1.32 MB Adobe PDF Visualizza/Apri

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.12075/1492