In recent years, the implementation and updating of machine learning models (such as neural networks, in this case) have fueled the common belief that these models can perform better than more traditional statistical models. This thesis aims to assess the hypothesis that a statistical model can be more efficient, if not more effective, than an advanced-level deep learning model. Specifically, the analysis will compare Facebook Prophet, an algorithm defined as an “additive decomposition” model, with an LSTM (Long Short-Term Memory) neural network, which has become a standard for the analysis of sequential data. The models are trained and evaluated using a real corporate dataset, with the goal of making three-month forecasts. The implementation involved testing various configurations to identify the optimal setup. The results obtained leave no doubt and open the door to significant reflections: The Prophet model was, in this case, quicker to implement and achieved a remarkable level of accuracy despite requiring less configuration and computational cost compared to the LSTM. The LSTM, despite numerous attempts at hyperparameter tuning and considerable training times, was unable to deliver satisfactory results, often being inferior to Prophet as well. This study thus validates the idea that a more complex and structured model is not always more efficient than a simpler or "lighter" model. It is important to clarify, however, that a neural network, to produce valid results, requires a vast amount of data and significant computational resources, with the risk of obtaining only marginally better results than a statistical model. The thesis empirically demonstrates how a simpler, more specialized approach in a specific sector can be the winning choice in certain contexts.
Sempre di più, negli ultimi anni, l’implementazione e l’aggiornamento di modelli di machine learning (come, in questo caso, delle reti neurali), ha aumentato il pensiero comune che questi modelli possano performare in maniera migliore rispetto a modelli statistici più tradizionali. Questa tesi tenterà di valutare l’ipotesi che un modello statistico possa essere più efficiente, se non addirittura più performante, di un modello di deep learning anche di livello avanzato. Nello specifico, l’analisi metterà a confronto Facebook Prophet, algoritmo definito “di scomposizione additiva”, ed una rete neurale LSTM (Long Short-Term Memory), eletta a standard di riferimento verso l’analisi di dati sequenziali. I modelli sono addestrati, quindi valutati, utilizzando un dataset aziendale reale, con l’obiettivo di effettuare previsioni a 3 mesi. L’implementazione è stata eseguita valutando svariate configurazioni alla ricerca del setting ideale. I risultati ottenuti non lasciano dubbi ed aprono la strada verso riflessioni significative: - Il modello Prophet è stato, in questo caso, più rapido da implementare ed ha raggiunto un livello di accuratezza notevole nonostante una configurazione ed un costo computazionale minore rispetto alla LSTM. - La LSTM, nonostante svariati tentativi di tuning di iperparametri e tempi di addestramento consistenti, non è stato in grado di fornire un risultato soddisfacente, restando spesso anche inferiore a Prophet. Lo studio quindi valida l’idea che non sempre un modello più complesso e strutturato possa essere più efficiente di un modello ritenuto più “leggero” o, banalmente, più “semplice”. È necessario comunque puntualizzare che una rete neurale, per fornire risultati ritenuti validi, necessiti di una enorme mole di dati nonché di risorse computazionali, con il rischio poi di ottenere risultati solo marginalmente superiore ad un modello statistico. La tesi dimostra in maniera empirica come un approccio più semplice e maggiorente specializzato in un determinato settore possa rappresentare, in specifici contesti, la scelta vincente.
Rilevamento anomalie nei report di Business Intelligence tramite Intelligenza Artificiale: un approccio proattivo per la gestione delle performances aziendali
GABRIELLI, EMIDIO
2024/2025
Abstract
In recent years, the implementation and updating of machine learning models (such as neural networks, in this case) have fueled the common belief that these models can perform better than more traditional statistical models. This thesis aims to assess the hypothesis that a statistical model can be more efficient, if not more effective, than an advanced-level deep learning model. Specifically, the analysis will compare Facebook Prophet, an algorithm defined as an “additive decomposition” model, with an LSTM (Long Short-Term Memory) neural network, which has become a standard for the analysis of sequential data. The models are trained and evaluated using a real corporate dataset, with the goal of making three-month forecasts. The implementation involved testing various configurations to identify the optimal setup. The results obtained leave no doubt and open the door to significant reflections: The Prophet model was, in this case, quicker to implement and achieved a remarkable level of accuracy despite requiring less configuration and computational cost compared to the LSTM. The LSTM, despite numerous attempts at hyperparameter tuning and considerable training times, was unable to deliver satisfactory results, often being inferior to Prophet as well. This study thus validates the idea that a more complex and structured model is not always more efficient than a simpler or "lighter" model. It is important to clarify, however, that a neural network, to produce valid results, requires a vast amount of data and significant computational resources, with the risk of obtaining only marginally better results than a statistical model. The thesis empirically demonstrates how a simpler, more specialized approach in a specific sector can be the winning choice in certain contexts.File | Dimensione | Formato | |
---|---|---|---|
Tesi Completa_pdfA.pdf
accesso aperto
Dimensione
2.05 MB
Formato
Adobe PDF
|
2.05 MB | Adobe PDF | Visualizza/Apri |
I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/20.500.12075/22861