La tesi affronta il tema dell'analisi e della visualizzazione dei dati sugli incidenti stradali in ambito urbano. A partire da un dataset relativo agli incidenti avvenuti nella città di Chicago, è stato inizialmente condotto un lavoro di valutazione della qualità dei dati, di modellazione relazionale in Oracle Database e di definizione delle viste dedicate alla pulizia, alla formattazione e all'aggregazione delle informazioni. Su queste basi, è stato sviluppato un applicativo web in Oracle APEX, organizzato in pagine con report e form, per la parte gestionale, e in pagine con dashboard tematiche filtrabili, per la visualizzazione facilitata e interattiva delle informazioni. In una fase successiva, i dati temporali degli incidenti sono stati impiegati per costruire un modello di analisi predittiva in un ambiente Python locale. Dopo un'introduzione teorica sui principali concetti di machine learning e di regressione su serie storiche, è stato implementato e valutato un modello di Random Forest Regressor, della libreria scikit-learn, per prevedere il conteggio settimanale degli incidenti. Nonostante i limiti dovuti ai vincoli dell'ambiente cloud e alle variabili disponibili, il lavoro mostra come sia possibile trasformare un dataset grezzo in un sistema integrato di gestione e visualizzazione dei dati, arricchito con analisi descrittive e predittive.
Analisi di dati su incidenti stradali: processi di elaborazione, visualizzazione e previsione tramite Oracle Apex e Python
CAPANCIONI, ALESSIA
2024/2025
Abstract
La tesi affronta il tema dell'analisi e della visualizzazione dei dati sugli incidenti stradali in ambito urbano. A partire da un dataset relativo agli incidenti avvenuti nella città di Chicago, è stato inizialmente condotto un lavoro di valutazione della qualità dei dati, di modellazione relazionale in Oracle Database e di definizione delle viste dedicate alla pulizia, alla formattazione e all'aggregazione delle informazioni. Su queste basi, è stato sviluppato un applicativo web in Oracle APEX, organizzato in pagine con report e form, per la parte gestionale, e in pagine con dashboard tematiche filtrabili, per la visualizzazione facilitata e interattiva delle informazioni. In una fase successiva, i dati temporali degli incidenti sono stati impiegati per costruire un modello di analisi predittiva in un ambiente Python locale. Dopo un'introduzione teorica sui principali concetti di machine learning e di regressione su serie storiche, è stato implementato e valutato un modello di Random Forest Regressor, della libreria scikit-learn, per prevedere il conteggio settimanale degli incidenti. Nonostante i limiti dovuti ai vincoli dell'ambiente cloud e alle variabili disponibili, il lavoro mostra come sia possibile trasformare un dataset grezzo in un sistema integrato di gestione e visualizzazione dei dati, arricchito con analisi descrittive e predittive.| File | Dimensione | Formato | |
|---|---|---|---|
|
Tesi_Alessia_Capancioni.pdf
accesso aperto
Descrizione: PDF/A della tesi completa e del frontespizio non firmato
Dimensione
8.89 MB
Formato
Adobe PDF
|
8.89 MB | Adobe PDF | Visualizza/Apri |
I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/20.500.12075/24659