While this thesis presents a scalable and interpretable framework for fraud detec tion using exploratory data analysis (EDA), anomaly heuristics, and visual analytics applied to a synthetic dataset of 50,000 financial transactions, the methodology integrates domain specific heuristics, most notably the Hard Anomaly flag, to identify suspicious behavior based on transaction amount, risk score, and failure history. Temporal, geospatial, device-level and behavioral profiling techniques are employed to uncover patterns of fraud across time zones, merchant categories, and user platforms. Clustering methods further segment transaction behavior, revealing distinct risk profiles and supporting operational insights. The visual analytics system enables transparent, reproducible fraud detection without reliance on black-box models, making it suitable for real world deployment in compliance-sensitivity environments. Results demonstrate that combining rule-based anomaly detection with multidimen sional visualization yields actionable insights and supports hypothesis generation for fraud analysts. The main goal is to argue the importance of Exploratory Data Analysis as a first step in Fraud detection. It shows the methodologies of EDA that can be deployed to sensor data and detect fraud without relying on untrustworthy labels.
Sebbene questa tesi presenti un quadro scalabile e interpretabile per la rilevazione delle frodi zione utilizzando l'analisi esplorativa dei dati (EDA), l'euristica delle anomalie e l'analisi visiva applicata a un set di dati sintetici di 50.000 transazioni finanziarie, la metodologia integra euristiche specifiche del dominio, in particolare il flag Hard Anomaly, per identificare comportamento sospetto basato sull'importo della transazione, sul punteggio di rischio e sulla cronologia dei guasti. Vengono impiegate tecniche di profilazione temporale, geospaziale, a livello di dispositivo e comportamentale per scopri modelli di frode nei fusi orari, nelle categorie di commercianti e nelle piattaforme degli utenti. I metodi di clustering segmentano ulteriormente il comportamento delle transazioni, rivelando un rischio distinto profili e approfondimenti operativi di supporto. Il sistema di analisi visiva consente rilevamento delle frodi trasparente e riproducibile senza fare affidamento su modelli black-box, rendendolo adatto all'implementazione nel mondo reale in ambienti sensibili alla conformità. I risultati dimostrano che la combinazione del rilevamento delle anomalie basato su regole con il multidimen la visualizzazione sionale produce informazioni fruibili e supporta la generazione di ipotesi per analisti di frodi. L'obiettivo principale è sostenere l'importanza dei dati esplorativi Analisi come primo passo nell'individuazione delle frodi. Mostra le metodologie dell'EDA che può essere distribuito per rilevare i dati dei sensori e rilevare le frodi senza fare affidamento su dati inaffidabili etichette.
VISUALIZING SUSPICION: EXPLORATORY TECHNIQUES FOR FRAUD ANALYTICS IN R
KALULE, MARK NICE
2024/2025
Abstract
While this thesis presents a scalable and interpretable framework for fraud detec tion using exploratory data analysis (EDA), anomaly heuristics, and visual analytics applied to a synthetic dataset of 50,000 financial transactions, the methodology integrates domain specific heuristics, most notably the Hard Anomaly flag, to identify suspicious behavior based on transaction amount, risk score, and failure history. Temporal, geospatial, device-level and behavioral profiling techniques are employed to uncover patterns of fraud across time zones, merchant categories, and user platforms. Clustering methods further segment transaction behavior, revealing distinct risk profiles and supporting operational insights. The visual analytics system enables transparent, reproducible fraud detection without reliance on black-box models, making it suitable for real world deployment in compliance-sensitivity environments. Results demonstrate that combining rule-based anomaly detection with multidimen sional visualization yields actionable insights and supports hypothesis generation for fraud analysts. The main goal is to argue the importance of Exploratory Data Analysis as a first step in Fraud detection. It shows the methodologies of EDA that can be deployed to sensor data and detect fraud without relying on untrustworthy labels.| File | Dimensione | Formato | |
|---|---|---|---|
|
Visualizing_Suspicion__Exploratory_Techniques_for_Fraud_Analytics_in_R__Copy_ (1).pdf
embargo fino al 13/02/2029
Dimensione
1.15 MB
Formato
Adobe PDF
|
1.15 MB | Adobe PDF |
I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/20.500.12075/24967