This work investigates the possibility of forecasting the outcome of a peer-to-peer lending credit contract stipulated by the US financial firm Lending Club, by using 5 statistical models both Machine Learning and mainstream (Artificial NeuralNetworks, Support Vector Machine, Random Forest, Linear Discriminant Analysis and Logistic Regression). After one picture of peer-to-peer credit enviroment and the explanation of mathematical formulation of models, the thesis proposes an exploratory data analysis. In the last chapter the forecasting ability of the models is reviewed and relevant variables are identified: customer's income, credit score, revolving balance, installment and inquiries are the most relevant features. Random Forest overperforms other models in out of sample prediction.

Questo lavoro indaga la possibilità di prevedere l'esito di contratti di credito peer-to-peer lending stipulati dall'azienda Statunitense Lending Club utilizzando 5 modelli statistici di tipo Machine Learning e tradizionali (Reti Neurali, Macchine a Vettori di Supporto, Random Forest, Analisi Discriminante Lineare e Regressione Logistica). Dopo una descrizione del mondo del credito peer-to-peer e della formulazione matematica dei modelli utilizzati, si propone un'analisi esplorativa dei dati. In un capitolo finale si passa in rassegna la capacità predittiva dei modelli e si individuano le variabili maggiormente rilevanti: il reddito dei clienti, il punteggio di merito creditizio, l'ammontare dei debiti su carta di credito, l'importo della rata mensile e il numero di precedenti richieste di credito sono le variabili più importanti. Il modello Random Forest è il più valido nella previsione.

Insolvenze bancarie private: un approccio critico al machine learning

PIONATI, ALESSANDRO
2019/2020

Abstract

This work investigates the possibility of forecasting the outcome of a peer-to-peer lending credit contract stipulated by the US financial firm Lending Club, by using 5 statistical models both Machine Learning and mainstream (Artificial NeuralNetworks, Support Vector Machine, Random Forest, Linear Discriminant Analysis and Logistic Regression). After one picture of peer-to-peer credit enviroment and the explanation of mathematical formulation of models, the thesis proposes an exploratory data analysis. In the last chapter the forecasting ability of the models is reviewed and relevant variables are identified: customer's income, credit score, revolving balance, installment and inquiries are the most relevant features. Random Forest overperforms other models in out of sample prediction.
2019
2020-10-18
Personal bankruptcies: a critical approach to machine learning
Questo lavoro indaga la possibilità di prevedere l'esito di contratti di credito peer-to-peer lending stipulati dall'azienda Statunitense Lending Club utilizzando 5 modelli statistici di tipo Machine Learning e tradizionali (Reti Neurali, Macchine a Vettori di Supporto, Random Forest, Analisi Discriminante Lineare e Regressione Logistica). Dopo una descrizione del mondo del credito peer-to-peer e della formulazione matematica dei modelli utilizzati, si propone un'analisi esplorativa dei dati. In un capitolo finale si passa in rassegna la capacità predittiva dei modelli e si individuano le variabili maggiormente rilevanti: il reddito dei clienti, il punteggio di merito creditizio, l'ammontare dei debiti su carta di credito, l'importo della rata mensile e il numero di precedenti richieste di credito sono le variabili più importanti. Il modello Random Forest è il più valido nella previsione.
File in questo prodotto:
File Dimensione Formato  
TESI_Pionati.pdf

Open Access dal 18/10/2022

Descrizione: Insolvenze bancarie private: un approccio critico al Machine Learning
Dimensione 7.48 MB
Formato Adobe PDF
7.48 MB Adobe PDF Visualizza/Apri

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.12075/4462