Artificial intelligence is a branch that deals with systems capable of mimicking the intelligence and learning of the human brain. Machine learning is a branch of artificial intelligence that deals with creating systems capable of learning and improving their performance based on usage data. In the clinical field, efforts have been made for some time to assist the diagnosis of doctors with machine learning and artificial intelligence systems. In the case of heart diseases, such as heart failure, it is very difficult to get a timely diagnosis; for this, the aim is to automate serial electrocardiography in order to obtain a reliable diagnosis based on the variations in the values ​​of the features obtained from the comparison of two electrocardiographic traces. Therefore, the purpose of this thesis is to compare the results obtained from the automation of decision-making processes on the presence of the disease with those obtained, working on the same data, from the world of statistics to verify the reliability of these systems and possibly their efficiency and their proximity to a clinician's way of thinking. The heart is a very complex organ and is critical to its blood pumping role. It is the real engine of our body because it allows blood to reach the whole body through the contraction and relaxation of its four cavities. The actions of contraction and relaxation of the cavities are due to the depolarization and repolarization of the heart cells caused by an electrical activity that starts from the sinoatrial node and spreads to all the nerves surrounding the heart muscle tissue. Heart failure is a disease that occurs when the electrical system does not behave normally and therefore, by not allowing the correct muscle contraction of the heart, the necessary blood emission from the heart within the cardiovascular system does not occur. This pathology must be diagnosed and treated before causing the patient to suffer irreversible damage. For the diagnosis of this pathology it is therefore possible to use machine learning algorithms capable of interpreting the predictions made by neural networks which have the purpose of analyzing the variations in the values ​​of the features obtained from the electrocardiograms and based on these to define if a patient is affected. or not from heart failure. These algorithms, during this study, were used on a database composed of characteristics deriving from the electrocardiograms carried out on patients affected by myocardial infarction. Some of these patients had heart failure, others did not. The database therefore consists of features deriving from the difference between two electrocardiograms for each patient and subsequently converted into vectorcardiograms. It is necessary to know how neural networks reason and arrive at predictions to know if these methods reflect the decision that a cardiologist would make when comparing the various electrocardiographic traces. The results and the reliability of the networks can be compared with data obtained from classical statistics through an analysis on the same data and then go to check if the two methods are comparable and which of the two represents and is closest to the choice of a cardiologist. . As regards the methodology with which this comparison was carried out, the data deriving from the database were taken and used to calculate the P-value and the area under the curve (AUC) of the receiver operating characteristics (ROC). Subsequently these were compared with the feature relevance (FR) calculated from the information obtained by a machine learning algorithm with which the prediction of the neural network used in the study was interpreted.

L’intelligenza artificiale è una branca che si occupa di sistemi in grado di imitare l’intelligenza e l’apprendimento del cervello umano. Il machine learning è una branca dell’intelligenza artificiale che si occupa di creare sistemi in grado di apprendere e migliorare le loro prestazioni in base ai dati di utilizzo. Nell’ambito clinico da tempo si cerca di coadiuvare la diagnosi dei medici con i sistemi di machine learning e intelligenza artificiale. Nel caso di patologie cardiache, come lo scompenso cardiaco, è molto difficile ottenere una diagnosi tempestiva; per questo, si mira ad automatizzare l’elettrocardiografia seriale in modo da ottenere una diagnosi attendibile sulla base delle variazioni dei valori delle features ricavate dal confronto di due tracciati elettrocardiografici. Quindi, lo scopo di questa tesi è quello di andare a confrontare i risultati che si ottengono dall’automatizzazione dei processi decisionali sulla presenza della malattia con quelli che si ottengono, lavorando sugli stessi dati, dal mondo della statistica per verificare l’affidabilità di tali sistemi ed eventualmente la loro efficienza e la loro vicinanza al modo di ragionare di un clinico. Il cuore è un organo molto complesso ed è fondamentale per il suo ruolo di pompaggio del sangue. È il vero e proprio motore del nostro corpo perché permette al sangue di arrivare in tutto il corpo tramite la contrazione e il rilassamento delle sue quattro cavità. Le azioni di contrazione e rilassamento delle cavità sono dovute alla depolarizzazione e la ripolarizzazione delle cellule del cuore provocate da un’attività elettrica che parte dal nodo seno atriale e si diffonde per tutti i nervi che circondano il tessuto muscolare cardiaco. Lo scompenso cardiaco è una patologia che si verifica quando il sistema elettrico non si comporta normalmente e quindi, non permettendo la corretta contrazione muscolare del cuore, non avviene l’emissione di sangue necessaria da parte del cuore all’interno del sistema cardiocircolatorio. Questa patologia deve essere diagnosticata e curata prima di portare il paziente a subire danni irreversibili. Per la diagnosi di tale patologia è dunque possibile utilizzare algoritmi di machine learning in grado di interpretare le predizioni fatte da reti neurali che hanno lo scopo di analizzare le variazioni dei valori delle features ottenute dagli elettrocardiogrammi ed in base a queste definire se un paziente è affetto o meno da scompenso cardiaco. Tali algoritmi, durante questo studio, sono stati utilizzati su un database composto da caratteristiche derivanti dagli elettrocardiogrammi effettuati su pazienti colpiti da infarto del miocardio. Alcuni di questi pazienti avevano lo scompenso cardiaco, altri no. Il database si compone quindi di features derivanti dalla differenza tra due elettrocardiogrammi per ogni paziente e successivamente convertiti in vettorcardiogrammi. È necessario sapere come le reti neurali ragionano ed arrivano alle predizioni per sapere se tali metodi rispecchiano la decisione che avrebbe un cardiologo andando a confrontare i vari tracciati elettrocardiografici. I risultati e l’affidabilità delle reti possono essere confrontati con dati ottenuti dalla statistica classica tramite un’analisi sugli stessi dati per poi andare a verificare se i due metodi sono confrontabili e quali dei due rappresenta e si avvicina di più alla scelta di un cardiologo. Per quanto riguarda la metodologia con la quale è stato svolto questo confronto, sono stati presi i dati derivanti dal database e sono stati utilizzati per il calcolo di P-value e delle area under the curve (AUC) delle receiver operating characteristic (ROC). Successivamente questi sono stati confrontati con le feature relevance (FR) calcolate dalle informazioni ottenute da un algoritmo di machine learning con il quale si è interpretata la predizione della rete neurale utilizzata nello studio.

UTILIZZO DELLE CARATTERISTICHE ELETTROCARDIOGRAFICHE PER L’IDENTIFICAZIONE AUTOMATICA DELLO SCOMPENSO CARDIACO: STATISTICA TRADIZIONALE VS MACHINE LEARNING.

PETRELLA, ANTONIO
2021/2022

Abstract

Artificial intelligence is a branch that deals with systems capable of mimicking the intelligence and learning of the human brain. Machine learning is a branch of artificial intelligence that deals with creating systems capable of learning and improving their performance based on usage data. In the clinical field, efforts have been made for some time to assist the diagnosis of doctors with machine learning and artificial intelligence systems. In the case of heart diseases, such as heart failure, it is very difficult to get a timely diagnosis; for this, the aim is to automate serial electrocardiography in order to obtain a reliable diagnosis based on the variations in the values ​​of the features obtained from the comparison of two electrocardiographic traces. Therefore, the purpose of this thesis is to compare the results obtained from the automation of decision-making processes on the presence of the disease with those obtained, working on the same data, from the world of statistics to verify the reliability of these systems and possibly their efficiency and their proximity to a clinician's way of thinking. The heart is a very complex organ and is critical to its blood pumping role. It is the real engine of our body because it allows blood to reach the whole body through the contraction and relaxation of its four cavities. The actions of contraction and relaxation of the cavities are due to the depolarization and repolarization of the heart cells caused by an electrical activity that starts from the sinoatrial node and spreads to all the nerves surrounding the heart muscle tissue. Heart failure is a disease that occurs when the electrical system does not behave normally and therefore, by not allowing the correct muscle contraction of the heart, the necessary blood emission from the heart within the cardiovascular system does not occur. This pathology must be diagnosed and treated before causing the patient to suffer irreversible damage. For the diagnosis of this pathology it is therefore possible to use machine learning algorithms capable of interpreting the predictions made by neural networks which have the purpose of analyzing the variations in the values ​​of the features obtained from the electrocardiograms and based on these to define if a patient is affected. or not from heart failure. These algorithms, during this study, were used on a database composed of characteristics deriving from the electrocardiograms carried out on patients affected by myocardial infarction. Some of these patients had heart failure, others did not. The database therefore consists of features deriving from the difference between two electrocardiograms for each patient and subsequently converted into vectorcardiograms. It is necessary to know how neural networks reason and arrive at predictions to know if these methods reflect the decision that a cardiologist would make when comparing the various electrocardiographic traces. The results and the reliability of the networks can be compared with data obtained from classical statistics through an analysis on the same data and then go to check if the two methods are comparable and which of the two represents and is closest to the choice of a cardiologist. . As regards the methodology with which this comparison was carried out, the data deriving from the database were taken and used to calculate the P-value and the area under the curve (AUC) of the receiver operating characteristics (ROC). Subsequently these were compared with the feature relevance (FR) calculated from the information obtained by a machine learning algorithm with which the prediction of the neural network used in the study was interpreted.
2021
2022-07-21
USE OF ELECTROCARDIOGRAPHIC CHARACTERISTICS FOR AUTOMATIC IDENTIFICATION OF CARDIAC DECOMPENSATION: TRADITIONAL STATISTICS VS MACHINE LEARNING.
L’intelligenza artificiale è una branca che si occupa di sistemi in grado di imitare l’intelligenza e l’apprendimento del cervello umano. Il machine learning è una branca dell’intelligenza artificiale che si occupa di creare sistemi in grado di apprendere e migliorare le loro prestazioni in base ai dati di utilizzo. Nell’ambito clinico da tempo si cerca di coadiuvare la diagnosi dei medici con i sistemi di machine learning e intelligenza artificiale. Nel caso di patologie cardiache, come lo scompenso cardiaco, è molto difficile ottenere una diagnosi tempestiva; per questo, si mira ad automatizzare l’elettrocardiografia seriale in modo da ottenere una diagnosi attendibile sulla base delle variazioni dei valori delle features ricavate dal confronto di due tracciati elettrocardiografici. Quindi, lo scopo di questa tesi è quello di andare a confrontare i risultati che si ottengono dall’automatizzazione dei processi decisionali sulla presenza della malattia con quelli che si ottengono, lavorando sugli stessi dati, dal mondo della statistica per verificare l’affidabilità di tali sistemi ed eventualmente la loro efficienza e la loro vicinanza al modo di ragionare di un clinico. Il cuore è un organo molto complesso ed è fondamentale per il suo ruolo di pompaggio del sangue. È il vero e proprio motore del nostro corpo perché permette al sangue di arrivare in tutto il corpo tramite la contrazione e il rilassamento delle sue quattro cavità. Le azioni di contrazione e rilassamento delle cavità sono dovute alla depolarizzazione e la ripolarizzazione delle cellule del cuore provocate da un’attività elettrica che parte dal nodo seno atriale e si diffonde per tutti i nervi che circondano il tessuto muscolare cardiaco. Lo scompenso cardiaco è una patologia che si verifica quando il sistema elettrico non si comporta normalmente e quindi, non permettendo la corretta contrazione muscolare del cuore, non avviene l’emissione di sangue necessaria da parte del cuore all’interno del sistema cardiocircolatorio. Questa patologia deve essere diagnosticata e curata prima di portare il paziente a subire danni irreversibili. Per la diagnosi di tale patologia è dunque possibile utilizzare algoritmi di machine learning in grado di interpretare le predizioni fatte da reti neurali che hanno lo scopo di analizzare le variazioni dei valori delle features ottenute dagli elettrocardiogrammi ed in base a queste definire se un paziente è affetto o meno da scompenso cardiaco. Tali algoritmi, durante questo studio, sono stati utilizzati su un database composto da caratteristiche derivanti dagli elettrocardiogrammi effettuati su pazienti colpiti da infarto del miocardio. Alcuni di questi pazienti avevano lo scompenso cardiaco, altri no. Il database si compone quindi di features derivanti dalla differenza tra due elettrocardiogrammi per ogni paziente e successivamente convertiti in vettorcardiogrammi. È necessario sapere come le reti neurali ragionano ed arrivano alle predizioni per sapere se tali metodi rispecchiano la decisione che avrebbe un cardiologo andando a confrontare i vari tracciati elettrocardiografici. I risultati e l’affidabilità delle reti possono essere confrontati con dati ottenuti dalla statistica classica tramite un’analisi sugli stessi dati per poi andare a verificare se i due metodi sono confrontabili e quali dei due rappresenta e si avvicina di più alla scelta di un cardiologo. Per quanto riguarda la metodologia con la quale è stato svolto questo confronto, sono stati presi i dati derivanti dal database e sono stati utilizzati per il calcolo di P-value e delle area under the curve (AUC) delle receiver operating characteristic (ROC). Successivamente questi sono stati confrontati con le feature relevance (FR) calcolate dalle informazioni ottenute da un algoritmo di machine learning con il quale si è interpretata la predizione della rete neurale utilizzata nello studio.
File in questo prodotto:
File Dimensione Formato  
TESI ANTONIO PETRELLA.pdf

Open Access dal 23/01/2024

Descrizione: Tesi formato pdf/a
Dimensione 1.75 MB
Formato Adobe PDF
1.75 MB Adobe PDF Visualizza/Apri

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.12075/9571