The study deals with the application of the neural approach to the control of non-linear unstable systems. In this thesis it is demonstrated the effectiveness of using a multilayer neural network applied to the inverse pendulum control, where the goal of the task consists in learning to balance the pendulum with no a priori knowledge of the dynamics and, moreover, the only system response that is made available is a failure signal that occurs when the pendulum falls or when the cart hits the track limits. Two learning methods were used to solve this task: Reinforcement learning, and a prediction class method called "temporal difference".

Lo studio tratta l'applicazione dell'approccio neurale al controllo di sistemi instabili non lineari. In questa tesi viene dimostrata l'efficacia dell'utilizzo di una rete neurale multistrato applicata al controllo del pendolo inverso, dove il successo del compito consiste nell'imparare a bilanciare il pendolo non conoscendo a priori la dinamica del sistema e, inoltre, l'unica risposta del sistema che viene resa disponibile è un segnale di fallimento che si verifica quando il pendolo cade o quando il carrello urta i limiti della pista. Per risolvere questo compito sono stati utilizzati due metodi di apprendimento: apprendimento per rinforzo e un metodo della classe di predizione chiamata "differenze-temporali".

Simulazione numerica di un neurocontrollore applicato ad un pendolo inverso

SILLA, LUCIA
2021/2022

Abstract

The study deals with the application of the neural approach to the control of non-linear unstable systems. In this thesis it is demonstrated the effectiveness of using a multilayer neural network applied to the inverse pendulum control, where the goal of the task consists in learning to balance the pendulum with no a priori knowledge of the dynamics and, moreover, the only system response that is made available is a failure signal that occurs when the pendulum falls or when the cart hits the track limits. Two learning methods were used to solve this task: Reinforcement learning, and a prediction class method called "temporal difference".
2021
2022-07-21
Numerical simulation of a neurocontroller applied to an inverse pendulum
Lo studio tratta l'applicazione dell'approccio neurale al controllo di sistemi instabili non lineari. In questa tesi viene dimostrata l'efficacia dell'utilizzo di una rete neurale multistrato applicata al controllo del pendolo inverso, dove il successo del compito consiste nell'imparare a bilanciare il pendolo non conoscendo a priori la dinamica del sistema e, inoltre, l'unica risposta del sistema che viene resa disponibile è un segnale di fallimento che si verifica quando il pendolo cade o quando il carrello urta i limiti della pista. Per risolvere questo compito sono stati utilizzati due metodi di apprendimento: apprendimento per rinforzo e un metodo della classe di predizione chiamata "differenze-temporali".
File in questo prodotto:
File Dimensione Formato  
Tesi_LuciaSilla.PDFA.pdf

Open Access dal 23/01/2024

Descrizione: documento di tesi
Dimensione 1.03 MB
Formato Adobe PDF
1.03 MB Adobe PDF Visualizza/Apri

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.12075/9606