Controllo di un manipolatore industriale mediante computer vision

Computer vision is a field of artificial intelligence (AI) that enables computers and systems to derive meaningful information from digital images, videos, and other visual inputs. It involves the development of algorithms and models to automate tasks that the human visual system can do, such as object recognition, image classification, and scene understanding. Object detection is a specific task within computer vision that involves identifying and locating objects within an image or video. It not only classifies objects (e.g., cat, dog, car) but also provides their coordinates in the frame. Common techniques and models used for object detection include traditional methods such as Haar cascades and HOG (Histogram of Orient,ed Gradients) detectors, or Deep Learning-Based Methods: Including Convolutional Neural Networks (CNNs) and more advanced architectures like R-CNN (Region-based CNN), YOLO (You Only Look Once), SSD (Single Shot MultiBox Detector) and others. In industrial robotics, computer vision and object detection are pivotal for automating various tasks, enhancing precision, and improving efficiency for applications like quality control and inspection, machine vision in collaborative robots (Cobots) or vision and measurement. This thesis is a report about my project in which I want to control an industrial manipulator using a Variable Structur Control (precisely a Sliding Mode Control) combined with computer vision to allow it to recognise target objects using object detection, find their coordinates in the workspace and touch them with robot’s end-effector, using a pre-calculated trajectory based on the intial and final positions, limits of speed and acceleration.

La computer vision è un campo dell'intelligenga artificiale (IA) che permette ai computer e ai sistemi di ottenere informazioni significative da immagini digitali, video e altri input visivi. Coinvolge lo sviluppo di algoritmi e modelli per l'automatizzazione di processi che possono essere svolti attraverso il sistema visivo umano come il rilevamento di oggetti, classificazione delle immagini e comprensione delle scene. Il rilevamento di oggetti è un compito particolare che fa uso della computer vision che consiste nell'identificare e localizzare oggetti in immagini o video. Non solo classifica oggetti (gatto, cane, auto, ecc.) ma ne determina anche le coordinate nel frame. Tecniche comuni e modelli usati nel rilevamento di oggetti includono metodi tradizionali quali Haar cascades e HOG (Histogram of Orient,e Gradients) rilevatori o metodi basati sul deep learning quali Convolutional Neural Networks (CNNs) e architetture più avanzate come R-CNN (Region-based CNN), YOLO (You Only Look Once), SSD (Single Shot MultiBox Detector) e altri. Nella robotica industriale, la computer vision e il rilevamento degli oggetti sono fondamentali per l'automazione di diversi processi, aumentando la precisione e migliorando l'efficenza per applicazioni riguardo controllo qualità e ispezione, visione per robot collaborativi (Cobots) o visione e misurazione. Questa tesi è un report riguardo questo progetto nel quale si desidera controllare un manipolatore industriale utilizzando un controllo a struttura variabile (VSC) in particolare uno Sliding mode control (SMC) combinato con l'udo della visione artificiale per il riconoscimento di oggetti target, trovarne le coordinate sul piano di lavoro e permettere al manipolatore di toccare l'oggetto con la sua pinsa utilizzando traiettorie pre-calcolate basandosi sulla posizione iniziale e finale, con limiti di velocità ed accelerazione.