Kalman Filters and their application in motion detection and tracking
Φίλτρα Kalman και εφαρμογή στην ανίχνευση και παρακολούθηση κίνησης
Keywords
Machine learning ; Machine vision ; Reinforcement learning ; Deep neural networks ; CNN ; DQN ; YOLOv3 ; Kalman filter ; Motion detection ; Motion tracking ; Vehicle control ; Μηχανική μάθηση ; Μηχανική όραση ; Ενισχυτική μάθηση ; Βαθιά νευρωνικά δίκτυα ; Ανίχνευση κίνησης ; Έλεγχος οχήματος ; Φίλτρο KalmanAbstract
During the last decade, breakthroughs in the fields of machine vision and reinforce-ment learning have been made possible thanks to the advancements in machine learning algorithms. ‘Machines’ now can recognize an object with human accuracy; this im-plies they could play video games by just having access to the pixels of a screen. In this work a combination of state-of-the-art technologies of deep learning are exploited to detect, track and remotely control a vehicle under realistic conditions. A linear estimator (Kalman filter) is proposed as an application-specific solution to a common problem that is the delay of sensory input – in the present case, the latency introduced by the machine vision system. The thesis presents the proposed system design and practical considerations along with detailed experimental results as a proof of concept. The advantages of the proposed solution are established through comparative evaluation with the results of other ‘naive’ solutions.
Abstract
Η πρόοδος στον τομέα της μηχανικής μάθησης στην προηγούμενη δεκαετία, έκανε δυνατά σημαντικά επιτεύγματα στους τομείς της μηχανικής όρασης και της ενισχυμένης εκμάθησης. Μέσω καταλλήλων αλγορίθμων, οι ‘μηχανές’ μπορούν πλέον να αναγνωρίσουν αντικείμενα το ίδιο καλά με ανθρώπους – πράγμα που σημαίνει ότι θα μπορούσαν π.χ. να παίζουν βιντεοπαιχνίδια απλά έχοντας πρόσβαση στα pixels μιας οθόνης. Στην παρούσα εργασία αξιοποιούνται οι πλέον σύγχρονοι αλγόριθμοι βαθιάς μάθησης για τον εντοπισμό, την παρακολούθηση και τον απομακρυσμένο έλεγχο ενός οχήματος σε ρεαλιστικές συνθήκες. Επίσης προτείνεται η χρησιμοποίηση ενός γραμμικού εκτιμητή (φίλτρο Kalman) ως λύση σε ένα συγκεκριμένο πρόβλημα - εκείνο της καθυστέρησης της λήψης δεδομένων από τον αισθητήρα, δηλαδή της καθυστέρησης που εισάγει το σύστημα μηχανικής όρασης. Παρουσιάζονται αναλυτικά οι λεπτομέρειες της σχεδίασης, οι προκλήσεις που αντιμετωπίστηκαν και τα πειραματικά αποτελέσματα. Τέλος τα πλεονεκτήματα της προτεινόμενης λύσης τεκμηριώνονται μέσω συγκριτικής αξιολόγησης με τα αποτελέσματα άλλων «απλοϊκών» λύσεων.