Deep learning and variable autonomy for mobile robot navigation
Βαθιά μάθηση και μεταβαλλόμενη αυτονομία για πλοήγηση κινητών ρομπότ
Keywords
Artificial intelligence ; Machine learning ; Neural networks ; Robotics ; Human computer interaction ; Τεχνητή νοημοσύνη ; Μηχανική μάθηση ; Νευρωνικά δίκτυα ; Ρομποτική ; Αλληλεπίδραση ανθρώπου-μηχανής ; Συστήματα ελέγχουAbstract
This paper addresses the problem of safe and efficient navigation of mobile robots in extreme environments such as Search and Rescue (SAR) and Urban Search and Rescue (USAR) missions or other forms of remote robotic tasks. A shared control module is utilized and expanded upon by introducing a Deep Neural Network model (DNN), as well as a Machine Leaning (ML) model. The models were trained to predict what is known as probability of suffering, a concept borrowed from robot vitals, which is a state-of-the-art performance degradation metric that this paper is heavily inspired from. The models use sensor, or close to the sensor level, data as inputs and make inferences by circumventing the need for mathematical calculations of robot vitals. These inferences are then fed to an arbitration function 𝑎(⋅) that dictates control allocation between human and robot. The models presented did not demonstrate a significant improvement compared to the shared-control module that was presented in our previous work (i.e. static value arbitration). More specifically, experimental evaluation did not show a clear performance increase in terms of safety and task completion time. Other measurements however (e.g. the behavior of the arbitration function), show that this work can act as a proof of concept for robot vitals and AI integration in shared control systems, offering possibly a versatile and scalable solution for arbitration policies.
Abstract
Αυτή η εργασία πραγματεύεται το πρόβλημα της ασφαλούς και αποτελεσματικής πλοήγησης των κινητών ρομπότ σε ακραία περιβάλλοντα όπως αποστολές διάσωσης ή άλλες μορφές απομακρυσμένων ρομποτικών εργασιών. Συγκεκριμένα, χρησιμοποιείται μια μονάδα διαμοιρασμένου ελέγχου και επεκτείνεται με την εισαγωγή ενός μοντέλου μηχανικής μάθησης, καθώς και ενός μοντέλου βαθιάς μάθησης. Τα μοντέλα αυτά εκπαιδεύτηκαν για να προβλέψουν την πιθανότητα ταλαιπωρίας (probability of suffering), μια έννοια δανεισμένη από τα «robot vitals», η οποία είναι μια μετρική υποβάθμισης της απόδοσης του κινητού ρομπότ. Τα μοντέλα χρησιμοποιούν δεδομένα από αισθητήρες, ως είσοδο και εξάγουν συμπεράσματα παρακάμπτοντας την ανάγκη για μαθηματικούς υπολογισμούς των «robot vitals». Αυτά τα συμπεράσματα τροφοδοτούνται στη συνέχεια στη συνάρτηση διαιτησίας 𝑎(⋅) που υπαγορεύει την κατανομή ελέγχου μεταξύ ανθρώπου και ρομπότ. Τα μοντέλα που παρουσιάστηκαν δεν παρουσίασαν σημαντική βελτίωση σε σύγκριση με τη μονάδα διαμοιρασμένου ελέγχου που παρουσιάστηκε σε προηγούμενη εργασία. Πιο συγκεκριμένα, η πειραματική αξιολόγηση δεν έδειξε σαφή αύξηση της απόδοσης όσον αφορά την ασφάλεια και τον χρόνο ολοκλήρωσης της εργασίας. Άλλες μετρήσεις ωστόσο, όπως η συμπεριφορά της συνάρτησης διαιτησίας, δείχνουν ότι ο συνδυασμός των «robot vitals» και της τεχνητής νοημοσύνης σε συστήματα διαμοιρασμένου ελέγχου, προσφέρουν μια εν δυνάμει ευέλικτη και επεκτάσιμη λύση για πολιτικές διαιτησίας κινητών ρομπότ.
Number of pages
81Faculty
Σχολή ΜηχανικώνAcademic Department
Τμήμα Ηλεκτρολόγων και Ηλεκτρονικών ΜηχανικώνΤμήμα Μηχανικών Βιομηχανικής Σχεδίασης και Παραγωγής