Open-source AI base for humanoid with kinect sensor in education context
ΤΝ ανοικτού κώδικα για ανέπαφη αλληλεπίδραση ανθρωποειδών με αισθητήρα Kinect σε εκπαιδευτικό πλαίσιo

Διπλωματική εργασία
Συγγραφέας
Γιαννακόπουλος, Βλάσιος-Ιωάννης
Ημερομηνία
2025-02-12Επιβλέπων
Feidakis, MichalisΛέξεις-κλειδιά
Human body language ; Autism spectrum disorder ; Wireless communication ; Humanoid robot ; Artificial intelligence ; Τεχνητή νοημοσύνη ; Ανθρωποειδές ρομπότ ; Κοινωνικά ρομπότ ; Διαταραχή αυτιστικού φάσματος ; Ασύρματες επικοινωνίεςΠερίληψη
This diploma thesis explores the communication gaps in Social Assistive Robots (SARs), with a particular focus on their application in educational settings. The project aims to address these significant gaps by incorporating the ability to use human body language in a humanoid robot, focusing on the difficulty robots encounter in replicating subtle human non-verbal cues essential for effective communication. During the building of a historical review, the study underscores how technological advancements, especially the entry of artificial intelligence (AI), have evolved through the Industrial Revolutions, shaping modern robotics and the process of humanoids. The relationship between these historical milestones and the ongoing progress in AI-driven robotics is examined, emphasizing their impact on improving efficiency. Furthermore, this research introduces precision into various domains, particularly in the context of supporting children with Autism Spectrum Disorder (ASD). This free and open-source integration endeavors to establish an accessible and effective solution. This implementation specifically addresses the limitations of closed and proprietary software, often exclusively supported by their respective manufacturers. Consequently, this research highlights the potential for older products to find renewed utility within the evolving technological landscape. The thesis delineates the design and development of a prototype system aimed at enhancing human-robot interaction. In addition, the design and implementation of an AI base tailored for educational purposes is presented, with a system that presents a base with combination of the Microsoft Kinect, Raspberry Pi 4, a Laptop computer and the virtual environment of NAO. While the testing and evaluation highlights the successful implementation of various system components, addressing challenges such as the limitations imposed by software and hardware levels. Consequently, the identified limitations constrain the scope of the application. As such, the troubleshooting process comprehensively analyzes all potential avenues towards a viable solution. Moreover, the progress of the testing and evaluation provides modifications to complete the application on the function layer. Also the key achievements such as the successful connection of MariaDB with MQTT, wireless communication between MQTT and the NAO robot, and the management of Kinect captures are noted. Despite all opposition, progression is also used to test system performance and simulate different scenarios in a virtual NAO environment. Moreover, it proposes potential future extensions of the system on overcoming existing limitations and further strengthening the system's applicability in educational and therapeutic settings in real-time.
Περίληψη
Το αντικείμενο αυτής της διπλωματικής εργασίας αφορά στην διερεύνηση των επικοινωνιακών κενών στα Κοινωνικά Βοηθητικά Ρομπότ (ΚΒΡ), με ιδιαίτερη έμφαση στην εφαρμογή τους σε εκπαιδευτικά περιβάλλοντα. Το έργο στοχεύει να αντιμετωπίσει αυτά τα σημαντικά κενά ενσωματώνοντας την ικανότητα χρήσης της ανθρώπινης γλώσσας του σώματος σε ένα ανθρωποειδές ρομπότ, εστιάζοντας στη δυσκολία που αντιμετωπίζουν τα ρομπότ στην αναπαραγωγή των μη λεκτικών ενδείξεων που είναι απαραίτητες για την αποτελεσματική επικοινωνία με τον άνθρωπο. Κατά τη διάρκεια της δημιουργίας μιας ιστορικής ανασκόπησης, η μελέτη υπογραμμίζει πώς οι τεχνολογικές εξελίξεις, ειδικά η είσοδος της τεχνητής νοημοσύνης (TN), έχουν εξελιχθεί μέσα από τις Βιομηχανικές Επαναστάσεις, διαμορφώνοντας τη σύγχρονη ρομποτική και τη πρόοδο των ανθρωποειδών. Επίσης εξετάζεται η σχέση μεταξύ αυτών των ιστορικών ορόσημων και της συνεχούς προόδου στη ρομποτική που βασίζεται στην τεχνητή νοημοσύνη, τονίζοντας τον αντίκτυπό τους στη βελτίωση της αποδοτικότητας τους. Επιπλέον, αυτή η έρευνα εισάγει με ακρίβεια την χρήση των ανθρωποειδών σε διάφορους τομείς, ιδιαίτερα στο πλαίσιο της υποστήριξης παιδιών με Διαταραχή Αυτιστικού Φάσματος (ΔΑΦ). Αυτή η ελεύθερη και ανοιχτού κώδικα ενσωμάτωση προσπαθεί να δημιουργήσει μια προσβάσιμη και αποτελεσματική λύση. Η υλοποίηση αυτή αντιμετωπίζει ειδικά τους περιορισμούς του κλειστού και ιδιόκτητου λογισμικού, που συχνά υποστηρίζεται αποκλειστικά από τους αντίστοιχους κατασκευαστές τους. Συνεπώς, αυτή η έρευνα επισημαίνει τις δυνατότητες για παλαιότερα προϊόντα οτι μπορούν να αποκτήσουν ανανεωμένη χρησιμότητα στο διαρκώς εξελισσόμενο τεχνολογικό τοπίο. Η εργασία περιγράφει τον σχεδιασμό και την ανάπτυξη ενός πρωτότυπου συστήματος που στοχεύει στην ενίσχυση της αλληλεπίδρασης
ανθρώπου-ρομπότ. Επιπλέον, παρουσιάζεται ο σχεδιασμός και η υλοποίηση μιας βάσης τεχνητής νοημοσύνης προσαρμοσμένης για εκπαιδευτικούς σκοπούς, με ένα σύστημα που παρουσιάζει μια βάση με συνδυασμό του Microsoft Kinect, του Raspberry Pi 4, ενός φορητού υπολογιστή και του εικονικού περιβάλλοντος του NAO. Ενώ οι δοκιμές και η αξιολόγηση υπογραμμίζουν την
επιτυχή υλοποίηση διαφόρων στοιχείων του συστήματος, αντιμετωπίζοντας προκλήσεις όπως οι περιορισμοί που επιβάλλονται από τα επίπεδα λογισμικού και υλικού. Συνεπώς, οι εντοπισμένοι περιορισμοί θέτουν όρια στο πεδίο εφαρμογής της υλοποίησης. Ως εκ τούτου, η διαδικασία αντιμετώπισης προβλημάτων αναλύει διεξοδικά όλες τις πιθανές οδούς προς μια βιώσιμη λύση.
Επιπρόσθετα, η πρόοδος των δοκιμών και της αξιολόγησης παρέχει τροποποιήσεις για την επίτευξη της εφαρμογής σε λειτουργικό επίπεδο. Παράλληλα, σημειώνονται τα βασικά επιτεύγματα, όπως η επιτυχής σύνδεση της MariaDB με το MQTT, η ασύρματη επικοινωνία μεταξύ του MQTT και του ρομπότ NAO, και η διαχείριση των λήψεων του Kinect. Ωστόσο, η πρόοδος χρησιμοποιείται επίσης για τη δοκιμή της απόδοσης του συστήματος και την προσομοίωση διαφορετικών σεναρίων σε ένα εικονικό περιβάλλον NAO. Συμπληρωματικά, προτείνει πιθανές μελλοντικές επεκτάσεις του συστήματος για την υπέρβαση των υπαρχόντων περιορισμών και την περαιτέρω ενίσχυση της εφαρμοσιμότητας του συστήματος σε εκπαιδευτικά και θεραπευτικά περιβάλλοντα σε πραγματικό χρόνο.