Σχεδιασμός και υλοποίηση ασύρματης κάμερας οπισθοπορείας με μηχανική όραση
Design and implementation of a wireless rearview camera system with computer vision

Διπλωματική εργασία
Συγγραφέας
Κρέτσιμος, Αριστοτέλης
Ημερομηνία
2025-02-20Επιβλέπων
Kachris, ChristoforosΛέξεις-κλειδιά
ESP32 ; YOLO ; YOLOv3 ; MobileNetV1 ; SSD ; Edge Impulse ; Μηχανική όραση ; Ανίχνευση αντικειμένων ; Cloud computing ; Κάμερες οπισθοπορείας ; Τεχνητή νοημοσύνη ; Real-time processingΠερίληψη
Η παρούσα εργασία επικεντρώνεται στην ανάπτυξη ενός ασύρματου συστήματος κάμερας οπισθοπορείας που αξιοποιεί τεχνικές μηχανικής όρασης για την ανίχνευση αντικειμένων σε πραγματικό χρόνο. Για την υλοποίησή του, χρησιμοποιήθηκαν τρία διαφορετικά συστήματα επεξεργασίας εικόνας, καθένα με διαφορετική προσέγγιση και πλεονεκτήματα. Το πρώτο σύστημα βασίζεται στο Edge Impulse, μια πλατφόρμα AutoML που επιτρέπει την εκπαίδευση lightweight AI μοντέλων για microcontrollers, όπως το ESP32-CAM. Η επεξεργασία πραγματοποιείται τοπικά στη συσκευή (edge computing) με χαμηλή κατανάλωση ενέργειας, χωρίς ανάγκη σύνδεσης στο cloud. Το δεύτερο σύστημα ακολουθεί μια cloud-based αρχιτεκτονική, όπου η ESP32-CAM μεταδίδει δεδομένα μέσω του διαδικτύου σε έναν server, όπου εφαρμόζεται ανίχνευση αντικειμένων με τον αλγόριθμο YOLOv3. Η λύση αυτή επιτρέπει μεγαλύτερη ακρίβεια και υποστήριξη για πιο απαιτητικούς υπολογισμούς, αξιοποιώντας την υπολογιστική ισχύ του cloud. Το τρίτο σύστημα εστιάζει στην τοπική επεξεργασία εικόνας μέσω κινητών συσκευών, χρησιμοποιώντας ένα μοντέλο MobileNetV1 + SSD ενσωματωμένο σε εφαρμογή Android. Η ανίχνευση αντικειμένων εκτελείται απευθείας στη συσκευή, παρέχοντας άμεση απόκριση χωρίς εξωτερική επεξεργασία, διατηρώντας παράλληλα καλή ισορροπία μεταξύ ακρίβειας και ταχύτητας. Στόχος της εργασίας είναι η σύγκριση των τριών προσεγγίσεων ως προς την ακρίβεια ανίχνευσης, τον χρόνο απόκρισης (latency), την κατανάλωση ενέργειας και την απαιτούμενη υπολογιστική ισχύ. Τα αποτελέσματα δείχνουν ότι κάθε μέθοδος παρουσιάζει διαφορετικά πλεονεκτήματα ανάλογα με τις απαιτήσεις χρήσης. Το YOLO παρέχει υψηλή ακρίβεια αλλά απαιτεί cloud επεξεργασία, το MobileNetV1 + SSD είναι ιδανικό για mobile εφαρμογές, ενώ το Edge Impulse προσφέρει μια αποδοτική λύση για embedded συστήματα με περιορισμένους πόρους.
Περίληψη
This thesis focuses on the development of a wireless rear-view camera system that utilizes computer vision techniques for real-time object detection. Three different image processing systems were implemented, each following a distinct approach with unique advantages. The first system is based on Edge Impulse, an AutoML platform that enables the training of lightweight AI models for microcontrollers such as the ESP32-CAM. Processing is performed locally on the device (edge computing) with minimal power consumption, eliminating the need for cloud connectivity. The second system follows a cloud-based architecture, where the ESP32-CAM transmits data over the internet to a server, where object detection is performed using the YOLOv3 algorithm. This approach allows for higher accuracy and support for more computationally intensive tasks by leveraging cloud processing power.
The third system focuses on local image processing on mobile devices, utilizing a MobileNetV1 + SSD model embedded in an Android application. Object detection runs directly on the device, ensuring immediate response without external processing while maintaining a good balance between accuracy and speed. The objective of this study is to compare these three approaches in terms of detection accuracy, response time (latency), power consumption, and computational requirements. The results indicate that each method offers distinct advantages depending on the use case. YOLO provides high accuracy but requires cloud processing, MobileNetV1 + SSD is optimized for mobile applications, while Edge Impulse offers an efficient solution for embedded systems with limited resources.