Ανίχνευση αντικειμένων σε πραγματικό χρόνο με βαθιά μάθηση και υπολογιστική αιχμής
Real-time object detection with deep learning and edge computing
Keywords
Ανίχνευση αντικειμένων ; Βαθιά μάθηση ; Συνελικτικά νευρωνικά δίκτυα ; Υπολογιστική αιχμής ; YOLO ; Object detection ; Deep learning ; Convolutional neural network ; Edge computing ; Αναγνώριση αντικειμένων ; Μηχανική μάθησηAbstract
Στην παρούσα εργασία με τίτλο ‘Ανίχνευση Αντικειμένων σε Πραγματικό Χρόνο με Βαθιά Μάθηση και Υπολογιστική Αιχμής’ γίνεται η υλοποίηση εφαρμογής ανίχνευσης μάσκας πάνω σε ανθρώπινα πρόσωπα σε πραγματικό χρόνο. Αυτό επιτυγχάνεται χρησιμοποιώντας ένα συνελικτικό νευρωνικό δίκτυο YOLO 5ης έκδοσης σε συνδυασμό με τον μικρού μεγέθους υπολογιστή της NVIDIA JetSon Nano. Στο έγγραφο αναπτύσσεται λεπτομερώς η διαδικασία από αναγνώριση αντικειμένου μέσω φωτογραφιών σε ανίχνευση του προσώπου σε πραγματικό χρόνο. Αυτό επιτυγχάνεται και γίνεται πιο κατανοητό χάρη στην δομή των κεφαλαίων, η οποία κάνει αναδρομή από την αναγνώριση του αντικειμένου, την χρήση βαθιάς μάθησης και της χρησιμότητάς της, της υπολογιστικής αιχμής και τέλος την παρουσίαση των εργαλείων της εφαρμογής και την υλοποίησής της. Η εργασία κλείνει με τα συμπεράσματα και τις παρατηρήσεις από αυτή την υλοποίηση, καθώς και με πιθανές αλλαγές/βελτιώσεις για το μέλλον. Η επιλογή του θέματος εμπνεύστηκε από την σπουδαιότητα της βαθιάς μάθησης στην καθημερινή ζωή των ανθρώπων και πως αυτή τελικά χρησιμοποιεί την τεχνολογία για σύμμαχο από τα πιο απλά πράγματα της καθημερινότητας μέχρι τα πιο προκλητικά. Η ανίχνευση μάσκας για ανθρώπινα πρόσωπα σε πραγματικό χρόνο είναι μια εργασία, η οποία έχει ευρεία χρήσεων στην σημερινή κοινωνία, καθώς και υπενθυμίζει στον άνθρωπο πως παρόλο που η φύση είναι απρόβλεπτη και ασυμβίβαστη με τα ανθρώπινα σχέδια, η τεχνολογία ως εργαλείο του έδινε πάντα την δυνατότητα να μην μένει ποτέ πίσω.
Abstract
In the present work entitled ‘Real Time Object Detection with Deep Learning and Edge Computing’, the implementation of a mask detection application on human faces in real time is implemented. This is achieved by using a 5th Edition YOLO convolutional neural network with the compact NVIDIA JetSon Nano PC. The document describes in detail the process from object recognition through photographs to real-time face detection. This is achieved and becomes more understandable thanks to the structure of the chapters, which by order they start from object recognition, the use of deep learning and its usefulness, the edge computing and
finally the presentation of the tools of the application and its implementation. The work closes with the conclusions and observations from this implementation, as well as with possible changes/improvements for the future. The choice of topic was inspired by the importance of deep learning in people's daily lives and how it ultimately uses technology as an ally from the
simplest things in everyday life to the most challenging. Real-time face mask detection is a widely used task in today's society, and it reminds man that although nature is unpredictable and incompatible with human designs, technology as a tool has always enabled him to never be left behind.