Αναγνώριση οδικής σήμανσης με Τ.Ν.

Βύρος, Κυριάκος

Road signs detection using A.I.

Μεταπτυχιακή διπλωματική εργασία

Συγγραφέας

Βύρος, Κυριάκος

Ημερομηνία

2022-10

Επιβλέπων

Piromalis, Dimitrios

AIDL-0003.pdf (3.892Mb)

Λέξεις-κλειδιά

Αναγνώριση οδικής σήμανσης ; Αναγνώριση αντικειμένων ; Βαθιά μάθηση ; Τεχνητή νοημοσύνη ; Αυτόνομα οχήματα ; Συνελικτικά νευρωνικά δίκτυα

Περίληψη

Σε έναν κόσμο συνεχώς μεταβαλλόμενο και γρηγορά κινούμενο, η τεχνητή νοημοσύνη κάνει άλματα προόδου ολοένα και μεγαλύτερα. Η χρήση της βαθιάς μάθησης (DL) σε συνεχώς περισσοτέρους τομείς, είναι πλέον γεγονός. Ολοένα ταχύτεροι αλγόριθμοι, κάρτες γραφικών και χρόνοι απόκρισης προκύπτουν λόγω της αυξανομένης ζήτησης για κάλυψη αναγκών σε πολλούς τομείς. Αυτή η ασταμάτητη ορμή για μείωση όγκου και γιγάντωση δυνατοτήτων ταυτόχρονα, έχει οδηγήσει τις εταιρίες παραγωγής επεξεργαστών σε ένα ξέφρενο αγώνα επιτευγμάτων. Από αυτό το «ράλι» δεν θα μπορούσαν να λείπουν βιομηχανίες που ζητούν συνεχή τεχνολογική εξέλιξη των προϊόντων τους, καθώς και οι κορυφαίες εταιρίες ανάπτυξης τέτοιων τεχνολογιών. Στο ένα βάθρο στέκεται περίφανη η αυτοκινητοβιομηχανία και στο άλλο εταιρίες όπως η Νvidia, αντίστοιχα. Τα αυτόνομα οχήματα είναι μια πραγματοποίηση ενός ονείρου πολλών δεκαετιών που μόλις πρόσφατα όμως άρχισε να παίρνει σάρκα και οστά. Ο δρόμος μέχρι την πλήρη αυτονόμηση ενός οχήματος, ίσως είναι μακριά ακόμα, αλλά η απόσταση που έχει διανυθεί ως εδώ είναι ήδη αξιοσημείωτη και με αρκετά ενθαρρυντικά αποτελέσματα. Η αναγνώριση των οδικών σημάνσεων, των πεζών, των εμποδίων και των λοιπών στοιχείων του περιβάλλοντος χώρου του οχήματος, είναι σημεία κλειδιά για την εξέλιξη και επίτευξη πλήρους αυτονομίας, αλλά κυρίως μεγαλύτερης οδικής ασφάλειας για οδηγούς και μη. Η τεχνητή νοημοσύνη λοιπόν, διαδραματίζει τον ρολό του λυτρωτή, που ανεβαίνει επίπεδα, τάχιστα. Ξεπερνά κάθε εμπόδιο με τη πάροδο του χρόνου, όμως όλα αυτά δεν θα μπορούσαν να συμβούν χωρίς την παράλληλη ανάπτυξη κατάλληλου υλικολογισμικού, ικανού να ανταπεξέρχεται στις συνεχώς καλπάζουσες υπολογιστικές απαιτήσεις. Ο τρόπος και η μέθοδος αναγνώρισης αντικειμένων σε ένα αυτοκίνητο εξαρτάται από το είδος αντικειμένου που πρόκειται να ανιχνευθεί. Διατίθενται μέσα με τεχνολογίες λέιζερ, ραντάρ και άλλα. Στην περίπτωση αναγνώρισης οδικής σήμανσης, ο μονός υποψήφιος τρόπος, είναι οι κάμερες. Η βαθιά μάθηση ανέλαβε την μετατροπή των απλών καμερών σε υπολογιστική όραση και τα αυτοκίνητα σε «σκεπτόμενες» μηχανές. Νέες μέθοδοι, μικρότεροι κώδικες, ανανεωμένα και απαιτητικά σύνολα δεδομένων και GPUs έτοιμες να ανταποκριθούν στο ρεύμα αυτό, προκύπτουν συνεχώς και ασταμάτητα. Αφού γίνουν κατανοητές κάποιες βασικές έννοιες και ορολογίες, όσον αφορά τον εντοπισμό και την ανίχνευση, περιγράφονται οι διαδικασίες ανάλυσης των δεδομένων και οι αλγόριθμοι. Η στρατηγική εντοπισμού αφορά διάκριση σε σχήματα, χρώματα και συνδυασμό τους. Στο κομμάτι των μεθόδων προσέγγισης του ζητήματος της αναγνώρισης οδικών σημάνσεων, προτείνονται αλγόριθμοι και τεχνικές βελτίωσης. Βεβαίως αναλύεται εκτενώς, η ραχοκοκαλιά των συστημάτων αυτών, το συνελικτικό νευρωνικό δίκτυο καθώς και τα συνεργαζόμενα πλαίσια. Οι δομές, οι αρχιτεκτονικές, οι τάσεις, οι ταχύτητες καθώς και τα προβλήματα και οι υστερήσεις, λαμβάνουν εκτενή ανάλυση και ερμηνεύονται. Εδώ λοιπόν έρχεται το Jetson Nano και μια όμορφη μαθησιακή πρόκληση. Αυτό αποτελεί το κομμάτι της υλοποίησης. Το να προγραμματίσει κάποιος ένα τόσο μικρο υπολογιστικό σύστημα, και να μπορεί να κάνει κάτι που μέχρι πριν μερικά χρονιά δεν μπορούσαν ολόκληροι σταθεροί υπολογιστές με υπερμεγέθεις κάρτες γραφικών, είναι πολύ ενδιαφέρον. Η συλλογή χιλιάδων φωτογραφιών, ο σωστός σχολιασμός τους και το κατάλληλο χώρισμα σε σετ εκπαίδευσης, δοκιμής και επικύρωσης, είναι χρονοβόρα και απαιτητική διαδικασία. Όπως επίσης απαιτητικό είναι και το να χρησιμοποιηθεί ένας επεξεργαστής με 128 πυρήνες CUDA και μόλις 2 GB μνημης RAM, για την περάτωση τόσο μεγάλου υπολογιστικού φόρτου. Χρησιμοποιώντας λοιπόν το οικείο περιβάλλον του Jetson nano, μετα από δημιουργία κατάλληλων σετ δεδομένων, και πολλές εκπαιδεύσεις διαφορετικών μοντέλων επετεύχθη η αναγνώριση οδικής σήμανσης. Αυτό, βέβαια, συνέβη υπο ορούς και περιορισμούς που αφορούν, μεθόδους και δεδομένα που χρησιμοποιήθηκαν.

Περίληψη

In a world that is constantly changing and rapidly moving, artificial intelligence is making ever greater leaps forward. The use of deep learning in more and more areas is now a fact. Ever-faster algorithms, graphics cards and response times are emerging due to the growing demand to meet needs in many areas. This unstoppable momentum for volume reduction and the gigantic potential at the same time, has led processor production companies to a frantic struggle of achievements. From this "rally" could not be missing industries that demand continuous technological development of their products, as well as the leading companies for the development of such technologies. On one podium stands the car industry proudly and on the other companies such as Nvidia, respectively. Autonomous vehicles are a realization of a dream of many decades that only recently began to take shape. The road to the complete autonomy of a vehicle may still be far away, but the distance traveled so far is already remarkable and with quite encouraging results. The identification of road signs, pedestrians, obstacles, and other elements of the vehicle's surroundings are key points for the development and achievement of full autonomy, but above all greater road safety for drivers and non-drivers alike. Artificial intelligence, then, plays the role of the redeemer, which rises levels, rapidly. It overcomes every obstacle over time, but all this could not have happened without the parallel development of appropriate firmware, capable of coping with the constantly well-sounding computational requirements. The way and method of identifying objects in a car depends on what kind of object is to be detected. They are available with laser technologies, radar and more. In the case of road signage recognition, the only candidate mode is the cameras. Deep learning undertook the transformation of simple cameras into computer vision and cars into "thinking" machines. New methods, smaller codes, updated and demanding data sets and GPUs ready to respond to this current, arise continuously, endlessly. After some basic concepts and terminologies are understood, in terms of detection and recognition, the procedures for analyzing the data and algorithms are described. The tracking strategy concerns distinction in shapes, colors and their combination. In the part of the methods of approaching the issue of road marking recognition, algorithms and improvement techniques are proposed. Of course, the backbone of these systems, the convolutional neural network as well as the collaborating frameworks are analyzed extensively. Structures, architectures, trends, speeds as well as problems and lags, receive extensive analysis and are interpreted. So here comes Jetson Nano and a beautiful learning challenge. That is the part of the implementation. It is very interesting to program such a small computer system, and to be able to do something that until a few years ago, entire desktop computers with oversized graphic cards could not do, is very interesting. Collecting thousands of photos, commenting on them correctly and the appropriate partition in training, testing and validation sets, is a time-consuming and demanding process. It is also demanding to use a processor with 128 CUDA cores and just 2 GB of RAM, to complete such a large computing load. So, using the familiar environment of Jetson Nano, after creating appropriate data sets, and many trainings of different models, road sign recognition was achieved. This, of course, occurred under conditions and limitations concerning, methods and data used.

Αριθμός σελίδων

Σχολή

Σχολή Μηχανικών

Ακαδημαϊκό Τμήμα

Τμήμα Ηλεκτρολόγων και Ηλεκτρονικών Μηχανικών
Τμήμα Μηχανικών Βιομηχανικής Σχεδίασης και Παραγωγής

Τίτλος Προγράμματος Μεταπτυχιακών Σπουδών

Τεχνητή Νοημοσύνη και Βαθιά Μάθηση

Γλώσσα

Ελληνικά

URI

https://polynoe.lib.uniwa.gr/xmlui/handle/11400/3283
http://dx.doi.org/10.26265/polynoe-3123

Συλλογή

Μεταπτυχιακές διπλωματικές εργασίες - Τεχνητή Νοημοσύνη και Βαθιά Μάθηση

Εμφάνιση πλήρους εγγραφής

Αναφορά Δημιουργού - Μη Εμπορική Χρήση - Παρόμοια Διανομή 4.0 Διεθνές

Εκτός από όπου επισημαίνεται κάτι διαφορετικό, το τεκμήριο διανέμεται με την ακόλουθη άδεια:
Αναφορά Δημιουργού - Μη Εμπορική Χρήση - Παρόμοια Διανομή 4.0 Διεθνές