Σημασιολογική κατάτμηση και ανίχνευση αντικειμένων σε 3δ νέφη  σημείων με χρήση νευρωνικών δικτύων

Ντούνης, Αντώνιος

Semantic segmentation and object detection in 3d point clouds using neural networks

Διπλωματική εργασία

Author

Ντούνης, Αντώνιος

Date

2024-10-11

Advisor

Grammatikopoulos, Lazaros

Διπλωματική Ντούνης Αντώνιος (4.561Mb)

ΔΗΛΩΣΗ ΣΥΓΓΡΑΦΕΑ (171.2Kb)

Keywords

Nευρωνικά δίκτυα ; 3d point clouds ; Τεχνητή νοημοσύνη ; Τρισδιάστατα νέφη σημείων ; Σημασιολογική κατάτμηση ; Ανίχνευση αντικειμένων ; Neural networks ; Artificial intelligence ; Semantic segmentation ; Object detection

Abstract

Στη παρούσα διπλωματική διερευνάται ο τρόπος λειτουργίας των νευρωνικών δικτύων στο ευρύτερο φάσμα της τεχνητής νοημοσύνης, χρησιμοποιώντας ως δεδομένα τρισδιάστατα νέφη σημείων, όπου σκοπός τους είναι ο αυτοματισμός λειτουργιών κατά το βέλτιστο δυνατό τρόπο. Πέραν των παραδειγμάτων που εξετάζονται στη συνέχεια, αναλύουμε που χρησιμεύουν και πως προσεγγίζουν ένα πρόβλημα ερευνώντας κάθε στάδιο τους, με σκοπό την καλύτερη κατανόηση των συγκεκριμένων τεχνικών. Αρχικά, στα πρώτα κεφάλαια γίνεται μια γενικότερη ανασκόπηση της τεχνητής νοημοσύνης και εκμάθησης μηχανής, ώστε να μπορεί ο αναγνώστης να μπει στο πνεύμα του τι αφορούν οι τεχνικές αυτές παραθέτοντας διάφορα παραδείγματα και ιστορικά γεγονότα. Εδώ είναι πολύ σημαντικός ο τρόπος που θα γίνει αυτή η ανάλυση και θα δοθεί ιδιαίτερη προσοχή κατά την προσέγγιση τους, διότι για να μπορεί να αντιληφθεί κάποιος τα ειδικά προβλήματα των νευρωνικών δικτύων που θα αντιμετωπίσουμε αργότερα, θα πρέπει πρώτα να έχει κατανοήσει σε ένα βαθμό την γενικότερη φιλοσοφία της τεχνητής νοημοσύνης. Στη συνέχεια εξετάζονται οι διαφορετικές περιπτώσεις των νευρωνικών δικτύων και αναλύονται ξεχωριστά τα δίκτυα της σημασιολογικής κατάτμησης και της ανίχνευσης αντικειμένων ως προς τον σκοπό και την τον τρόπο αντιμετώπισης της κάθε μεθόδου. Σε επόμενο κεφάλαιο εξετάζουμε το περιβάλλον που χρειάζεται για την ανάπτυξη τέτοιων δικτύων, καθώς και των εργαλείων που χρειάζονται για την υποστήριξη τέτοιων μεθόδων. Αργότερα, αναλύονται τα δεδομένα που χρησιμοποιήθηκαν για τα πειράματα και πως αυτά ερμηνεύονται στα νευρωνικά δίκτυα που υλοποιήθηκαν. Η διαδικασία όλων των αναλύσεων θα γίνει με τέτοια σειρά ώστε να μην υπάρξει κάποια σύγχυση μεταξύ των μεθόδων και να γίνουν απόλυτα κατανοητά το καθ’ ένα ξεχωριστά. Τέλος, εξετάζουμε τα αποτελέσματα των μεθόδων που εφαρμόστηκαν, καταλήγοντας σε κάποιες παρατηρήσεις και θέτοντας κάποιες παραδοχές όπου θα βοηθούσαν σε μελλοντικές βελτιώσεις των συγκεκριμένων μοντέλων.

Abstract

In the present diploma thesis, it investigates the operations of neural networks in the broad field of artificial intelligence, using as input data three-dimensional point clouds, where their purpose is to automate operations in the best possible way. In addition to the examples and experiments examined below, we analyze what they are used for and how to approach a problem, investigating each of their stages in order to understand the specific methods. Initially, in the first chapters a more general review of artificial intelligence and machine learning, so that the reader can get into the spirit of what these techniques are about, citing various examples and historical events. The manner in which this analysis will be done is very important, and special care will be taken in approaching them, because in order to be able to perceive the special problems of neural networks which we shall face later, one must first have understood to some extent the philosophy of artificial intelligence. Next, the different cases of neural networks are examined and the semantic segmentation and object detection networks are analyzed separately in terms of the purpose and approach of each method. Next chapter we examine the environment needed to develop such networks, as well as the tools needed to support such methods. Later, the data that will be used for the experiments are analyzed and how they are interpreted in the neural networks that will be used. The process of all analyses will be done in such an order so as not to create any confusion between the methods and that each one is completely understood separately. Initially, it integrates the different cases of neural networks and at the same time analyzes their process in terms of approaching the problem. Finally, we examine the results of the methods that will be used, concluding with some observations and making some assumptions that would help in future improvements of the specific models.