Σημασιολογική κατάτμηση και ανίχνευση αντικειμένων σε 3δ νέφη σημείων με χρήση νευρωνικών δικτύων
Semantic segmentation and object detection in 3d point clouds using neural networks
Keywords
Nευρωνικά δίκτυα ; 3d point clouds ; Τεχνητή νοημοσύνη ; Τρισδιάστατα νέφη σημείων ; Σημασιολογική κατάτμηση ; Ανίχνευση αντικειμένων ; Neural networks ; Artificial intelligence ; Semantic segmentation ; Object detectionAbstract
Στη παρούσα διπλωματική διερευνάται ο τρόπος λειτουργίας των νευρωνικών δικτύων στο
ευρύτερο φάσμα της τεχνητής νοημοσύνης, χρησιμοποιώντας ως δεδομένα τρισδιάστατα
νέφη σημείων, όπου σκοπός τους είναι ο αυτοματισμός λειτουργιών κατά το βέλτιστο
δυνατό τρόπο. Πέραν των παραδειγμάτων που εξετάζονται στη συνέχεια, αναλύουμε που
χρησιμεύουν και πως προσεγγίζουν ένα πρόβλημα ερευνώντας κάθε στάδιο τους, με
σκοπό την καλύτερη κατανόηση των συγκεκριμένων τεχνικών. Αρχικά, στα πρώτα
κεφάλαια γίνεται μια γενικότερη ανασκόπηση της τεχνητής νοημοσύνης και εκμάθησης
μηχανής, ώστε να μπορεί ο αναγνώστης να μπει στο πνεύμα του τι αφορούν οι τεχνικές
αυτές παραθέτοντας διάφορα παραδείγματα και ιστορικά γεγονότα. Εδώ είναι πολύ
σημαντικός ο τρόπος που θα γίνει αυτή η ανάλυση και θα δοθεί ιδιαίτερη προσοχή κατά
την προσέγγιση τους, διότι για να μπορεί να αντιληφθεί κάποιος τα ειδικά προβλήματα
των νευρωνικών δικτύων που θα αντιμετωπίσουμε αργότερα, θα πρέπει πρώτα να έχει
κατανοήσει σε ένα βαθμό την γενικότερη φιλοσοφία της τεχνητής νοημοσύνης. Στη
συνέχεια εξετάζονται οι διαφορετικές περιπτώσεις των νευρωνικών δικτύων και
αναλύονται ξεχωριστά τα δίκτυα της σημασιολογικής κατάτμησης και της ανίχνευσης
αντικειμένων ως προς τον σκοπό και την τον τρόπο αντιμετώπισης της κάθε μεθόδου. Σε
επόμενο κεφάλαιο εξετάζουμε το περιβάλλον που χρειάζεται για την ανάπτυξη τέτοιων
δικτύων, καθώς και των εργαλείων που χρειάζονται για την υποστήριξη τέτοιων μεθόδων.
Αργότερα, αναλύονται τα δεδομένα που χρησιμοποιήθηκαν για τα πειράματα και πως αυτά
ερμηνεύονται στα νευρωνικά δίκτυα που υλοποιήθηκαν. Η διαδικασία όλων των
αναλύσεων θα γίνει με τέτοια σειρά ώστε να μην υπάρξει κάποια σύγχυση μεταξύ των
μεθόδων και να γίνουν απόλυτα κατανοητά το καθ’ ένα ξεχωριστά. Τέλος, εξετάζουμε τα
αποτελέσματα των μεθόδων που εφαρμόστηκαν, καταλήγοντας σε κάποιες παρατηρήσεις
και θέτοντας κάποιες παραδοχές όπου θα βοηθούσαν σε μελλοντικές βελτιώσεις των
συγκεκριμένων μοντέλων.
Abstract
In the present diploma thesis, it investigates the operations of neural networks in the broad
field of artificial intelligence, using as input data three-dimensional point clouds, where
their purpose is to automate operations in the best possible way. In addition to the
examples and experiments examined below, we analyze what they are used for and how to
approach a problem, investigating each of their stages in order to understand the specific
methods. Initially, in the first chapters a more general review of artificial intelligence and
machine learning, so that the reader can get into the spirit of what these techniques are
about, citing various examples and historical events. The manner in which this analysis
will be done is very important, and special care will be taken in approaching them, because
in order to be able to perceive the special problems of neural networks which we shall face
later, one must first have understood to some extent the philosophy of artificial
intelligence. Next, the different cases of neural networks are examined and the semantic
segmentation and object detection networks are analyzed separately in terms of the purpose
and approach of each method. Next chapter we examine the environment needed to
develop such networks, as well as the tools needed to support such methods. Later, the data
that will be used for the experiments are analyzed and how they are interpreted in the
neural networks that will be used. The process of all analyses will be done in such an
order so as not to create any confusion between the methods and that each one is
completely understood separately. Initially, it integrates the different cases of neural
networks and at the same time analyzes their process in terms of approaching the problem.
Finally, we examine the results of the methods that will be used, concluding with some
observations and making some assumptions that would help in future improvements of the
specific models.