Show simple item record

Από τον Ευκλείδη στον Riemann: Ένα άλμα στην υπολογιστική όραση σε γεωμετρικούς χώρους

dc.contributor.advisorZois, Elias
dc.contributor.advisorVenetis, Ioannis
dc.contributor.authorΒασιλάκης, Νικόλαος
dc.date.accessioned2024-10-08T13:24:42Z
dc.date.available2024-10-08T13:24:42Z
dc.date.issued2024-10-08
dc.identifier.urihttps://polynoe.lib.uniwa.gr/xmlui/handle/11400/7624
dc.identifier.urihttp://dx.doi.org/10.26265/polynoe-7456
dc.description.abstractΗ παγκόσμια επιστημονική κοινότητα, μέχρι πρότινος, παραμένοντας πιστή στις κοινότυπες προσεγγίσεις των μεθόδων που χρησιμοποιούνται στην Μηχανική Μάθηση στηρίζεται στην υπόθεση ότι η δόμηση και κατά συνέπεια η επεξεργασία των δεδομένων θα πρέπει να υπόκειται σε πράξεις οι οποίες ορίζονται σε διανυσματικούς χώρους με πρωταρχική βάση την Ευκλείδεια γεωμετρία. Πορίσματα από πληθώρα ερευνών έχουν δείξει ότι ο επιστημονικός τομέας της Υπολογιστική Όραση επωφελείται από αναπαραστάσεις δεδομένων που είναι συμπαγείς, διακριτές, και εύρωστες. Εδώ λοιπόν εγείρεται το ακόλουθο ερώτημα: Μπορούμε να υποστηρίζουμε με απόλυτη βεβαιότητα ότι τα δεδομένα, όπως αυτά συλλέγονται και επεξεργάζονται, ακολουθούν πιστά την Ευκλείδεια Γεωμετρία; Αν όχι, υπάρχει κάποιου είδους υποκείμενης γεωμετρικής δομής η οποία δρα συμπληρωματικά στην ήδη απλοϊκή φύση του Ευκλείδειου Γεωμετρικού χώρου ενισχύοντας τα μοντέλα Μηχανικής Μάθησης με επιπρόσθετη περιγραφικότητα οδηγώντας έτσι σε υψηλότερα επίπεδα ακρίβειας προβλέψεων; Μια πιθανή απάντηση είναι η χρήση Συμμετρικών Θετικά Ορισμένων πινάκων οι οποίοι αντιμετωπίζονται πιο φυσικά μέσω των εννοιών της διαφορικής γεωμετρίας που εμφανίζεται σε μη-Ευκλείδειους χώρους, όπως αυτός του Riemann. Στόχος της παρούσας διπλωματικής είναι να γίνει μια μελέτη σε αλγορίθμους μη επιβλεπόμενης μάθησης τόσο σε Ευκλείδειους όσο και σε Riemannian χώρους με την χρήση προγραμματιστικών εργαλείων όπως το MATLAB για εφαρμογές Υπολογιστικής Όρασης. Συγκεκριμένα, στον Ευκλείδειο χώρο μελετώνται οι αλγόριθμοι: α) Bag of Features, β) Spatial Pyramid Matching, γ) Fisher Kernels και δ) Vectors of Locally Aggregated Descriptors ενώ στον Riemannian χώρο μελετώνται τεχνικές αλγορίθμων που εκμεταλλεύονται την εγγενώς μη γραμμική φύση των πολλαπλοτήτων στις οποίες απαντώνται οι πίνακες συνδιακύμανσης. Οι τέσσερις αριθμημένοι αλγόριθμοι του Ευκλείδειου Χώρου δοκιμάζονται σε μια βάση εικόνων που περιέχουν σκηνές για την μελέτη της προοδευτικής αύξησης της ακρίβειας της τεχνικής της διανυσματικής αναπαράστασης των εικόνων ενώ οι αλγόριθμοι στον Riemannian Χώρο επεξεργάζονται εικόνες χειρόγραφων υπογραφών από μια δημοφιλή βάση με σκοπό την βιομετρική ταυτοποίησή τους. Όπου κατέστη δυνατό, εφαρμόζεται επιτάχυνση του λογισμικού για την μείωση του χρόνου λήψης αποτελεσμάτων στην υλοποίηση των αλγορίθμων χρησιμοποιώντας παράλληλη επεξεργασία και χρήση καρτών γραφικών.el
dc.format.extent161el
dc.language.isoelel
dc.publisherΠανεπιστήμιο Δυτικής Αττικήςel
dc.rightsΑναφορά Δημιουργού - Μη Εμπορική Χρήση - Παρόμοια Διανομή 4.0 Διεθνές*
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 Διεθνές*
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 Διεθνές*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/*
dc.subjectComputer visionel
dc.subjectDigital image processingel
dc.subjectSPDel
dc.subjectSymmetric positive definite manifoldel
dc.subjectMATLABel
dc.subjectBiometricsel
dc.subjectRiemannian geometryel
dc.subjectΥπολογιστική όρασηel
dc.subjectΨηφιακή επεξεργασία εικόναςel
dc.subjectΕυκλείδειοι χώροιel
dc.subjectΣυμμετρική και θετικά ορισμένη πολλαπλότηταel
dc.subjectΠαράλληλη επεξεργασίαel
dc.subjectΚάρτες γραφικώνel
dc.subjectΔιανυσματική αναπαράσταση εικόνωνel
dc.titleΑπό τον Ευκλείδη στον Riemann: Ένα άλμα στην υπολογιστική όραση σε γεωμετρικούς χώρουςel
dc.title.alternativeA leap of faith from Euclidean to Riemannian manifolds for computer vision applicationsel
dc.typeΔιπλωματική εργασίαel
dc.contributor.committeeΧωριανόπουλος, Χρήστος
dc.contributor.facultyΣχολή Μηχανικώνel
dc.contributor.departmentΤμήμα Ηλεκτρολόγων και Ηλεκτρονικών Μηχανικώνel
dc.description.abstracttranslatedThe global scientific community, until recently, remaining faithful to the common approaches of the methods used in Machine Learning, has assumed that the construction and consequently the processing of data should be subject to operations defined in vector spaces with Euclidean geometry as the primary basis. Findings from a plethora of research have shown that the scientific field of Computational Vision benefits from data representations that are compact, discrete, and robust, the following question therefore arises here: Can we assert with absolute certainty that the data, as collected and processed, faithfully follow Euclidean geometry? If not, is there some kind of underlying geometric structure that acts in a complementary way to the already simplistic nature of the Euclidean Geometry space by enhancing Machine Learning models with additional descriptiveness leading to higher levels of prediction accuracy? One possible answer is the use of Symmetric Positively Defined matrices which are treated more naturally through the concepts of differential geometry occurring in non-Euclidean spaces such as Riemannian spaces. The objective of this diploma thesis is to provide a thorough review on unsupervised learning algorithms in both Euclidean as well as Riemannian spaces with the use of programming tools such as the MATLAB for computer vision applications. In the Euclidean space the following algorithms are under examination: a) Bag of Visual Words (BoVW), b) Spatial Pyramid Matching (SPM), c) Fisher Kernels (FK) or Fisher Vectors (FV), and d) Vectors of Locally Aggregated Descriptors (VLAD) whereas in Riemannian space techniques for algorithms that exploit the intrinsic non-linear nature of the manifolds that comprise the covariance matrices are studied. The four numbered algorithms in Euclidean Space are tested on an image database containing scenes to study the progressive increase in the accuracy of the vector image representation technique, while the algorithms in Riemannian Space process images of handwritten manuscripts from a popular signature database for biometric identification. Wherever feasible, software acceleration is applied to reduce the time to obtain results in the implementation of the algorithms using parallel processing and GPU computing.el


Files in this item

Thumbnail
Thumbnail

This item appears in the following Collection(s)

Show simple item record

Αναφορά Δημιουργού - Μη Εμπορική Χρήση - Παρόμοια Διανομή 4.0 Διεθνές
Except where otherwise noted, this item's license is described as
Αναφορά Δημιουργού - Μη Εμπορική Χρήση - Παρόμοια Διανομή 4.0 Διεθνές