Supervised and unsupervised methods in machine learning and computer vision using data-driven Log-Determinant Divergences in the manifold space of symmetric and positive definite covariance matrices
Επιβλεπόμενες και μη επιβλεπόμενες μέθοδοι στην μηχανική μάθηση και την υπολογιστική όραση με χρήση οδηγούμενων από τα δεδομένα λογαριθμικών αποκλίσεων σε χώρους πολλαπλότητας συμμετρικών και θετικά οριζόμενων πινάκων συνδιακύμανσης
Διπλωματική εργασία
Συγγραφέας
Μήτικας, Ευάγγελος
Ημερομηνία
2025-02-26Επιβλέπων
Zois, EliasΧωριανόπουλος, Χρήστος
Λέξεις-κλειδιά
Dictionary learning ; Symmetric positive definite manifold ; Manifold optimization ; Metric learning ; Writer-independent signature verification ; Συμμετρική και θετικά ορισμένη πολλαπλότητα ; Εκμάθηση μετρικής ; SPDΠερίληψη
Understanding the structure of data is fundamental to building robust and efficient models in signal processing, image processing, and machine learning. Traditional approaches, such as Sparse Representations and Bag-of-Words, rely on dictionary-based representations, where data is expressed as linear combinations of learned atoms. While these methods were prevalent in early computer vision research, they have been largely overshadowed by Convolutional Neural Networks and Vision Transformer models. However, despite their strong performance, these models often lack interpretability, making it difficult to derive meaningful insights into data structure. To address this challenge, researchers have explored alternative methodologies, such as differential manifolds and graph-based models. Recently, an approach integrating the widely used Symmetric Positive Definite manifold with dictionary learning has been proposed to tackle multi-class machine learning problems through manifold optimization algorithms. This data-driven framework jointly optimizes both the dictionary and the manifold metric to better capture the underlying data structure. This thesis builds upon this methodology and proposes an extension tailored for Writer-Independent Signature Verification. The proposed model refines the dictionary learning process and adapts the manifold metric to effectively differentiate between genuine and forged signatures using either classification or metric learning methodologies.
Περίληψη
Η κατανόηση της δομής των δεδομένων είναι θεμελιώδης για την ανάπτυξη αποδοτικών μοντέλων στην επεξεργασία σήματος, την επεξεργασία εικόνας και τη μηχανική μάθηση. Οι παραδοσιακές προσεγγίσεις, όπως Sparse Representations και Bag-of-Words, βασίζονται σε αναπαραστάσεις με χρήση λεξικών, όπου τα δεδομένα εκφράζονται ως γραμμικοί συνδυασμοί των στοιχείων του. Παρόλο που αυτές οι μέθοδοι ήταν κυρίαρχες στον τομέα της υπολογιστικής όρασης, έχουν σε μεγάλο βαθμό επισκιαστεί από τα Συνελικτικά Νευρωνικά Δίκτυα και τα μοντέλα Vision Transformer. Ωστόσο, παρά την υψηλή απόδοσή τους, τα εν λόγω μοντέλα συχνά στερούνται ερμηνευσιμότητας, καθιστώντας δύσκολη την εξαγωγή ουσιαστικών πληροφοριών σχετικά με τη δομή των δεδομένων. Για την αντιμετώπιση αυτής της πρόκλησης, έχουν διερευνήσει εναλλακτικές μεθοδολογίες, όπως οι διαφορίσιμες
πολλαπλότητες και τα μοντέλα γράφων. Πρόσφατα, προτάθηκε μια προσέγγιση που ενσωματώνει την ευρέως χρησιμοποιούμενη πολλαπλότητα Συμμετρικών Θετικά Ορισμένων πινάκων με εκμάθηση λεξικού, προκειμένου να επιλύσει προβλήματα μηχανικής μάθησης πολλαπλών κλάσεων μέσω αλγορίθμων βελτιστοποίησης σε πολλαπλότητες. Το συγκεκριμένο οδηγούμενο από τα δεδομένα πλαίσιο βελτιστοποιεί από κοινού τόσο το λεξικό όσο και τη μετρική της πολλαπλότητας, ώστε να αποτυπώσει
καλύτερα την υποκείμενη δομή των δεδομένων. Η παρούσα διπλωματική εργασία βασίζεται σε αυτή τη μεθοδολογία και προτείνει μια επέκταση προσαρμοσμένη στην Ανεξάρτητη από τον Συγγραφέα Επαλήθευση Υπογραφών (Writer-Independent Signature Verification). Το προτεινόμενο μοντέλο βελτιστοποιεί τη διαδικασία εκμάθησης λεξικού και προσαρμόζει τη μετρική της πολλαπλότητας, ώστε να διακρίνει αποτελεσματικά μεταξύ γνήσιων και πλαστών υπογραφών, αξιοποιώντας είτε μεθόδους
ταξινόμησης είτε μεθοδολογίες εκμάθησης μετρικής.