Ανάπτυξη λογισμικού οπτικής αναγνώρισης χαρακτήρων για τα συλλαβογράμματα της Κρητικής Πρωτογραμμικής Γραφής
Development of an OCR software for syllabograms of Cretan Protolinear Script
Διπλωματική εργασία
Συγγραφέας
Σαμολαδάς, Χρήστος
Ημερομηνία
2024-03-22Επιβλέπων
Papakitsos, EvangelosΛέξεις-κλειδιά
Κρητική πρωτογραμμική γραφή ; Γραμμική Α ; Οπτική αναγνώριση χαρακτήρων ; YOLOv5 ; Οπτική αναγνώριση αντικειμένωνΠερίληψη
Η μελέτη αρχαίων γλωσσών είναι ένα θέμα που παραμένει επίκαιρο όσα χρόνια και αν περάσουν. Αυτό μάλιστα γίνεται πιο εμφανές όταν αναφερόμαστε σε γλώσσες που δεν έχουν αποκρυπτογραφηθεί ακόμα. Στην προσπάθειά τους αυτή, οι αρχαιολόγοι χρησιμοποιούν εργαλεία του σήμερα για την καλύτερη κατανόηση του παρελθόντος. Με την ανάπτυξη της τεχνολογίας για οπτική αναγνώριση τα τελευταία χρόνια, η χρήση της είναι πλέον καθημερινή. Οι δυνατότητες που προσφέρει, όμως, μπορούν να χρησιμοποιηθούν από τους αρχαιολόγους για την εξερεύνηση της Ιστορίας.Στο παρελθόν, έχει ήδη γίνει χρήση λογισμικού από αρχαιολόγους για τη διευκόλυνση της μελέτης αρχαίων γλωσσών και την ψηφιοποίησή τους, με ποικίλα αποτελέσματα.
Σκοπός της εργασίας είναι η χρήση προγράμματος οπτικής αναγνώρισης, που θα εκπαιδευτεί για να αναγνωρίζει τα συλλαβογράμματα της Κρητικής Πρωτογραμμικής Γραφής, μιας Μινωικής γραφής προγόνου της Γραμμικής Α και Β. Συγκεκριμένα, σε αυτή την εργασία θα ασχοληθούμε με την σειρά ‘T’, η οποία αποτελείται από 6 συλλαβογράμματα, για να διαπιστώσουμε αν είναι εφικτή η χρήση του προγράμματος για την περίπτωση που θέλουμε να το χρησιμοποιήσουμε, καθώς και η διερεύνηση πιθανού τρόπου ενσωμάτωσης σε υπάρχον πρόγραμμα για την εκμάθηση και κατανόηση της συγκεκριμένηςγραφής.Ενώ είχε αρχικά προταθεί να χρησιμοποιηθεί πρόγραμμα οπτικής αναγνώρισης χαρακτήρων, τελικά αποφασίστηκε να γίνει χρήση προγράμματος αναγνώρισης αντικειμένων λόγω της καλύτερης ευκρίνειας που θα μπορούσε να πρόσφερε για την περίπτωσή μας (επί το πλείστον φωτογραφίες από πήλινες πλάκες).
Από τα αποτελέσματα της εργασίας διαπιστώθηκε ότι το πρόγραμμα Yolov5 μπορεί να εκτελέσει την επιθυμητή διαδικασία της αναγνώρισης των συλλαβογραμμάτων με ικανοποιητικό ποσοστό επιτυχίας. Ωστόσο, υπάρχει περιθώριο βελτίωσης των αποτελεσμάτων του προγράμματος ή χρήσης εναλλακτικού νεότερου μοντέλου.
Περίληψη
The study of ancient languages is a topic that stays relevant regardless of the passage of time. This fact becomes even more apparent when we are referring to a yet to be translated language. Archaeologists can employ technologies developed in recent years to help them in better understanding the past. With the evolution of the optical recognition technology achieved in the last decade, it is now used in everyday applications. The same technology could be used as a key for archaeologists to ‘unlock’ the secrets of History.In the past, the use of several software tools has been attempted by archaeologists for the facilitation of the study and digitization of ancient languages, with varying degrees of success.The aim of this study is the use of an optical recognition program which will be trained to recognize the syllabograms of Cretan Protolinear Script, a Minoan script ancestor of Linear A & B. Specifically, this study will focus on ‘T’ series, which consists of 6 syllabograms, to discern if the use of this specific program can feasibly yield acceptable results for our case’s requirements. Moreover, whether or not it could be integrated in an existing program for the comprehension of the script.While at first the use of an optical character recognition (OCR) program was suggested, its performance in our case (which mostly consists of clay tablets photos) would be sub-optimal, thus it was decided that an object detection program would be utilized instead. With the conclusion of this study, it became apparent that the program used, Yolov5, could successfully perform the desired process of recognition of the syllabaries with a satisfactory percentage of success. Nonetheless, there is always room for the improvement of the results or the use of a newer version of the program.