Δημιουργία αλγορίθμων και γραφικού περιβάλλοντος για προσδιορισμό κι εμφάνιση γραμματικών στοιχείων σε προτάσεις της ελληνικής γλώσσας
Creating algorithms and graphical environment for identification and display of grammatical elements in sentences of the Greek language
Διπλωματική εργασία
Συγγραφέας
Αγγέλου, Κωνσταντίνος
Ημερομηνία
2024-10Επιβλέπων
Papakitsos, EvangelosΛέξεις-κλειδιά
Εξόρυξη δεδομένων ; Βαθιά μάθηση ; Τεχνητή νοημοσύνη ; Ελληνική γλώσσαΠερίληψη
Η ελληνική γλώσσα είναι πάρα πολύ μεγάλη. Αν κάποιος ήθελε να ψάξει ή ακόμα και επεξεργαστεί κάποιες λέξεις, θα έπρεπε να ψάχνει ώρες σε λεξικά, αν δεν είναι γνώστης της ελληνικής γλώσσας. Στην παρούσα διπλωματική εργασία, έχει αναπτυχθεί ένα μοντέλο αλγορίθμων και γραφικού περιβάλλοντος, ως κλάδου της τεχνητής νοημοσύνης, το οποίο θα επεξεργάζεται την ελληνική γλώσσα και θα κάνει εξόρυξη δεδομένων. Αρχικά δίνεται ένα λεξικό από το οποίο φτιάχνεται η βάση δεδομένων. Η βάση δεδομένων έχει φτιαχτεί με τέτοιο τρόπο έτσι ώστε να αποσπά εύκολα πληροφορίες το πρόγραμμα, χωρίς μεγάλη δυσκολία. Ύστερα η εφαρμογή χωρίζει την πρόταση σε λέξεις, ανάλογα με τους κενούς χαρακτήρες και τα σημεία στίξης και θα αναζητάει τις πληροφορίες της κάθε λέξης στη βάση δεδομένων. Οι πληροφορίες που θα παρέχει είναι πολυπληθείς, καθώς επιστρέφει μέρος του λόγου, πτώση, βαθμό, αριθμό, γένος και πολλά άλλα. Επιπλέον μετά την αναζήτηση των λέξεων ξεχωριστά αναγνωρίζει σε κάθε πρόταση το υποκείμενο, ρήμα, άμεσο κι έμμεσο αντικείμενο αυτόματα, με βάση τους κανόνες της γραμματικής. Όταν εξακριβώνει τι είναι η κάθε λέξη, το απαριθμεί και το εκτυπώνει (Relational Grammar). Τέλος η παρούσα διπλωματική συμβάλλει στον αποτελεσματικό και γρήγορο τρόπο εξόρυξης δεδομένων με τη βοήθεια της τεχνητής νοημοσύνης και παρέχει βαθιά εκμάθηση της πλούσιας ελληνικής γλώσσας.
Περίληψη
The Greek language is significantly large. If someone wanted to search for or even process certain words, they would have to spend hours looking through dictionaries if they are not familiar with the Greek language. In this thesis, an algorithmic model and graphical interface will be developed, as a branch of artificial intelligence, which will process the Greek language and perform data mining. Initially, a dictionary will be provided, from which the database will be created for the data mining process. The database will be constructed in such a way that the program can easily extract information without much difficulty. Then, the application will break down the sentence into words, based on the spaces and punctuation marks, and will search for the information of each word in the database. The information provided will be abundant, as it will return the part of speech, case, degree, number, gender, and much more. Additionally, after searching for the words individually, it will automatically recognize the subject, verb, direct and indirect object in each sentence, based on grammar rules. Once it identifies what each word is, it will enumerate and print it (Relational Grammar). Finally, this thesis contributes to an effective and fast way of data mining with the help of artificial intelligence and provides a deep learning experience of the rich Greek language.