Έρευνα και επισκόπηση αλγορίθμων μηχανικής μάθησης για πολλαπλή κατηγοριοποίηση με χρήση του εργαλείου Weka και εφαρμογή στην εκπαίδευση
Research and overview of machine learning algorithms for multiple classification using the Weka tool and application in education
Keywords
Μηχανική μάθηση ; Κατηγοριοποίηση ; Ταξινόμηση ; Πρόβλεψη ; Απόδοση μαθητών ; WekaAbstract
Η παρούσα διπλωματική εργασία προσεγγίζει ένα θέμα που απασχολεί την ερευνητική κοινότητα, την εφαρμογή αλγορίθμων μηχανικής μάθησης στην εκπαίδευση. Γίνεται εφαρμογή τεχνικών και μεθόδων από το πεδίο της μηχανικής μάθησης με στόχο την πρόβλεψη της απόδοσης των μαθητών, στόχος που επιπλέον παρουσιάζει ενδιαφέρον για την εκπαιδευτική και τη μαθητική κοινότητα.
Αρχικά, γίνεται μια καταγραφή του επιστημονικού πεδίου της μηχανικής μάθησης παρουσιάζοντας και τα τρία είδη μηχανικής μάθησης, τη μάθηση με επίβλεψη, τη μάθηση χωρίς επίβλεψη και τη μάθηση με ενίσχυση. Πραγματοποιήθηκε εκτενέστερη αναφορά στη μάθηση με επίβλεψη και ειδικότερα στους σημαντικότερους αλγορίθμους κατηγοριοποίησης –
ταξινόμησης (classification) που παρουσιάστηκαν αναλυτικά.
Καταγράφονται προηγούμενες έρευνες που δείχνουν ότι η χρήση αλγορίθμων κατηγοριοποίησης υλοποιείται για την πρόβλεψη της απόδοσης των μαθητών, αλλά και για άλλους μαθησιακούς στόχους με ποικίλα ποσοστά επιτυχίας.
Στη συνέχεια γίνεται παρουσίαση του λογισμικού εξόρυξης γνώσης Weka, που αποτελεί ένα δημοφιλές εργαλείο έρευνας και εφαρμογής αλγορίθμων μηχανικής μάθησης. Οι αλγόριθμοι του Weka εκπαιδεύτηκαν σε ένα σύνολο εκπαιδευτικών δεδομένων που αντλήθηκε από το Διαδίκτυο. Τα δεδομένα χωρίστηκαν σε 2 και σε 5 κλάσεις και εκτελέστηκαν οι αλγόριθμοι κατηγοριοποίησης. Σύμφωνα με τα αποτελέσματα των πειραμάτων οι μέθοδοι κατηγοριοποίησης μπορούν να εφαρμοστούν επιτυχώς, καθώς η απόδοση τους κυμάνθηκε από 80% έως 95% περίπου.
Abstract
This diploma thesis approaches a topic that concerns the research community, the application of machine learning algorithms in education. Techniques and methods from the field of machine learning are applied with the aim of predicting student performance, a goal that is also of interest to the educational and student community.
First, an overview of the scientific field of machine learning is given, presenting all three types of machine learning, supervised learning, unsupervised learning, and reinforcement learning. A more extensive reference was made to supervised learning and in particular to the most important classification algorithms that were presented in detail.
Previous research is documented showing that the use of categorization algorithms is implemented to predict student performance, but also for other learning objectives with varying success rates.
Weka data mining software is then presented, which is a popular tool for research and application of machine learning algorithms. Weka's algorithms were trained on a training data set from the Internet. The data were divided into 2 and 5 classes and the classification algorithms were performed. According to the results of the experiments, the classification methods can be applied successfully, as their performance ranged from 80% to 95% approximately.