Δημιουργία εκπαιδευτικού περιεχομένου για την «Εξόρυξη δεδομένων με χρήση τεχνικών μηχανικής μάθησης»
Educational content for "Data Mining Using Machine Learning Techniques"
Διπλωματική εργασία
Συγγραφέας
Τσολακίδης, Αναστάσιος
Ημερομηνία
2021-07-15Επιβλέπων
Skourlas, ChristosΛέξεις-κλειδιά
e-learning ; Κατηγοριοποίηση ; Συσταδοποίηση ; Παλινδρόμηση ; Εξόρυξη δεδομένωνΠερίληψη
H εξόρυξη δεδομένων τα τελευταία χρόνια εμφανίζει πολύ μεγάλη εξέλιξη και
αποτελεί έναν από τους βασικούς τομείς ανάλυσης δεδομένων στο τομέα της
πληροφορικής. Η χρήση των αλγορίθμων της εξόρυξης δεδομένων αυξάνεται συνεχώς
καθώς είναι εφικτή η επίλυση προβλημάτων τα οποία περιέχουν μεγάλα δεδομένα και τα
οποία δεν θα μπορούσαμε να διαχειριστούμε με τους παραδοσιακούς τρόπους ανάλυσης.
Συνεπώς η γνώση των μεθόδων εξόρυξης γνώσης και της μηχανικής μάθησης αποτελούν
απαραίτητα εφόδια για αυτούς που θέλουν να ασχοληθούν με τον τομέα της ανάλυσης
δεδομένων. Οι ψηφιακές δεξιότητες και ικανότητες που απαιτούνται μπορούν να
αποκτηθούν διαδικτυακά μέσω της εξ αποστάσεως εκπαίδευσης.
Η εξ αποστάσεως εκπαίδευση δίνει την δυνατότητα στους εκπαιδευόμενους να
παρακολουθήσουν ασύγχρονα τις θεματικές ενότητες του μαθήματος κάνοντας χρήση
των σημειώσεων και του οπτικοακουστικού υλικού. Στην παρούσα διπλωματική εργασία
δημιουργήθηκε ένα διαδικτυακό μάθημα με σκοπό την ανάπτυξη των απαραίτητων
γνώσεων και δεξιοτήτων για την εξόρυξη γνώσης από βάσεις δεδομένων, με χρήση
σύγχρονων τεχνικών και μεθοδολογιών, Στόχος είναι η υποβοήθηση της λήψης
αποφάσεων για μια εταιρία ή έναν οργανισμό. Οι εκπαιδευόμενοι έρχονται σε επαφή με
τα χρήσιμα εργαλεία για το σχεδιασμό, ανάπτυξη και εφαρμογή ενός συστήματος
εξόρυξης γνώσης και λήψης αποφάσεων. Με τον τρόπο αυτό καλύπτονται οι ανάγκες που
προκύπτουν από τη λειτουργία πληροφοριακών συστημάτων προς την κατεύθυνση της
πρόβλεψης πιθανών καταστάσεων, την κατηγοριοποίηση των δεδομένων και την εξαγωγή
χρήσιμων συμπερασμάτων.
Το μάθημα περιλαμβάνει έξι (6) διδακτικές ενότητες και έχει σχεδιαστεί με γνώμονα
να παρέχει τις απαραίτητες γνώσεις στους νέους επιστήμονες του χώρου της ανάλυσης
δεδομένων:
ΔΕ1: Μεθοδολογία Διαχείρισης γνώσης από βάσεις δεδομένων
ΔΕ2: Επεξεργασία και διαχείριση δεδομένων και μεταβλητών
ΔΕ3:Μελέτη , σχεδιασμός και εφαρμογή τεχνικών Κατηγοριοποίησης
(Classification)
ΔΕ4: Μελέτη, σχεδιασμός και εφαρμογή τεχνικών Συσταδοποίησης (clustering)
ΔΕ5: Μελέτη, σχεδιασμός και εφαρμογή τεχνικών Πρόβλεψης (Prediction).
ΔΕ6: Μελέτη, σχεδιασμός και εφαρμογή τεχνικών Παλινδρόμησης (Regression).
Περίληψη
Nowadays, data mining has shown great development and is one of the key areas of
data analysis in the field of information technology. The use of data mining algorithms is
constantly increasing as it is possible to solve problems that contain big data and complex
problems which could not be managed by traditional ways of analysis. Therefore, data
mining and machine learning are prerequisite digital skills and competencies for those
scientists who want to deal with data analysis and these skills can be acquired through
online distance learning.
Distance learning schemes enable learners to attend the course through online
educational material. The goal of the online course is the following: to develop the digital
skills (of the students-learners) for extracting knowledge from databases, using modern
techniques and methodologies. Another goal of the course is to assist learners in making
decisions for a company or an organization. In the framework of the course, Learners work
with useful tools for designing, developing and implementing a knowledge mining and
decision-making system which is necessary for the operation of information systems in the
direction of predicting possible situations, categorizing data and extracting useful
conclusions. The course includes six (6) Units and is designed to provide the necessary
knowledge to new scientists in the field of data analysis:
• DE1: Database Knowledge Management Methodology
• DE2: Processing and management of data and variables
• DE3: Study, design and application of Classification techniques
• DE4: Study, design and application of clustering techniques
• DE5: Study, design and application of Prediction techniques.
• DE6: Study, design and application of Regression techniques.