Εμφάνιση απλής εγγραφής

dc.contributor.advisorTriantafyllou, Ioannis
dc.contributor.authorΚωτσάκη, Παναγιώτα
dc.date.accessioned2021-01-12T09:28:36Z
dc.date.available2021-01-28T10:50:36Z
dc.date.issued2020-06-11
dc.identifier.urihttps://polynoe.lib.uniwa.gr/xmlui/handle/11400/156
dc.identifier.urihttp://dx.doi.org/10.26265/polynoe-7
dc.description.abstractΣτην παρούσα εργασία συγκρίνουμε τα εργαλεία εξόρυξης δεδομένων KNIME και Knowledge Flow του WEKA σε θεωρητικό αλλά και πειραματικό πλαίσιο με σκοπό την εύρεση ενός μοντέλου πρόβλεψης της διάρκειας ψηφιοποίησης του αρχειακού υλικού (φακέλων) της εταιρείας «Αρχειοθήκη Α.Ε.». Η τεχνική που ακολουθήθηκε για την δημιουργία του μοντέλου πρόβλεψης είναι η τεχνική της παλινδρόμησης με βάση τους αλγορίθμους KNN, SVM, Random Forest, Decision Tree και Linear Regression σε ένα σύνολο δεδομένων προερχόμενο από την ίδια την εταιρεία. Σύμφωνα με τα πειραματικά μας αποτελέσματα, το WEKA και το ΚΝΙΜΕ παρέχουν εξίσου καλά αποτελέσματα πρόβλεψης με το WEKA να διαθέτει περισσότερους αλγορίθμους για την συγκεκριμένη τεχνική εξόρυξης. Το KNIME παρέχει μία πιο εύχρηστη, διαισθητική/ενστικτώδη διεπαφή χρήστη (intuitive user interface), δηλαδή ο χρήστης να είναι σε θέση να χρησιμοποιήσει τη ροή εργασίας εύκολα και γρήγορα χωρίς να χρειάζεται να προβληματιστεί πολύ πώς να το κάνει, ώστε η κατανόηση της ροής να είναι κατάλληλη και για πιο αρχάριους χρήστες. Τα αποτελέσματα μπορεί να διαφέρουν ανάλογα με την εφαρμογή διαφορετικών αλγορίθμων, από τα ευρήματα μας όμως προέκυψε ότι οι αλγόριθμοι Random Forest και Decision Tree έδωσαν τα καλύτερα αποτελέσματα με βάση όλα τα χαρακτηριστικά, όπως ο χρήστης, ο αριθμός των εβδομάδων, ο αριθμός των εγγράφων και ο αριθμός των σελίδων κάθε φακέλου.el
dc.format.extent105el
dc.language.isoelel
dc.publisherΠανεπιστήμιο Δυτικής Αττικήςel
dc.rightsΑναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 4.0 Διεθνές*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/*
dc.subjectWekael
dc.subjectKnimeel
dc.subjectΕξόρυξη δεδομένωνel
dc.subjectΠαλινδρόμησηel
dc.subjectKnnel
dc.subjectSvmel
dc.subjectLinear Regressionel
dc.subjectRandom Forestel
dc.subjectDecision Treeel
dc.titleΔιαχείριση Δεδομένων στις πλατφόρμες ΚΝΙΜE & WEKAel
dc.typeΜεταπτυχιακή διπλωματική εργασίαel
dc.contributor.committeeKouis, Dimitris
dc.contributor.committeeΔενδρινός, Μάρκος
dc.contributor.facultyΣχολή Διοικητικών, Οικονομικών & Κοινωνικών Επιστημώνel
dc.contributor.departmentΤμήμα Αρχειονομίας, Βιβλιοθηκονομίας και Συστημάτων Πληροφόρησηςel
dc.contributor.masterΔιαχείριση Πληροφοριών σε Βιβλιοθήκες, Αρχεία, Μουσείαel
dc.description.abstracttranslatedWithin this thesis we compare the KNIME data mining tools and the graphical environment Knowledge Flow of the WEKA in a theoretical context but also experimentally in order to find a model for predicting the duration of digitization of archival material (files) of the company "Archeiothiki S.A.”. The technique used to create the prediction model is the regression technique based on the KNN, SVM, Random Forest, Decision Tree and Linear Regression algorithms in a set of data from the company itself. According to our experimental results, WEKA and KNIME provide equally good prediction results with WEKA having more algorithms for this particular mining technique. KNIME provides a more useful, instinctive/intuitive user interface, meaning the user is able to use the workflow quickly and easy, without consciously thinking about how to do it, so that the understanding of the flow is appropriate and for more novice users. The results may differ depending on the application of different algorithms· but our findings showed that the Random Forest and Decision Tree algorithms gave the best results based on features such as user, weeks, number of documents and number of pages of each folder.el


Αρχεία σε αυτό το τεκμήριο

Thumbnail
Thumbnail

Αυτό το τεκμήριο εμφανίζεται στις ακόλουθες συλλογές

Εμφάνιση απλής εγγραφής

Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 4.0 Διεθνές
Εκτός από όπου επισημαίνεται κάτι διαφορετικό, το τεκμήριο διανέμεται με την ακόλουθη άδεια:
Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 4.0 Διεθνές