Διαχείριση δεδομένων βιβλιοθηκών στην πλατφόρμα WEKA: υποσυστήματα Explorer & Knowledge Flow

Σερέτη, Χρυσάνθη

dc.contributor.advisor	Triantafyllou, Ioannis
dc.contributor.author	Σερέτη, Χρυσάνθη
dc.date.accessioned	2021-02-05T07:34:37Z
dc.date.available	2021-02-05T07:34:37Z
dc.date.issued	2020-09-26
dc.identifier.uri	https://polynoe.lib.uniwa.gr/xmlui/handle/11400/174
dc.identifier.uri	http://dx.doi.org/10.26265/polynoe-25
dc.description.abstract	Στην παρούσα εργασία θα παρουσιαστούν και θα συγκριθούν τα υποσυστήματα Explorer και Knowledge Flow του περιβάλλοντος εξόρυξης δεδομένων WEKA. Η σύγκριση θα γίνει σε θεωρητικό πλαίσιο, αλλά και σε πειραματικό επίπεδο με σκοπό την εύρεση ενός μοντέλου πρόβλεψης για τον τύπο και την ηλικία των χρηστών της Δημόσιας Βιβλιοθήκης του Σαν Φρανσίσκο σε σχέση με την συμπεριφορά τους στην κίνηση υλικού. Η τεχνική που χρησιμοποιήθηκε για την δημιουργία πρόβλεψης είναι η τεχνική της ταξινόμησης-κατηγοριοποίησης (classification) με βάση τους αλγορίθμους K-NN, SVM, Random Forest, Decision Tree, και Naive Bayes σε ένα σύνολο δεδομένων προερχόμενο από την ίδια την βιβλιοθήκη. Σύμφωνα με την θεωρητική προσέγγιση, τα δύο περιβάλλοντα παρέχουν την ίδια συλλογή αλγορίθμων μηχανικής μάθησης καθώς και εργαλεία προ-επεξεργασίας δεδομένων. Στις πειραματικές δοκιμές επίσης, απέδωσαν τα ίδια αποτελέσματα. Η μέθοδος επικύρωσης που χρησιμοποιήθηκε είναι αυτή της διασταυρωμένης επικύρωσης με 10 folds. Το περιβάλλον του Explorer φαίνεται ότι είναι μία διεπαφή χρήστη στην οποία απαιτείται αρκετός χρόνος εξοικείωσης αλλά προσφέρει μεγαλύτερη ευελιξία και δυνατότητες. Το περιβάλλον του Knowledge Flow είναι γραφικό και λειτουργεί με κόμβους, διασυνδέσεις και drag and drop μενού. Οι μέθοδοι που ανταποκρίθηκαν καλύτερα είναι οι Random Forest, Random Tree και K-nn όπου τα αποτελέσματα τους αν και ήταν αποδεκτά αφού το f-measure έφτασε το 61.7%, δεν θεωρείται ενθαρρυντική απόδοση. Τελικά, η αρχική ερευνητική υπόθεση καταλήγει στο συμπέρασμα ότι δεν υπάρχει έντονη συσχέτιση της ηλικίας με την συμπεριφορά δανεισμού των χρηστών, και εξαρτάται από άλλους παράγοντες.	el
dc.format.extent	158	el
dc.language.iso	el	el
dc.publisher	Πανεπιστήμιο Δυτικής Αττικής	el
dc.rights	Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 4.0 Διεθνές	*
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/4.0/	*
dc.subject	Weka	el
dc.subject	Explorer	el
dc.subject	Knowledge Flow	el
dc.subject	Classification	el
dc.subject	Ταξινόμηση-Κατηγοριοποίηση	el
dc.subject	Επιλογή χαρακτηριστικών	el
dc.subject	Feature selection	el
dc.title	Διαχείριση δεδομένων βιβλιοθηκών στην πλατφόρμα WEKA: υποσυστήματα Explorer & Knowledge Flow	el
dc.title.alternative	Library data management on the WEKA platform: Explorer & Knowledge Flow subsystems	el
dc.type	Μεταπτυχιακή διπλωματική εργασία	el
dc.contributor.committee	Kouis, Dimitris
dc.contributor.committee	Kyprianos, Konstantinos
dc.contributor.faculty	Σχολή Διοικητικών, Οικονομικών & Κοινωνικών Επιστημών	el
dc.contributor.department	Τμήμα Αρχειονομίας, Βιβλιοθηκονομίας και Συστημάτων Πληροφόρησης	el
dc.contributor.master	Διαχείριση Πληροφοριών σε Βιβλιοθήκες, Αρχεία, Μουσεία	el
dc.description.abstracttranslated	In the present work, the Explorer and Knowledge Flow subsystems of the WEKA data mining environment will be presented and compared. The comparison will be made in a theoretical context, but also on an experimental level in order to find a prediction model for the type and age of the users of the San Francisco Public Library in relation to their behavior in the movement of material. The technique used to create the forecast is the classification technique based on the algorithms K-NN, SVM, Random Forest, Decision Tree, and Naive Bayes in a data set from the library itself. According to the theoretical approach, the two environments provide the same set of machine learning algorithms as well as data pre-processing tools. In the experimental tests they also gave the same results. The validation method used is that of cross-validation with 10 folds. The Explorer interface seems to be a user interface that takes a lot of familiarization time but offers more flexibility and features. The Knowledge Flow interface is graphical and works with nodes, interfaces and drag and drop menus. The methods that responded best are Random Forest, Random Tree and K-nn where their results, although acceptable after the f-measure reached 61.7%, are not considered encouraging performance. Ultimately, the original research hypothesis concludes that there is no strong correlation between age and consumer lending behavior, and it depends on other factors.	el

Αρχεία σε αυτό το τεκμήριο

Όνομα:: Sereti_186882012.pdf
Μέγεθος:: 5.631Mb
Τύπος:: PDF
Περιγραφή:: Μεταπτυχιακή εργασία

Προβολή/Άνοιγμα

Αυτό το τεκμήριο εμφανίζεται στις ακόλουθες συλλογές

Μεταπτυχιακές διπλωματικές εργασίες - Διαχείριση Πληροφοριών σε Βιβλιοθήκες, Αρχεία, Μουσεία
Μεταπτυχιακές διπλωματικές εργασίες ΠΜΣ Διαχείριση Πληροφοριών σε Βιβλιοθήκες, Αρχεία, Μουσεία

Εμφάνιση απλής εγγραφής

Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 4.0 Διεθνές

Εκτός από όπου επισημαίνεται κάτι διαφορετικό, το τεκμήριο διανέμεται με την ακόλουθη άδεια:
Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 4.0 Διεθνές