Εμφάνιση απλής εγγραφής

Διαχείριση μεγάλων δεδομένων από το Twitter και εξόρυξη δεδομένων

dc.contributor.advisorTroussas, Christos
dc.contributor.authorΚουλιανός, Νίκος
dc.date.accessioned2023-10-23T10:41:59Z
dc.date.issued2023-10-06
dc.identifier.urihttps://polynoe.lib.uniwa.gr/xmlui/handle/11400/5449
dc.identifier.urihttp://dx.doi.org/10.26265/polynoe-5286
dc.description.abstractΗ παρούσα διπλωματική εξετάζει την ενσωμάτωση του ισχυρού οικοσυστήματος του Hadoop με την επεξεργασία δεδομένων από το Twitter σε πραγματικό χρόνο, που στη συνέχεια διαχειρίζονται από το πρότυπο του MapReduce. Ο πρωταρχικός στόχος αυτής της έρευνας είναι να εντοπίσει σημαντικές πληροφορίες που κρύβονται μέσα σε μεγάλες και διαρκώς μεταβαλλόμενες πηγές δεδομένων. Στο δεύτερο κεφάλαιο παραθέτονται τα προβλήματα των Μεγάλων Δεδομένων (Big Data), τονίζοντας τους κρίσιμους ρόλους του HDFS και του YARN. Η μελέτη επικεντρώνεται στη δυναμική φύση των δεδομένων του Twitter, με ιδιαίτερη έμφαση στον στρατηγικό ρόλο του Kafka στον συντονισμό των δεδομένων. Εντός αυτού του πλαισίου, το τρίτο κεφάλαιο τονίζει τη θεμελιώδη σημασία του MapReduce, το οποίο έχει επαινεθεί για τις εξαιρετικές του ικανότητες στην υποστήριξη της παράλληλης επεξεργασίας. Επίσης, η έρευνα διευρύνει το πεδίο της ανάλυσης δεδομένων εξερευνώντας πολύπλοκους αλγορίθμους ομαδοποίησης (clustering) και ταξινόμησης (classification), οι οποίοι είναι κρίσιμα εργαλεία για τη συλλογή ωφέλιμων δεδομένων από τον καταιγισμό των πληροφοριών και δεδομένων. Τα επόμενα κεφάλαια εξετάζουν την πραγματική υλοποίηση της μελέτης. Στο τέταρτο και πέμπτο Κεφάλαιο, αποκαλύπτεται το αρχιτεκτονικό σχέδιο, παρέχοντας την απαραίτητη ανάλυση πάνω στο σχεδιασμό. Στο Κεφάλαιο έκτο, αναλύονται προσεκτικά τα δεδομένα του Twitter και τα αποτελέσματα που έχουν εξαχθεί. Το τελευταίο και έβδομο κεφάλαιο ασχολού- μαστε με την πρακτική εφαρμογή, διευρύνοντας το πεδίο για την καθιέρωση ενός συστήματος ολοκληρωμένης αξιολόγησης.el
dc.format.extent87el
dc.language.isoenel
dc.publisherΠανεπιστήμιο Δυτικής Αττικήςel
dc.rightsΑναφορά Δημιουργού - Μη Εμπορική Χρήση - Παρόμοια Διανομή 4.0 Διεθνές*
dc.rights.urihttps://creativecommons.org/licenses/by-nc-sa/4.0/deed.el*
dc.subjectApache Hadoopel
dc.subjectHDFSel
dc.subjectYARNel
dc.subjectMapReduceel
dc.subjectKafkael
dc.subjectTwitterel
dc.subjectClusteringel
dc.subjectClassificationel
dc.subjectStreaming datael
dc.titleΔιαχείριση μεγάλων δεδομένων από το Twitter και εξόρυξη δεδομένωνel
dc.title.alternativeBig data management from Twitter and data miningel
dc.typeΔιπλωματική εργασίαel
dc.contributor.committeeΚρούσκα, Ακριβή
dc.contributor.committeeTselenti, Panagiota
dc.contributor.facultyΣχολή Μηχανικώνel
dc.contributor.departmentΤμήμα Μηχανικών Πληροφορικής και Υπολογιστώνel
dc.description.abstracttranslatedThis thesis investigates the seamless integration of Hadoop's strong ecosystem with real-time Twitter data processing, all managed by the powerful MapReduce paradigm. The primary goal of this research is to find significant insights hidden inside huge and ever-changing data sources. The second chapter sets the scene against the backdrop of Big Data issues, stressing the critical roles of HDFS and YARN. The study focuses on the dynamic nature of Twitter data, with a special emphasis on Kafka's strategic role in data management orchestration. Within this dynamic area, Chapter three emphasizes the fundamental importance of MapReduce, which has been praised for its exceptional powers in aiding parallel processing. The research broadens its reach by delving into complex clustering and classification algorithms, which are critical tools for collecting actionable insight from the vast sea of data. The next chapters dive into the study's actual implementation. In Chapters four and five, the architectural blueprint is unveiled, providing insight into the complex design. In Chapter six, we carefully analyze the intricate Twitter data and share the achieved results. Chapter seven transitions to practical investigation, expanding the scope to establish a thorough evaluation system.el
dcterms.embargoTerms6 monthsel
dcterms.embargoLiftDate2024-04-23T10:41:59Z


Αρχεία σε αυτό το τεκμήριο

Thumbnail

Αυτό το τεκμήριο εμφανίζεται στις ακόλουθες συλλογές

Εμφάνιση απλής εγγραφής

Αναφορά Δημιουργού - Μη Εμπορική Χρήση - Παρόμοια Διανομή 4.0 Διεθνές
Εκτός από όπου επισημαίνεται κάτι διαφορετικό, το τεκμήριο διανέμεται με την ακόλουθη άδεια:
Αναφορά Δημιουργού - Μη Εμπορική Χρήση - Παρόμοια Διανομή 4.0 Διεθνές