Ανάλυση συναισθήματος σε δεδομένα από το Twitter με χρήση αλγορίθμων μηχανικής μάθησης
Sentimental analysis in Twitter data using machine learning algorithms
Μεταπτυχιακή διπλωματική εργασία
Author
Χασαπόπουλος, Αριστοτέλης
Date
2021-11-14Advisor
Troussas, ChristosKeywords
Μηχανική μάθηση ; Εξόρυξη δεδομένων ; Ανάλυση συναισθήματος ; ΚείμενοAbstract
Η παρούσα διπλωματική εργασία έχει ως κύριο θεματικό άξονα την Ανάλυση Συναισθήματος για δεδομένα που προέρχονται από το κοινωνικό δίκτυο Twitter. Με τον όρο «ανάλυση συναισθήματος» αναφερόμαστε σε μια αυτοματοποιημένη διαδικασία που προσδιορίζει τη συναισθηματική πολικότητα ενός κειμένου. Ως κλάδος έχει συγκεντρώσει τα βλέμματα τόσο της επιστημονικής κοινότητας όσο και διάφορων επιχειρηματικών κλάδων, αφού η ευρεία ενσωμάτωση των διαδικτυακών κοινωνικών δικτύων στην καθημερινότητα, έχει δημιουργήσει άφθονα και ευκόλως προσβάσιμα δεδομένα προς επεξεργασία και εξαγωγή συμπερασμάτων. Ο κλάδος της Ανάλυσης Συναισθήματος περιέχει μεθόδους που ανήκουν στους επιστημονικούς τομείς της Τεχνητής Νοημοσύνης, της Μηχανικής Μάθησης και της Βαθιάς Μάθησης.
Το Κεφάλαιο 1 αποτελεί μια σύντομη εισαγωγή στα κοινωνικά δίκτυα και ειδικότερα στο Twitter. Συγκεκριμένα, περιγράφεται η δομή, η λειτουργία του καθώς και οι τομείς στους οποίους μπορεί να διενεργηθεί περαιτέρω ανάλυσή του.
Στη συνέχεια, παρουσιάζονται οι δύο κύριες προσεγγίσεις του κλάδου της Ανάλυσης Συναισθήματος, αυτή της Μηχανικής Μάθησης και αυτή του σημασιολογικού προσανατολισμού. Επιπλέον, παρουσιάζονται τρόποι αναπα- ράστασης χαρακτηριστικών των δεδομένων ενός κειμένου, καθώς και μέθοδοι προεπεξεργασίας κειμένου. Το Κεφάλαιο 2 ολοκληρώνεται με την περιγραφή της διαδικασίας αξιολόγησης των μοντέλων ανάλυσης συναισθήματος.
́Επειτα, στο Κεφάλαιο 3, γίνεται παρουσίαση των πιο διαδεδομένων μοντέλων Μηχανικής Μάθησης που χρησι- μοποιούνται στον κλάδο της ανάλυσης συναισθήματος. Τέτοια μοντέλα είναι η οικογένεια ταξινομητών Bayes, οι μηχανές διανυσματικής υποστήριξης, ο αλγόριθμος k-κοντινότερων γειτόνων και τα συνελικτικά νευρωνικά δίκτυα.
Στο τελευταίο κεφάλαιο γίνεται εφαρμογή 3 αλγορίθμων Μηχανικής Μάθησης και σύγκριση της απόδοσής τους ως προς την κατηγοριοποίηση συναισθήματος. Μετά την παρουσίαση του συνόλου δεδομένων που χρησιμοποι- ήθηκε στα πειράματα, πραγματοποιείται η περιγραφή των μοντέλων που χρησιμοποιήθηκαν και ο σχολιασμός των αποτελεσμάτων. Τα μοντέλα που υλοποιήθηκαν, αναπτύχθηκαν στην έκδοση 3.8 της Python.