Ανάλυση συναισθήματος προτιμήσεων χρηστών στον ταξιδιωτικό κλάδο με αλγορίθμους μηχανικής μάθησης
Sentiment analysis of user preferences in the tourism sector using machine learning algorithms
Keywords
Συναισθηματική ανάλυση ; Tαξιδιωτικός κλάδος ; Eξόρυξη δεδομένων ; Συναισθηματικές προτιμήσειςAbstract
Η παρούσα διπλωματική εργασία έχει ως στόχο την ανάπτυξη μιας πλήρους ανάλυσης της
αγοράς στον τομέα του ταξιδιωτικού κλάδου. Αρχικά, επιλέχτηκε ένα κατάλληλο σύνολο
δεδομένων από την πλατφόρμα Kaggle το οποίο περιέχει διάφορες τουριστικές πληροφορίες
οι οποίες αφορούν όχι μόνο τα ίδια τα ξενοδοχεία, όπως το όνομα του, την τοποθεσία του,
την κατηγορία του ξενοδοχείου κ.α αλλά και πληροφορίες για τους ίδιους τους χρήστες που
γράφουν την κριτική, όπως το username τους, το κειμένο της κριτικής και την βαθμολογία.
Το σύνολο δεδομένων αρχικά αναλύθηκε, οπτικοποιήθηκε και έπειτα επεξεργάστηκε ώστε
να μπορέσουμε να κατανοήσουμε ολοκληρωτικά τα δεδομένα μας και να εξάγουμε διάφορα
συμπεράσματα , που θα μας επιτρέπουν να αποκτήσουμε μια πιο ολοκληρωμένη εικόνα και
να αναδείξουμε σημαντικούς τομείς της αγοράς ώστε να ανιχνευθούν προτιμήσεις πελατών
και να αναλυθούν οι τάσεις του ταξιδιωτικού κλάδου. Εξετάστηκαν οι προτιμήσεις των
χρηστών λαμβάνοντας υπόψη την τοποθεσία που έχουν επισκεφθεί και τις παροχές των
ξενοδοχείων (όπως η προσφορά πρωινού) κ.λπ. Επιπλέον, μελετήθηκε η ανίχνευση
συναισθηματικών προτιμήσεων και αντιδράσεων των χρηστών βάσει των σχολίων και των
αναφορών τους. Στο δεύτερο μέρος της διπλωματικής εργασίας, εφαρμόστηκαν διάφοροι
αλγόριθμοι μηχανικής και βαθιάς μάθησης με σκοπό την εκπαίδευσή τους πάνω στα
δεδομένα , ώστε να είναι ικανοί να προβλέπουν τις βαθμολογίες από τα κείμενα κριτικών.
Τα αποτελέσματα αυτά συλλέχτηκαν και σχολιάστηκαν, ενώ αξιολογήθηκαν και οι
αλγόριθμοι που χρησιμοποιήθηκαν. Μέσω αυτής της έρευνας επιδιώκεται η καλύτερη
κατανόηση των προτιμήσεων των χρηστών προκειμένου να προσδιοριστούν μοτίβα και
τάσεις στον τουριστικό τομέα αλλά και η εύρεση του καταλληλότερου αλγορίθμου για τα
συγκεκριμένα δεδομένα.
Abstract
This thesis aims to develop a complete market analysis in the field of the travel industry.
Initially, a suitable data set was selected from the Kaggle platform which contains various
tourist information concerning not only the hotels themselves, such as the name, location,
category of the hotel, etc. but also information about the hotels themselves. users writing the
review, such as their username, review rating and rating. The data set will first be analyzed,
visualized and then processed so that we can fully understand our data and draw various
conclusions, which will allow us to have a more complete picture and highlight important
aspects of the market to detect customer preferences and analyze travel industry trends. User
preferences will be considered taking into account the location they have visited and hotel
amenities (such as breakfast offer) etc. In addition, the detection of emotional preferences
and reactions of users based on their comments and reports will be studied. In the second
part of the thesis, various machine learning and deep learning algorithms will be applied in
order to train them on the data to be able to predict the scores from the review texts. These
results will be collected and commented, while the algorithms used will be evaluated. Through
this research you seek a better understanding of user preferences in order to identify patterns
and trends in the tourism sector but also to find the most appropriate algorithm for the
specific data.