Εντοπισμός ρητορικής μίσους με βαθιά μάθηση

Λυερός, Κωνσταντίνος

Hate speech detection with deep learning

Διπλωματική εργασία

Author

Λυερός, Κωνσταντίνος

Date

2022-03-04

Advisor

Tselenti, Panagiota

ice_47429.PDF (2.484Mb)

Keywords

Ρητορική μίσους ; Μηχανική μάθηση ; Βαθιά μάθηση ; Μοντέλα βαθιάς μάθησης ; Προεκπαιδευμένες ενσωματώσεις λέξεων

Abstract

Με τη ραγδαία εξέλιξη της τεχνολογίας και την ευκολία που προσφέρει το Διαδίκτυο στην επικοινωνία και στην ελεύθερη διατύπωση σκέψεων και ιδεών, ολοένα και περισσότεροι άνθρωποι τείνουν να χρησιμοποιούν διάφορες πλατφόρμες και μέσα κοινωνικής δικτύωσης για να αλληλεπιδρούν μεταξύ τους. Ωστόσο, η ανωνυμία σε συνδυασμό με την ελευθερία έκφρασης του λόγου που διατίθεται στους χρήστες οδηγεί πολλές φορές στην ανάπτυξη ρητορικής μίσους. Ο όρος ρητορική μίσους αναφέρεται στον λόγο που προσβάλει-επιτίθεται σε ένα άτομο ή και ομάδα ατόμων, βασισμένος σε συγκεκριμένα χαρακτηριστικά, όπως η φυλή, η θρησκεία, η εθνοτική καταγωγή, ο σεξουαλικός προσανατολισμός, η αναπηρία ή το φύλο. Έχει γίνει μεγάλη προσπάθεια από τους δημιουργούς τέτοιων μέσων κοινωνικής δικτύωσης να καταπολεμηθεί αυτό το πλέον συχνό φαινόμενο. Στην πληροφορική, ο τομέας της Τεχνητής Νοημοσύνης φαίνεται να προσφέρει τις σημαντικότερες λύσεις στο συγκεκριμένο πρόβλημα. Πιο συγκεκριμένα, με την μελέτη της αναγνώρισης προτύπων σε συνδυασμό με την τεχνητή νοημοσύνη αναπτύχθηκε ένα υποπεδίο της επιστήμης των υπολογιστών η Μηχανική Μάθηση. Μια από τις τεχνικές μηχανικής μάθησης είναι η Βαθιά Μάθηση (Deep Learning), η οποία στην ουσία της προσπαθεί να μοντελοποιήσει τον τρόπο που αντιλαμβάνεται και αξιολογεί ο ανθρώπινος εγκέφαλος τα οπτικοακουστικά ερεθίσματα. Η παρούσα διπλωματική εργασία έχει ως σκοπό την χρήση τεχνικών Βαθιάς Μάθησης για τον εντοπισμό της ρητορικής μίσους σε κείμενα του διαδικτύου και συγκεκριμένα σε πλατφόρμες, όπως το Twitter, το YouTube και το Reddit και την περαιτέρω κατηγοριοποίηση της σε ένα από τα προαναφερθέντα χαρακτηριστικά φυλή, θρησκεία, εθνοτική καταγωγή, σεξουαλικό προσανατολισμό, αναπηρία ή φύλο. Η κατηγοριοποίηση, γίνεται σε κείμενα τόσο της αγγλικής, όσο και της ελληνικής γλώσσας. Τα σύνολα δεδομένων που επιλέχθηκαν για να εξυπηρετήσουν το σκοπό αυτό είναι το ‘Ethos_Dataset_Multi_label’ (Mollas, Chrysopoulou, Karlos, et al., 2022), που περιέχει κείμενα από τις πλατφόρμες Reddit και YouTube, στην αγγλική γλώσσα και το ‘OGTD’(Pitenis, Zampieri, and Ranasinghe, 2020), που περιέχει κείμενα από την πλατφόρμα Twitter, στα ελληνικά. Το σύνολο δεδομένων ‘OGTD’, μάλιστα, τροποποιήθηκε έτσι ώστε να εξυπηρετεί τον σκοπό της εργασίας.

Abstract

With the rapid advancement of technology and the ease with which the Internet offers communication and the free expression of thoughts and ideas, more and more people tend to use various platforms and social media to interact with each other. However, anonymity combined with the freedom of speech available to users often leads to the development of hate speech. The term hate speech refers to the speech that offends an individual or a group of people, based on specific characteristics, such as race, religion, ethnicity, sexual orientation, disability or gender. Great effort has been made by the creators of such social media to combat this most common phenomenon. In computer science, the field of Artificial Intelligence seems to offer the most important solutions to this problem. More specifically, with the study of pattern recognition in conjunction with artificial intelligence, a field of computer science, Machine Learning, was developed. One of the machine learning techniques is Deep Learning, which in essence tries to model the way the human brain perceives and evaluates audiovisual stimuli. This dissertation aims to use Deep Learning techniques to detect hate speech in Internet texts and in particular on platforms such as Twitter and YouTube and to further categorize it into one of the above characteristics: race, religion, ethnicity, sexual orientation, disability or gender.