Show simple item record

Εντοπισμός ρητορικής μίσους με βαθιά μάθηση

dc.contributor.advisorTselenti, Panagiota
dc.contributor.authorΛυερός, Κωνσταντίνος
dc.date.accessioned2022-03-22T11:11:57Z
dc.date.available2022-03-22T11:11:57Z
dc.date.issued2022-03-04
dc.identifier.urihttps://polynoe.lib.uniwa.gr/xmlui/handle/11400/1943
dc.identifier.urihttp://dx.doi.org/10.26265/polynoe-1794
dc.description.abstractΜε τη ραγδαία εξέλιξη της τεχνολογίας και την ευκολία που προσφέρει το Διαδίκτυο στην επικοινωνία και στην ελεύθερη διατύπωση σκέψεων και ιδεών, ολοένα και περισσότεροι άνθρωποι τείνουν να χρησιμοποιούν διάφορες πλατφόρμες και μέσα κοινωνικής δικτύωσης για να αλληλεπιδρούν μεταξύ τους. Ωστόσο, η ανωνυμία σε συνδυασμό με την ελευθερία έκφρασης του λόγου που διατίθεται στους χρήστες οδηγεί πολλές φορές στην ανάπτυξη ρητορικής μίσους. Ο όρος ρητορική μίσους αναφέρεται στον λόγο που προσβάλει-επιτίθεται σε ένα άτομο ή και ομάδα ατόμων, βασισμένος σε συγκεκριμένα χαρακτηριστικά, όπως η φυλή, η θρησκεία, η εθνοτική καταγωγή, ο σεξουαλικός προσανατολισμός, η αναπηρία ή το φύλο. Έχει γίνει μεγάλη προσπάθεια από τους δημιουργούς τέτοιων μέσων κοινωνικής δικτύωσης να καταπολεμηθεί αυτό το πλέον συχνό φαινόμενο. Στην πληροφορική, ο τομέας της Τεχνητής Νοημοσύνης φαίνεται να προσφέρει τις σημαντικότερες λύσεις στο συγκεκριμένο πρόβλημα. Πιο συγκεκριμένα, με την μελέτη της αναγνώρισης προτύπων σε συνδυασμό με την τεχνητή νοημοσύνη αναπτύχθηκε ένα υποπεδίο της επιστήμης των υπολογιστών η Μηχανική Μάθηση. Μια από τις τεχνικές μηχανικής μάθησης είναι η Βαθιά Μάθηση (Deep Learning), η οποία στην ουσία της προσπαθεί να μοντελοποιήσει τον τρόπο που αντιλαμβάνεται και αξιολογεί ο ανθρώπινος εγκέφαλος τα οπτικοακουστικά ερεθίσματα. Η παρούσα διπλωματική εργασία έχει ως σκοπό την χρήση τεχνικών Βαθιάς Μάθησης για τον εντοπισμό της ρητορικής μίσους σε κείμενα του διαδικτύου και συγκεκριμένα σε πλατφόρμες, όπως το Twitter, το YouTube και το Reddit και την περαιτέρω κατηγοριοποίηση της σε ένα από τα προαναφερθέντα χαρακτηριστικά φυλή, θρησκεία, εθνοτική καταγωγή, σεξουαλικό προσανατολισμό, αναπηρία ή φύλο. Η κατηγοριοποίηση, γίνεται σε κείμενα τόσο της αγγλικής, όσο και της ελληνικής γλώσσας. Τα σύνολα δεδομένων που επιλέχθηκαν για να εξυπηρετήσουν το σκοπό αυτό είναι το ‘Ethos_Dataset_Multi_label’ (Mollas, Chrysopoulou, Karlos, et al., 2022), που περιέχει κείμενα από τις πλατφόρμες Reddit και YouTube, στην αγγλική γλώσσα και το ‘OGTD’(Pitenis, Zampieri, and Ranasinghe, 2020), που περιέχει κείμενα από την πλατφόρμα Twitter, στα ελληνικά. Το σύνολο δεδομένων ‘OGTD’, μάλιστα, τροποποιήθηκε έτσι ώστε να εξυπηρετεί τον σκοπό της εργασίας.el
dc.format.extent72el
dc.language.isoelel
dc.publisherΠανεπιστήμιο Δυτικής Αττικήςel
dc.rightsΑναφορά Δημιουργού - Μη Εμπορική Χρήση - Παρόμοια Διανομή 4.0 Διεθνές*
dc.rights.urihttps://creativecommons.org/licenses/by-nc-sa/4.0/deed.el*
dc.subjectΡητορική μίσουςel
dc.subjectΜηχανική μάθησηel
dc.subjectΒαθιά μάθησηel
dc.subjectΜοντέλα βαθιάς μάθησηςel
dc.subjectΠροεκπαιδευμένες ενσωματώσεις λέξεωνel
dc.titleΕντοπισμός ρητορικής μίσους με βαθιά μάθησηel
dc.title.alternativeHate speech detection with deep learningel
dc.typeΔιπλωματική εργασίαel
dc.contributor.committeeΜαστοροκώστας, Πάρις
dc.contributor.committeeΜπαρδής, Γεώργιος
dc.contributor.facultyΣχολή Μηχανικώνel
dc.contributor.departmentΤμήμα Μηχανικών Πληροφορικής και Υπολογιστώνel
dc.description.abstracttranslatedWith the rapid advancement of technology and the ease with which the Internet offers communication and the free expression of thoughts and ideas, more and more people tend to use various platforms and social media to interact with each other. However, anonymity combined with the freedom of speech available to users often leads to the development of hate speech. The term hate speech refers to the speech that offends an individual or a group of people, based on specific characteristics, such as race, religion, ethnicity, sexual orientation, disability or gender. Great effort has been made by the creators of such social media to combat this most common phenomenon. In computer science, the field of Artificial Intelligence seems to offer the most important solutions to this problem. More specifically, with the study of pattern recognition in conjunction with artificial intelligence, a field of computer science, Machine Learning, was developed. One of the machine learning techniques is Deep Learning, which in essence tries to model the way the human brain perceives and evaluates audiovisual stimuli. This dissertation aims to use Deep Learning techniques to detect hate speech in Internet texts and in particular on platforms such as Twitter and YouTube and to further categorize it into one of the above characteristics: race, religion, ethnicity, sexual orientation, disability or gender.el


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record

Αναφορά Δημιουργού - Μη Εμπορική Χρήση - Παρόμοια Διανομή 4.0 Διεθνές
Except where otherwise noted, this item's license is described as
Αναφορά Δημιουργού - Μη Εμπορική Χρήση - Παρόμοια Διανομή 4.0 Διεθνές