Εντοπισμός ρητορικής μίσους με βαθιά μάθηση

Λυερός, Κωνσταντίνος

dc.contributor.advisor	Tselenti, Panagiota
dc.contributor.author	Λυερός, Κωνσταντίνος
dc.date.accessioned	2022-03-22T11:11:57Z
dc.date.available	2022-03-22T11:11:57Z
dc.date.issued	2022-03-04
dc.identifier.uri	https://polynoe.lib.uniwa.gr/xmlui/handle/11400/1943
dc.identifier.uri	http://dx.doi.org/10.26265/polynoe-1794
dc.description.abstract	Με τη ραγδαία εξέλιξη της τεχνολογίας και την ευκολία που προσφέρει το Διαδίκτυο στην επικοινωνία και στην ελεύθερη διατύπωση σκέψεων και ιδεών, ολοένα και περισσότεροι άνθρωποι τείνουν να χρησιμοποιούν διάφορες πλατφόρμες και μέσα κοινωνικής δικτύωσης για να αλληλεπιδρούν μεταξύ τους. Ωστόσο, η ανωνυμία σε συνδυασμό με την ελευθερία έκφρασης του λόγου που διατίθεται στους χρήστες οδηγεί πολλές φορές στην ανάπτυξη ρητορικής μίσους. Ο όρος ρητορική μίσους αναφέρεται στον λόγο που προσβάλει-επιτίθεται σε ένα άτομο ή και ομάδα ατόμων, βασισμένος σε συγκεκριμένα χαρακτηριστικά, όπως η φυλή, η θρησκεία, η εθνοτική καταγωγή, ο σεξουαλικός προσανατολισμός, η αναπηρία ή το φύλο. Έχει γίνει μεγάλη προσπάθεια από τους δημιουργούς τέτοιων μέσων κοινωνικής δικτύωσης να καταπολεμηθεί αυτό το πλέον συχνό φαινόμενο. Στην πληροφορική, ο τομέας της Τεχνητής Νοημοσύνης φαίνεται να προσφέρει τις σημαντικότερες λύσεις στο συγκεκριμένο πρόβλημα. Πιο συγκεκριμένα, με την μελέτη της αναγνώρισης προτύπων σε συνδυασμό με την τεχνητή νοημοσύνη αναπτύχθηκε ένα υποπεδίο της επιστήμης των υπολογιστών η Μηχανική Μάθηση. Μια από τις τεχνικές μηχανικής μάθησης είναι η Βαθιά Μάθηση (Deep Learning), η οποία στην ουσία της προσπαθεί να μοντελοποιήσει τον τρόπο που αντιλαμβάνεται και αξιολογεί ο ανθρώπινος εγκέφαλος τα οπτικοακουστικά ερεθίσματα. Η παρούσα διπλωματική εργασία έχει ως σκοπό την χρήση τεχνικών Βαθιάς Μάθησης για τον εντοπισμό της ρητορικής μίσους σε κείμενα του διαδικτύου και συγκεκριμένα σε πλατφόρμες, όπως το Twitter, το YouTube και το Reddit και την περαιτέρω κατηγοριοποίηση της σε ένα από τα προαναφερθέντα χαρακτηριστικά φυλή, θρησκεία, εθνοτική καταγωγή, σεξουαλικό προσανατολισμό, αναπηρία ή φύλο. Η κατηγοριοποίηση, γίνεται σε κείμενα τόσο της αγγλικής, όσο και της ελληνικής γλώσσας. Τα σύνολα δεδομένων που επιλέχθηκαν για να εξυπηρετήσουν το σκοπό αυτό είναι το ‘Ethos_Dataset_Multi_label’ (Mollas, Chrysopoulou, Karlos, et al., 2022), που περιέχει κείμενα από τις πλατφόρμες Reddit και YouTube, στην αγγλική γλώσσα και το ‘OGTD’(Pitenis, Zampieri, and Ranasinghe, 2020), που περιέχει κείμενα από την πλατφόρμα Twitter, στα ελληνικά. Το σύνολο δεδομένων ‘OGTD’, μάλιστα, τροποποιήθηκε έτσι ώστε να εξυπηρετεί τον σκοπό της εργασίας.	el
dc.format.extent	72	el
dc.language.iso	el	el
dc.publisher	Πανεπιστήμιο Δυτικής Αττικής	el
dc.rights	Αναφορά Δημιουργού - Μη Εμπορική Χρήση - Παρόμοια Διανομή 4.0 Διεθνές	*
dc.rights.uri	https://creativecommons.org/licenses/by-nc-sa/4.0/deed.el	*
dc.subject	Ρητορική μίσους	el
dc.subject	Μηχανική μάθηση	el
dc.subject	Βαθιά μάθηση	el
dc.subject	Μοντέλα βαθιάς μάθησης	el
dc.subject	Προεκπαιδευμένες ενσωματώσεις λέξεων	el
dc.title	Εντοπισμός ρητορικής μίσους με βαθιά μάθηση	el
dc.title.alternative	Hate speech detection with deep learning	el
dc.type	Διπλωματική εργασία	el
dc.contributor.committee	Μαστοροκώστας, Πάρις
dc.contributor.committee	Μπαρδής, Γεώργιος
dc.contributor.faculty	Σχολή Μηχανικών	el
dc.contributor.department	Τμήμα Μηχανικών Πληροφορικής και Υπολογιστών	el
dc.description.abstracttranslated	With the rapid advancement of technology and the ease with which the Internet offers communication and the free expression of thoughts and ideas, more and more people tend to use various platforms and social media to interact with each other. However, anonymity combined with the freedom of speech available to users often leads to the development of hate speech. The term hate speech refers to the speech that offends an individual or a group of people, based on specific characteristics, such as race, religion, ethnicity, sexual orientation, disability or gender. Great effort has been made by the creators of such social media to combat this most common phenomenon. In computer science, the field of Artificial Intelligence seems to offer the most important solutions to this problem. More specifically, with the study of pattern recognition in conjunction with artificial intelligence, a field of computer science, Machine Learning, was developed. One of the machine learning techniques is Deep Learning, which in essence tries to model the way the human brain perceives and evaluates audiovisual stimuli. This dissertation aims to use Deep Learning techniques to detect hate speech in Internet texts and in particular on platforms such as Twitter and YouTube and to further categorize it into one of the above characteristics: race, religion, ethnicity, sexual orientation, disability or gender.	el

Files in this item

Name:: ice_47429.PDF
Size:: 2.484Mb
Format:: PDF

View/Open

This item appears in the following Collection(s)

Διπλωματικές εργασίες
Διπλωματικές εργασίες τμήματος Μηχανικών Πληροφορικής και Υπολογιστών

Show simple item record

Except where otherwise noted, this item's license is described as
Αναφορά Δημιουργού - Μη Εμπορική Χρήση - Παρόμοια Διανομή 4.0 Διεθνές