Εμφάνιση απλής εγγραφής

Σύνθεση και ανίχνευση πλαστών (deep fake) βίντεο με αλγορίθμους βαθιάς μηχανικής μάθησης

dc.contributor.advisorΒουλόδημος, Αθανάσιος
dc.contributor.authorΔρόσου, Μαρία
dc.date.accessioned2021-07-20T12:09:55Z
dc.date.available2021-07-20T12:09:55Z
dc.date.issued2021-07-15
dc.identifier.urihttps://polynoe.lib.uniwa.gr/xmlui/handle/11400/858
dc.identifier.urihttp://dx.doi.org/10.26265/polynoe-709
dc.description.abstractΗ σύνθεση πλαστών (deep fake) βίντεο γίνεται με την εφαρμογή μηχανικής μάθησης και τεχνητής νοημοσύνης. Τα βίντεο αυτά δύναται να χρησιμοποιηθούν με καλές προθέσεις, όπως για παράδειγμα ως χιουμοριστικά βίντεο. Σε κάποιες περιπτώσεις όμως η χρήση τους μπορεί να είναι κακόβουλη, να έχουν δηλαδή στόχο την εξαπάτηση μέσω της προβολής τους ως δήθεν πραγματικά βίντεο. Λόγω της δυνητικά μεγάλης επιρροής που μπορούν να ασκήσουν τα βίντεο αυτά στη δημόσια σφαίρα, είναι αναγκαία η ανάπτυξη μοντέλων που μπορούν να ταυτοποιούν τέτοιες περιπτώσεις. Στα πλαίσια της παρούσας εργασίας εισαγωγικά επισημαίνονται οι θετικοί και αρνητικοί τρόποι χρήσης τεχνολογιών σύνθεσης πλαστών βίντεο και εικόνων. Στη συνέχεια προσδιορίζονται οι κατηγορίες πλαστών βίντεο και παρουσιάζονται υπάρχουσες εφαρμογές σύνθεσής τους. Ακολούθως αναφέρονται μέθοδοι που έχουν αναπτυχθεί ως τώρα με στόχο την ανίχνευσή πλαστών βίντεο. Οι μέθοδοι αυτοί κατηγοριοποιούνται σε μεθόδους που λαμβάνουν υπόψη την χρονική πληροφορία, δηλαδή την αλλαγή των χαρακτηριστικών μέσα σε μια αλληλουχία στιγμιότυπων του βίντεο, και σε μεθόδους που βασίζονται αποκλειστικά στη χωρική πληροφορία που εξάγεται από το κάθε στιγμιότυπο. Τέλος, παρουσιάζεται η δομή τεσσάρων μοντέλων μηχανικής μάθησης, του R3D, του MC3, του R2Plus1D και του I3D. Στα πλαίσια της παρούσας εργασίας τα μοντέλα αυτά εκπαιδεύτηκαν στα δείγματα του συνόλου Celeb-DF-v2, με στόχο να ταξινομούν βίντεο σε πλαστά ή αυθεντικά. Τα αποτελέσματά τους παρουσιάζονται, αξιολογούνται και συγκρίνονται ως προς την ικανότητα ανίχνευσης πλαστών (deep fake) βίντεο.el
dc.format.extent61el
dc.language.isoelel
dc.publisherΠανεπιστήμιο Δυτικής Αττικήςel
dc.rightsΑναφορά Δημιουργού - Μη Εμπορική Χρήση - Παρόμοια Διανομή 4.0 Διεθνές*
dc.rights.urihttps://creativecommons.org/licenses/by-nc-sa/4.0/deed.el*
dc.subjectΌραση υπολογιστώνel
dc.subjectΣύνθεση πλαστών βίντεοel
dc.subjectΑνίχνευση πλαστών βίντεοel
dc.subjectΓενετικά ανταγωνιστικά δίκτυαel
dc.subjectΑυτόματοι κωδικοποιητέςel
dc.subjectΜηχανική μάθησηel
dc.subjectΣυνελικτικά νευρωνικά δίκτυαel
dc.subjectComputer visionel
dc.subjectDeepfake video generationel
dc.subjectDeepfake video detectionel
dc.subjectGenerative adversarial networks - GANel
dc.subjectAutoencodersel
dc.subjectMachine learningel
dc.subjectConvolutional Neural Networks - CNNel
dc.titleΣύνθεση και ανίχνευση πλαστών (deep fake) βίντεο με αλγορίθμους βαθιάς μηχανικής μάθησηςel
dc.title.alternativeDeepfake video generation and detectionel
dc.typeΔιπλωματική εργασίαel
dc.contributor.committeeΜαστοροκώστας, Πάρις
dc.contributor.committeeKesidis, Anastasios
dc.contributor.facultyΣχολή Μηχανικώνel
dc.contributor.departmentΤμήμα Μηχανικών Πληροφορικής και Υπολογιστώνel
dc.description.abstracttranslatedDeep fake video generation uses machine learning and artificial intelligence. The synthesized videos can be used with good intentions, such as humorous videos. In some cases, however, their use can be malicious. That is when they aim to deceive through their promotion as supposedly real videos. Due to the potentially great influence that these videos can have on the public sphere, it is necessary to develop models that can identify such cases. In the context of this paper, the positive and negative ways of using deepfake video and image generation technologies are pointed out. The categories of fake videos are then identified and existing deepfake video generation algorithms are presented. After that, methods that have been developed for deepfake video detection are referenced. These techniques are categorized into methods that take into account temporal information, which is the change of features within a sequence of video frames, and into methods that rely solely on the spatial information extracted from each frame. Finally, the architecture of four machine learning models is presented. These are the R3D, MC3, R2Plus1D and I3D models. In this present dissertation, these models were trained in the Celeb-DF-v2 dataset, with the aim of classifying videos as fake or authentic. Their results are presented, evaluated and compared in terms of the ability to detect deepfake videos.el


Αρχεία σε αυτό το τεκμήριο

Thumbnail

Αυτό το τεκμήριο εμφανίζεται στις ακόλουθες συλλογές

Εμφάνιση απλής εγγραφής

Αναφορά Δημιουργού - Μη Εμπορική Χρήση - Παρόμοια Διανομή 4.0 Διεθνές
Εκτός από όπου επισημαίνεται κάτι διαφορετικό, το τεκμήριο διανέμεται με την ακόλουθη άδεια:
Αναφορά Δημιουργού - Μη Εμπορική Χρήση - Παρόμοια Διανομή 4.0 Διεθνές