dc.contributor.advisor | Kasnesis, Panagiotis | |
dc.contributor.author | Ελευθερίου, Δημήτριος | |
dc.date.accessioned | 2024-07-31T08:24:36Z | |
dc.date.available | 2024-07-31T08:24:36Z | |
dc.date.issued | 2024-07 | |
dc.identifier.uri | https://polynoe.lib.uniwa.gr/xmlui/handle/11400/7271 | |
dc.identifier.uri | http://dx.doi.org/10.26265/polynoe-7103 | |
dc.description.abstract | This thesis delves into two primary areas: the impact of transfer learning on the performance of RL algorithms and the implementation of a transformers-based architecture for learning representations of both states and actions. The proposed architecture, named JASE-DQN (Joint Action and State Embeddings Deep Q-Network), introduces a novel approach by concurrently learning latent representations of state and action attributes, as well as their interdependencies. Transfer learning process is facilitated through the integration of pretrained models for state and action representations within a cross-attention transformer framework. | el |
dc.format.extent | 65 | el |
dc.language.iso | en | el |
dc.publisher | Πανεπιστήμιο Δυτικής Αττικής | el |
dc.rights | Αναφορά Δημιουργού - Μη Εμπορική Χρήση - Παρόμοια Διανομή 4.0 Διεθνές | * |
dc.rights | Attribution-NoDerivatives 4.0 Διεθνές | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nd/4.0/ | * |
dc.subject | Deep reinforcement learning | el |
dc.subject | Embeddings | el |
dc.subject | Transfer learning | el |
dc.subject | Transformers | el |
dc.subject | Atari games | el |
dc.subject | Μεταφορά μάθησης | el |
dc.subject | Βαθιά ενισχυτική μάθηση | el |
dc.subject | Ενισχυτική μάθηση | el |
dc.title | Transferable state & action embeddings in deep reinforcement learning | el |
dc.title.alternative | Μεταβιβάσιμες αναπαραστάσεις καταστάσεων και δράσεων στη βαθιά ενισχυτική μάθηση | el |
dc.type | Μεταπτυχιακή διπλωματική εργασία | el |
dc.contributor.committee | Patrikakis, Charalampos | |
dc.contributor.committee | Leligou, Helen C. (Nelly) | |
dc.contributor.faculty | Σχολή Μηχανικών | el |
dc.contributor.department | Τμήμα Ηλεκτρολόγων και Ηλεκτρονικών Μηχανικών | el |
dc.contributor.department | Τμήμα Μηχανικών Βιομηχανικής Σχεδίασης και Παραγωγής | el |
dc.contributor.master | Τεχνητή Νοημοσύνη και Βαθιά Μάθηση | el |
dc.description.abstracttranslated | Αυτή η διπλωματική εργασία εξετάζει δύο κύριους τομείς: την επίδραση της μεταφοράς μάθησης στην απόδοση των αλγορίθμων ενισχυτικής μάθησης και την εφαρμογή μιας αρχιτεκτονικής βασισμένης σε transformers για την εκμάθηση αναπαραστάσεων τόσο των καταστάσεων όσο και των ενεργειών. Η προτεινόμενη αρχιτεκτονική, με την ονομασία JASE-DQN (Joint Action and State Embeddings Deep Q-Network), εισάγει μια νέα προσέγγιση μαθαίνοντας ταυτόχρονα λανθάνουσες αναπαραστάσεις των χαρακτηριστικών καταστάσεων και ενεργειών, καθώς και τις αλληλεξαρτήσεις τους. Η διαδικασία μεταφοράς μάθησης διευκολύνεται μέσω της ενσωμάτωσης προεκπαιδευμένων μοντέλων για τις αναπαραστάσεις καταστάσεων και ενεργειών μέσα σε ένα πλαίσιο cross-attention transformer. | el |