Augmentation of large language model capabilities with knowledge graphs
Ενίσχυση ικανοτήτων μεγάλων γλωσσικών μοντέλων με γνωσιακούς γράφους
Μεταπτυχιακή διπλωματική εργασία
Author
Τσακαλάκης, Βίκτωρ
Date
2024-03-06Advisor
Kasnesis, PanagiotisKeywords
Artificial intelligence ; Deep learning ; Knowledge graphs ; Large language models ; Natural language processing ; Τεχνητή νοημοσύνη ; Βαθιά μάθηση ; Γνωσιακοί γράφοι ; Μεγάλα γλωσσικά μοντέλα ; Επεξεργασία φυσικής γλώσσαςAbstract
This postgraduate thesis explores the possibility for augmentation of the abilities of Large Language Models (LLMs) in the task of Question Answering by incorporating the technique of Retrieval-Augmented Generation (RAG) in conjunction with Knowledge Graph triples. Leveraging the structured knowledge representation of semantic triples, the study aims to enhance the contextual understanding and precision of LLMs in responding to user queries. The methodology proposed consists of a pipeline for the extraction of triples from source documents (Wikipedia articles) using a fine-tuned Language Model, their subsequent storage
and retrieval through RAG, and their inclusion as contextual information to assist the LLM with providing grounded and reliable answers which are based on the provided sources. The findings suggest that while the answers show an improvement compared to unaided LLM generation, this specific methodology is not competitive with more conventional RAG applications.
Abstract
Αυτή η μεταπτυχιακή διπλωματική εργασία εξερευνά τη δυνατότητα ενίσχυσης των ικανοτήτων Μεγάλων Γλωσσικών Μοντέλων (Large Language Models – LLMs) στο πρόβλημα της απάντησης ερωτήσεων μέσω της ενσωμάτωσης της τεχνικής παραγωγής
κειμένου με ενίσχυση ανάκτησης (Retrieval-Augmented Generation – RAG) σε συνδυασμό με τριπλέτες Γνωσιακών Γράφων. Εκμεταλλεύοντας τη δομημένη αναπαράσταση γνώσης των σημασιακών τριπλέτων, η εργασία αποσκοπεί στο να βελτιώσει την κατανόηση του κειμένου όπως και την ακρίβεια των LLMs στην απάντηση ερωτήσεων χρηστών. Η μεθοδολογία που
προτείνεται αποτελείται από μία ακολουθία για την εξαγωγή των τριπλετών από τις έγγραγες πηγές (άρθρα της Wikipedia) χρησιμοποιώντας ένα προσαρμοσμένο Γλωσσικό Μοντέλο, τη μετέπειτα αποθήκευση και ανάκτησή τους μέσω της RAG, και τη προσθήκη τους ως σχετική πληροφορία για την υποστήριξη του LLM προς την παροχή θεμελιωμένων και αξιόπιστων
απαντήσεων οι οποίες βασίζονται στις παρεχόμενες πηγές. Τα πορίσματα υποδεικνύουν ότι παρόλο οι απαντήσεις δείχνουν μία βελτίωση σε σχέση με την παραγωγή από το ανυποστήρικτο LLM, η συγκεκριμένη μεθοδολογία δεν ανταγωνίζεται πιο συμβατικές
εφαρμογές RAG.
Number of pages
68Faculty
Σχολή ΜηχανικώνAcademic Department
Τμήμα Ηλεκτρολόγων και Ηλεκτρονικών ΜηχανικώνΤμήμα Μηχανικών Βιομηχανικής Σχεδίασης και Παραγωγής