Augmentation of large language model capabilities with knowledge graphs

Τσακαλάκης, Βίκτωρ

Ενίσχυση ικανοτήτων μεγάλων γλωσσικών μοντέλων με γνωσιακούς γράφους

Μεταπτυχιακή διπλωματική εργασία

Author

Τσακαλάκης, Βίκτωρ

Date

2024-03-06

Advisor

Kasnesis, Panagiotis

Augmentation of Large Language Model capabilities with Knowledge Graphs.pdf (2.129Mb)

Keywords

Artificial intelligence ; Deep learning ; Knowledge graphs ; Large language models ; Natural language processing ; Τεχνητή νοημοσύνη ; Βαθιά μάθηση ; Γνωσιακοί γράφοι ; Μεγάλα γλωσσικά μοντέλα ; Επεξεργασία φυσικής γλώσσας

Abstract

This postgraduate thesis explores the possibility for augmentation of the abilities of Large Language Models (LLMs) in the task of Question Answering by incorporating the technique of Retrieval-Augmented Generation (RAG) in conjunction with Knowledge Graph triples. Leveraging the structured knowledge representation of semantic triples, the study aims to enhance the contextual understanding and precision of LLMs in responding to user queries. The methodology proposed consists of a pipeline for the extraction of triples from source documents (Wikipedia articles) using a fine-tuned Language Model, their subsequent storage and retrieval through RAG, and their inclusion as contextual information to assist the LLM with providing grounded and reliable answers which are based on the provided sources. The findings suggest that while the answers show an improvement compared to unaided LLM generation, this specific methodology is not competitive with more conventional RAG applications.

Abstract

Αυτή η μεταπτυχιακή διπλωματική εργασία εξερευνά τη δυνατότητα ενίσχυσης των ικανοτήτων Μεγάλων Γλωσσικών Μοντέλων (Large Language Models – LLMs) στο πρόβλημα της απάντησης ερωτήσεων μέσω της ενσωμάτωσης της τεχνικής παραγωγής κειμένου με ενίσχυση ανάκτησης (Retrieval-Augmented Generation – RAG) σε συνδυασμό με τριπλέτες Γνωσιακών Γράφων. Εκμεταλλεύοντας τη δομημένη αναπαράσταση γνώσης των σημασιακών τριπλέτων, η εργασία αποσκοπεί στο να βελτιώσει την κατανόηση του κειμένου όπως και την ακρίβεια των LLMs στην απάντηση ερωτήσεων χρηστών. Η μεθοδολογία που προτείνεται αποτελείται από μία ακολουθία για την εξαγωγή των τριπλετών από τις έγγραγες πηγές (άρθρα της Wikipedia) χρησιμοποιώντας ένα προσαρμοσμένο Γλωσσικό Μοντέλο, τη μετέπειτα αποθήκευση και ανάκτησή τους μέσω της RAG, και τη προσθήκη τους ως σχετική πληροφορία για την υποστήριξη του LLM προς την παροχή θεμελιωμένων και αξιόπιστων απαντήσεων οι οποίες βασίζονται στις παρεχόμενες πηγές. Τα πορίσματα υποδεικνύουν ότι παρόλο οι απαντήσεις δείχνουν μία βελτίωση σε σχέση με την παραγωγή από το ανυποστήρικτο LLM, η συγκεκριμένη μεθοδολογία δεν ανταγωνίζεται πιο συμβατικές εφαρμογές RAG.