Η χρήση των μεγάλων γλωσσικών μοντέλων στη διδασκαλία της φυσικής

Διαμαντίδου, Παρθένα

The use of large language models in physics education

Διπλωματική εργασία

Author

Διαμαντίδου, Παρθένα

Date

2024-10-14

Advisor

Panayiotatos, Yerassimos

Διπλωματική Εργασία (10.15Mb)

Keywords

Μεγάλα γλωσσικά μοντέλα ; Μηχανική προτροπών ; Μετασχηματιστές ; Τεχνητή νοημοσύνη ; Φυσική ; Large language models ; Prompt engineering ; Artificial intelligence ; Transformers

Abstract

Η παρούσα εργασία πραγματεύεται τις τρέχουσες εφαρμογές Τεχνητής Νοημοσύνης (ΤΝ), με επίκεντρο τα Μεγάλα Γλωσσικά Μοντέλα (ΜΓΜ) και συγκεκριμένα την επιρροή τους στον τομέα της εκπαίδευσης. Ειδικότερα, στην εργασία αυτή επιτυγχάνεται η εις βάθος ανάλυση θεωρητικών και πρακτικών πτυχών των εφαρμογών της ΤΝ σε ποικίλες εκπαιδευτικές διαδικασίες. Ξεκινώντας με το πρώτο κεφάλαιο, παρατίθενται ορισμένα εισαγωγικά στοιχεία για την ανάλυση της ΤΝ και των εφαρμογών της στον τομέα της εκπαίδευσης. Ειδικότερα, αυτό που εξετάζεται είναι οι διάφοροι τύποι εργαλείων ΤΝ, ενώ παράλληλα αποδίδεται έμφαση στα ΜΓΜ, όπου αναπτύσσονται θεμελιώδεις έννοιες και τονίζεται η συνεισφορά τους στη διαμόρφωση των σύγχρονων εκπαιδευτικών πρακτικών. Τέλος, λόγος γίνεται για την παραγωγική ΤΝ, η οποία παρουσιάζεται ως μια από τις πιο ενδιαφέρουσες και καινοτόμες τεχνολογίες. Περνώντας στο δεύτερο κεφάλαιο, η προσοχή στρέφεται στην ιστορική εξέλιξη των ΜΓΜ και σε κομβικές τεχνολογικές εξελίξεις, από το πρώτο κιόλας πρόγραμμα προσομοίωσης συνομιλίας, ELIZA. Εν συνεχεία, αναδεικνύεται η συνεισφορά των n-gram μοντέλων στην επεξεργασία φυσικής γλώσσας καθώς και η σημασία των τεχνητών νευρωνικών δικτύων, τα οποία έθεσαν τα θεμέλια για την ανάπτυξη της βαθιάς μάθησης. Το κεφάλαιο εστιάζει επίσης στους μετασχηματιστές και στους μηχανισμούς αυτοπροσοχής, τα επαναλαμβανόμενα νευρωνικά δίκτυα και τα διάφορα προβλήματά τους, ως βασικά στοιχεία λειτουργίας των ΜΓΜ. Προχωρώντας στο τρίτο κεφάλαιο, ιδιαίτερη βαρύτητα δίνεται στη Μηχανική Προτροπών, ως καθοριστικό μέσο για την αποτελεσματικότερη αλληλεπίδραση του ανθρώπου με τα ΜΓΜ. Σκοπός του κεφαλαίου είναι η ανάλυση των επιμέρους τεχνικών, όπως είναι οι τεχνικές προσαρμογής προσωπικότητας και γλωσσικού επιπέδου, οι οποίες προσαρμόζουν τις απαντήσεις του μοντέλου ανάλογα με το πλαίσιο που αφορά τον χρήστη κάθε φορά. Επιπρόσθετα στο τέταρτο κεφάλαιο, γίνεται η μετάβαση από την θεωρία στην πρακτική εφαρμογή, με την κατασκευή του περιγράμματος και του πλάνου μαθήματος για το μάθημα της Φυσικής όπου και περιγράφεται διεξοδικά η μεθοδολογία κατασκευής τους, ενώ ιδιαίτερη έμφαση δίνεται και στη διαμόρφωση μαθησιακών αποτελεσμάτων με βάση την Ταξονομία Bloom. Το κεφάλαιο ολοκληρώνεται με τη διαμόρφωση ενός εβδομαδιαίου μαθήματος, όπου και ολοκληρώνεται ο στόχος της ενσωμάτωσης των ΜΓΜ στην εκπαιδευτική διαδικασία. Συνοψίζοντας τα ανωτέρω, το πέμπτο και τελευταίο κεφάλαιο εξετάζει τις προοπτικές και τις δυνατότητες περαιτέρω ερευνών που αφορούν την ενσωμάτωση των ΜΓΜ και της ΤΝ στην εκπαίδευση. Τα συμπεράσματα που παρατίθενται υπογραμμίζουν τη σημασία της ενσωμάτωσης νέων τεχνολογιών της ΤΝ στα εκπαιδευτικά πλαίσια λόγω της ευρείας δυναμικής τους στην αναδιαμόρφωση της εκπαιδευτικής εμπειρίας.

Abstract

The following research is dedicated to the current state of application of Artificial Intelligence, with a great emphasis on Large Language Models and especially their influence on the educational sector. This paper therefore manages to conduct an in-depth theoretical and practical analysis of AI applications in various educational processes. Introductory elements to the analysis of AI and its use in education are provided consecutively from the first chapter on. Further, the analysis is directed to the types of AI tools for LLMs, emphasis is placed on developing basic notions and presenting their contribution to the formation of modern educational practice. Finally, generative AI is presented as one of the most interesting and innovative technologies. In that respect, the second chapter indicates the historical development of LLMs based on key technologies: from the very first program with conversational simulation ELIZA to the key contribution of the n-gram models in natural language processing. Further, artificial neural networks bear a very important role of significance, having laid the basis upon which deep learning came to be developed. It further contributes to the discussion of transformers and self-attention mechanisms, recurrent neural networks, and their several problems as the basic operational elements of LLMs. Following this, the third chapter focuses highly on Prompt Engineering as a determining basis for better interaction of humans with LLMs. The purpose of this chapter is to analyze individual techniques on how the model can adjust its responses-namely, personality and language level adjustment methods, according to the context of the user each time. Further, in the fourth chapter, from theory, it turns to practical application with the construction of the syllabus and lesson plan concerning the Physics course is performed, with detailed description of the methodology of their development. Special attention is given to the development of the learning outcomes by Bloom's Taxonomy. Thus, it ends with the elaboration of one weekly lesson, which means accomplishing the goal set in the integration of LLMs in the educational process. In a nutshell, the fifth chapter is the last one and covers the prospects and possibilities for further research regarding the integration of LLMs and AI in education. Conclusions drawn emphasize the necessity of inserting new information technologies of AI into educational frameworks, as their overall potential in remolding educational experience are immense.