Artificial intelligence in pharmaceutical domain (with emphasis on the data quality)
Η εφαρμογή της τεχνητής νοημοσύνης στο φαρμακευτικό τομέα (με έμφαση στην ποιότητα των δεδομένων)
Μεταπτυχιακή διπλωματική εργασία
Συγγραφέας
Οικονομίδης, Γεώργιος
Ημερομηνία
2022-09-19Επιβλέπων
Leligou, Helen C. (Nelly)Λέξεις-κλειδιά
ALCOA ; Deep learning ; Pharmaceutical industry ; Data integrity ; Accurate ; Legible ; Βαθιά μάθηση ; Ακεραιότητα δεδομένων ; Φαρμακευτική βιομηχανίαΠερίληψη
Over the past decades, computer science has been widely developed. From speech recognition to reconstructing brain circuits to even natural language understanding, one can easily claim that Machine Learning and Deep Learning have become part of everyday life. They have been used in most of the industries and the pharmaceutical one is no exception. During the recent years, data integrity has been an important part of the pharmaceutical industry. It is mandatory to ensure the quality and the safety a drug has from the start of its production till it reaches the customer. In order to achieve this, the American Food and Drug Administration (FDA) introduced the ALCOA principles as guidelines for every pharmaceutical company. The ALCOA acronym stands for Attributable, Legible, Contemporaneous, Original, and Accurate which are values derived from the pharmaceutical industry data collected during the manufacturing process and which ensure the integrity of the data. SPuMoNI is a European funded research project that explores the authenticity of such data using innovative scientific approaches. This thesis presents, an experimental attempt to predict the ALCOA values while using the raw sensor data as an input. To achieve the best regression result, three Deep Learning Recurrent Neural Networks have been used. Long Short-Term Memory, Bidirectional Long-Short Term Memory and Gated Recurrent Unit. More specifically, there are two ALCOA values that are being examined in this thesis, Legible and Accurate. The language used for programming the algorithm was Python through Google Collaboratory and the library imported for the deep learning methods was Google’s TensorFlow. Through the research conducted, it was shown that the prediction’s accuracy of the ALCOA principles Legible and Accurate was below 80% which drives us to research a) which additional parameters need to be taken into account and b) which algorithms such as a Transformer Neural Network could lead to accuracy improvements.
Περίληψη
Από τα μέσα του 21ου αιώνα έως και σήμερα, η επιστήμη των υπολογιστών έχει αναπτυχθεί ευρέως. Από την αναγνώριση ομιλίας έως την ανακατασκευή εγκεφαλικών κυκλωμάτων μέχρι και την κατανόηση της φυσικής γλώσσας, μπορεί κανείς εύκολα να ισχυριστεί ότι η Μηχανική Μάθηση και η Βαθιά Μάθηση έχουν γίνει μέρος της καθημερινής ζωής κάθε ανθρώπου Χρησιμοποιούνται σε πληθώρα βιομηχανιών και η φαρμακοβιομηχανία δεν αποτελεί εξαίρεση. Τα τελευταία χρόνια, η ακεραιότητα των δεδομένων αποτελεί σημαντικό μέρος του φαρμακευτικού κλάδου. Είναι απαραίτητο να διασφαλίζεται η ποιότητα και η ασφάλεια που έχει ένα φάρμακο από την έναρξη της παραγωγής του μέχρι να φτάσει στον πελάτη. Για να επιτευχθεί αυτό, η Αμερικάνικη Υπηρεσία Τροφίμων και Φαρμάκων εισήγαγε τις αρχές ALCOA ως κατευθυντήριες γραμμές για κάθε φαρμακευτική εταιρεία. Το ακρωνύμιο ALCOA σημαίνει Attributable, Legible, Contemporaneous, Original και Accurate και χαρακτηρίζει τιμές που εξάγονται από τα δεδομένα (τα οποία συλλέγονται κατά την παραγωγική διαδικασία) της φαρμακευτικής βιομηχανίας και διασφαλίζουν την ακεραιότητά τους. Η SPuMoNI είναι ευρωπαϊκό χρηματοδοτούμενο ερευνητικό πρόγραμμα το οποίο διερευνά την αυθεντικότητα των δεδομένων, με χρήση καινοτόμων επιστημονικών προσεγγίσεων. Στην παρούσα διπλωματική, παρουσιάζεται ένα πείραμα για την πρόβλεψη των τιμών ALCOA χρησιμοποιώντας τα ακατέργαστα δεδομένα αισθητήρων της SPuMoNI ως είσοδο. Για να επιτευχθεί το καλύτερο αποτέλεσμα παλινδρόμησης, έχουν χρησιμοποιηθεί τρία νευρωνικά δίκτυα βαθιάς μάθησης. Πρόκειται για τα Long Short-Term Memory, Bidirectional Long-Short Term Memory and Gated Recurrent Unit. Ειδικότερα, υπάρχουν δύο τιμές ALCOA που εξετάζονται σε αυτή τη διατριβή, η Legible και η Accurate. Η γλώσσα που προγραμματίστηκε ο αλγόριθμος ήταν η Python μέσω του Google Collaboratory και η βιβλιοθήκη που χρησιμοποιήθηκε για τις μεθόδους βαθιάς μάθησης ήταν το TensorFlow της Google. Μέσα από την έρευνα που διεξάχθηκε, φάνηκε ότι η πρόβλεψη των αρχών ALCOA Legible και Accurate δεν ήταν ιδιαίτερα ακριβής. Ωστόσο, αξίζει να διερευνηθεί α) ποιες επιπλέον παράμετροι πρέπει να ληφθούν υπόψιν ή/και β) ποιο αλγόριθμοι όπως transformers neural network θα μπορούσαν να οδηγήσουν σε αύξηση της ακρίβειας πρόβλεψης.
Αριθμός σελίδων
54Σχολή
Σχολή ΜηχανικώνΑκαδημαϊκό Τμήμα
Τμήμα Ηλεκτρολόγων και Ηλεκτρονικών ΜηχανικώνΤμήμα Μηχανικών Βιομηχανικής Σχεδίασης και Παραγωγής