Μελέτη της δομής-δράσης αντιυπερτασικών ενώσεων χρησιμοποιώντας χημειοπληροφορικά δεδομένα
Study of the structure-activity relationship of antihypertensive compounds using chemoinformatics data

Διπλωματική εργασία
Συγγραφέας
Μποζατζίδης, Ιωάννης
Ημερομηνία
2025-02-19Επιβλέπων
Matsoukas, Minos-TimotheosΛέξεις-κλειδιά
Χημειοπληροφορική ; Αγγειοτασίνη ; Υποδοχέας τύπου 1 ; Ολμεσαρτάνη ; Μηχανική μάθηση ; Μοριακοί περιγραφείς ; Μοριακά αποτυπώματα ; Αντιυπερτασικές ενώσεις ; Αντιυπερτασικά φάρμακαΠερίληψη
Η παρούσα εργασία εξετάζει την σχέση μεταξύ δομής και δράσης αντιυπερτασικών ενώσεων, εστιάζοντας στην αναστολή του Υποδοχέα τύπου 1 της Αγγειοτασίνης ΙΙ (AT1R). Στόχος είναι η ανάπτυξη αλγορίθμου για την δημιουργία ενός μοντέλου πρόβλεψης το οποίο θα συμβάλει στην δημιουργία αποτελεσματικών φαρμάκων κατά της υπέρτασης. Η μελέτη αξιοποιεί χημειοπληροφοριακά δεδομένα, όπως μοριακούς περιγραφείς (Molecular Descriptors), μοριακά αποτυπώματα (Molecular Fingerprints), ώστε να περιγράψει πλήρως τις δομικές ιδιότητες των ενώσεων και να τις συνδέσει με την βιολογική δραστικότητά τους. Η μελέτη χωρίζεται σε επτά κύρια κεφάλαια όπου, ξεκινούν με μία βασική εισαγωγή στην έννοια της υπέρτασης και την φαρμακευτική εξέλιξή της με ιστορικά δεδομένα. Ύστερα θα αναλύσουμε την δομή και την λειτουργία των πρωτεϊνών, δίνοντας έμφαση στον AT1R. Κατόπιν θα περιγράψουμε τις βασικές αρχές της χημειοπληροφορικής, την απεικόνιση των μορίων καθώς και των μοριακών περιγραφέων. Επί προσθέτως θα εξετάσουμε την χρήση βάσεων δεδομένων (Database) και Μηχανικής Μάθησης (Machine Learning) για την πρόβλεψης της δραστικότητας των χημικών ενώσεων. Στα τελευταία κεφάλαια παρουσιάζεται η πειραματική διαδικασία, η σύγκριση της ANG II με την OLM (ολμεσαρτάνη) αναλύοντας τις αλληλεπιδράσεις που πραγματοποιούνται με τον AT1R. Επίσης, αναφέρεται η μεθοδολογία που υλοποιήθηκε καθώς και τα αποτελέσματα, των αλγορίθμων Μηχανικής Μάθησης για την ταξινόμηση των δεδομένων. Η αξιολόγηση των ταξινομητών πραγματοποιήθηκε βάσει των ποσοστών ακρίβειας, ευαισθησίας και ειδικότητας. Από τα διαγράμματα προκύπτει ότι η ακρίβεια αυξάνεται αναλογικά με την αύξηση των χαρακτηριστικών, με τους ταξινομητές Random Forest και XGBoost να ξεχωρίζουν. Επιλέχθηκαν τα 30 καλύτερα χαρακτηριστικά και βάσει αυτών βρέθηκε ότι ο ταξινομητής Random Forest αποτελεί ιδανικός για την εύρεση νέων ανταγωνιστών των υποδοχέων της ANG II. Τέλος αναφέρονται μελλοντικές προοπτικές που θα μπορούσε να λάβει η συγκεκριμένη μελέτη στην ταχύτερη και πιο εύστοχη εύρεση νέων φαρμάκων κατά της υπέρτασης.
Περίληψη
The present study examines the relationship between the structure and action of antihypertensive compounds, focusing on the inhibition of the Angiotensin II Type 1 Receptor (AT1R). The aim is to develop an algorithm for creating a predictive model that will contribute to the development of effective antihypertensive drugs. The study utilizes cheminformatics data, such as molecular descriptors and molecular fingerprints, to fully describe the structural properties of the compounds and link them to their biological activity. The study is divided into seven main chapters, beginning with a basic introduction to the concept of hypertension and its pharmaceutical evolution, supported by historical data. It then analyzes the structure and function of proteins, with an emphasis on AT1R. Subsequently, it describes the fundamental principles of cheminformatics, including molecular representation and molecular descriptors. Additionally, the study explores the use of databases and machine learning for predicting the activity of chemical compounds. In the final chapters, the experimental process is presented, comparing ANG II with OLM (Olmesartan) by analyzing the interactions with AT1R. The methodology implemented and the results of machine learning algorithms for data classification are also discussed. The evaluation of the classifiers was based on accuracy, sensitivity, and specificity rates. The diagrams show that accuracy increases proportionally with the increase in features, with the Random Forest and XGBoost classifiers standing out. The 30 best features were selected, and based on these, it was found that the Random Forest classifier is ideal for identifying new Ang II receptor antagonists. Finally, the paper outlines future prospects for this study in the faster and more accurate identification of new antihypertensive drugs.