Development of machine learning models to predict the activity of chemical compounds against the obesity-associated melanocortin-4 receptor
Ανάπτυξη μοντέλων μηχανικής μάθησης για την πρόβλεψη δραστικότητας χημικών ενώσεων έναντι του σχετιζόμενου με την παχυσαρκία υποδοχέα της μελανοκορτίνης-4
Διπλωματική εργασία
Συγγραφέας
Γιακουμοπούλου, Σταυρούλα
Ημερομηνία
2024-10-01Επιβλέπων
Cavouras, DionisisΛέξεις-κλειδιά
Obesity ; hMC4R ; Machine learning ; Molecular docking ; Molecular modeling ; ADMET prediction ; Ligands ; Drug designΠερίληψη
Monogenic obesity caused by mutations in the Melanocortin-4 Receptor (MC4R) gene remains a significant health challenge, despite numerous efforts to find effective treatments. The MC4R is a promising target for drug development due to its role in energy homeostasis and adipose tissue formation. This thesis explores the hybridization of Machine Learning and Molecular Modeling techniques to identify potential ligands that may act as agonists against the obesity-associated MC4R. This study aimed to develop a predictive model using a dataset of 1,906 chemical compounds and 208 RDKit molecular descriptors to classify molecules
based on their activity against MC4R. Additionally, 2,000 natural compounds were
evaluated using three molecular docking software platforms to identify potential
ligands for human MC4R (hMC4R) based on interaction patterns and binding
affinities. The machine learning model was used to predict ligand activity, and their
properties were further analyzed using two ADMET tools.
The final model demonstrated strong efficiency of activity prediction,
achieving 94.28% accuracy and an AUC of 0.98. The molecular docking experiments
identified six natural compounds as potential hMC4R ligands, with most sharing the
same chemical scaffold. However, the ADMET analysis did not yield accurate or
reliable results, limiting the ability to fully assess the safety profiles of the identified
compounds. Despite this limitation, the findings suggest that the flavone scaffold
could serve as a template for designing novel agonists.
Περίληψη
Η μονογονιδιακή παχυσαρκία που προκαλείται από μεταλλάξεις στο γονίδιο που κωδικοποιεί τον Υποδοχέα της Μελανoκορτίνης-4 (MC4R) παραμένει μια σημαντική πρόκληση για τη δημόσια υγεία, παρά τις πολυάριθμες προσπάθειες για την εύρεση αποτελεσματικών θεραπειών. Ο MC4R καθίσταται ένας υποσχόμενος στόχος για την ανάπτυξη φαρμάκων λόγω του ρόλου του στην ενεργειακή ομοιόσταση και τη δημιουργία λιπώδους ιστού. Η παρούσα διπλωματική εργασία διερευνά τον υβριδισμό τεχνικών Μηχανικής Μάθησης και Μοριακής Μοντελοποίησης για την ταυτοποίηση εν δυνάμει προσδετών που μπορεί να δράσουν ως αγωνιστές έναντι του σχετιζόμενου με την παχυσαρκία MC4R. Ο στόχος της παρούσας μελέτης ήταν να αναπτύξει ένα προγνωστικό μοντέλο χρησιμοποιώντας ένα σύνολο δεδομένων 1.906 χημικών ενώσεων και 208 μοριακών περιγραφέων της βιβλιοθήκης RDKit, για την ταξινόμηση μορίων με βάση τη δραστηριότητά τους κατά του MC4R. Επιπρόσθετα, 2.000 φυσικές ενώσεις αξιολογήθηκαν χρησιμοποιώντας τρεις αλγορίθμους μοριακής πρόσδεσης για την ταυτοποίηση εν δυνάμει προσδετών του ανθρώπινου MC4R (hMC4R), με βάση τα μοτίβα αλληλεπίδρασης και τις δυνάμεις πρόσδεσης. Το μοντέλο μηχανικής μάθησης χρησιμοποιήθηκε για την πρόβλεψη της δραστηριότητας των προσδετών, ενώ οι ιδιότητές τους αναλύθηκαν περαιτέρω χρησιμοποιώντας δύο εργαλεία ADMET. Το τελικό μοντέλο παρουσίασε υψηλή απόδοση στην πρόβλεψη της δραστηριότητας, επιτυγχάνοντας ακρίβεια 94,28% και AUC ίσο με 0,98. Τα πειράματα μοριακής πρόβλεψης ανέδειξαν έξι φυσικές ενώσεις ως πιθανούς προσδέτες του hMC4R, οι περισσότεροι από τους οποίους διαθέτουν κοινό χημικό σκελετό. Ωστόσο, η ανάλυση ADMET δεν παρείχε ακριβή ή αξιόπιστα αποτελέσματα, περιορίζοντας τη δυνατότητα της πλήρους αξιολόγησης του προφίλ ασφάλειας των τελικών ενώσεων. Παρά τον περιορισμό αυτό, τα ευρήματα υποδεικνύουν ότι ο σκελετός των φλαβονών μπορεί να χρησιμεύσει ως πρότυπο για τον σχεδιασμό νέων αγωνιστών.