Μελέτη μεταβολικού αποτυπώματος μητρικού γάλακτος με φασματοσκοπία NMR και πολυμεταβλητή στατιστική ανάλυση
Study of metabolic footprint of breast milk by NMR spectroscopy and multivariate statistical analysis
Μεταπτυχιακή διπλωματική εργασία
Συγγραφέας
Αφράτη, Άλκηστη
Ημερομηνία
2021-06-25Επιβλέπων
Zoumpoulakis, PanagiotisΛέξεις-κλειδιά
Πρωτόγαλα ; Μητρικό γάλα ; Πολυμεταβλητή στατιστική ανάλυση ; Πυρηνικός μαγνητικός συντονισμός ; Φασματοσκοπία ; Μεταβολομική μελέτηΠερίληψη
Το μητρικό γάλα αποτελεί ένα εξαιρετικά περίπλοκο και μεταβλητό βιολογικό υγρό και έχει μεγάλη θρεπτική και ανοσολογική αξία για το νεογνό. Ειδικότερα το πρωτόγαλα έχει κυρίως ανοσολογικό ρόλο προστατεύοντας το βρέφος, καθώς μεταβαίνει από το σχετικά στείρο περιβάλλον της μήτρας, σε ένα περιβάλλον με παθογόνους μικροοργανισμούς και περιέχει υψηλές συγκεντρώσεις ολιγοσακχαριτών και πολλούς αυξητικούς παράγοντες, που είναι σημαντικοί για τη διατροφή, την ανάπτυξη του νεογνού και του προσφέρουν παθητική ανοσία. Η ανάλυση της σύνθετης και δυναμικής σύστασης του μητρικού γάλακτος και των παραγόντων που την επηρεάζουν, αποτελεί μία ερευνητική πρόκληση και ένα πεδίο μεγάλου ενδιαφέροντος.
Η παρούσα διπλωματική εργασία, έχει ως στόχο τη συγκριτική μελέτη του μεταβολικού αποτυπώματος του πρωτογάλακτος, που προέρχεται από υγιείς μητέρες τελειόμηνων νεογνών, με διαφορετικά ανθρωπομετρικά χαρακτηριστικά και διατροφικές συνήθειες. Για το λόγο αυτό, χρησιμοποιήθηκαν φάσματα πρωτονίου πυρηνικού μαγνητικού συντονισμού (NMR) από μεταβολομική μελέτη στα δείγματα πρωτογάλακτος, που είχε διεξαχθεί σε προηγούμενο στάδιο. Συγκεκριμένα, η παρούσα μελέτη περιλαμβάνει την ομαδοποίηση δεδομένων ερωτηματολογίου, που είχε συμπληρωθεί κατά τη λήψη του βιολογικού υλικού από τις μητέρες, την επεξεργασία των φασμάτων NMR που ελήφθησαν από τα δείγματα και την πολυμεταβλητή ανάλυση στη μήτρα δεδομένων που προέκυψε. Η πολυμεταβλητή ανάλυση αποσκοπούσε στην εύρεση τυχόν διαφορών, τάσεων και συσχετίσεων μεταξύ των δειγμάτων, την επισήμανση των φασματικών περιοχών και κατά συνέπεια των μεταβολιτών που συμβάλλουν κυρίως σε αυτές τις διαφορές και την κατασκευή ενός προγνωστικού μοντέλου, για τη σωστή ταξινόμηση νέων δειγμάτων.
Από την πολυμεταβλητή ανάλυση προέκυψε μία φυσική τάση διαχωρισμού των δειγμάτων σε δύο ομάδες και με βάση αυτήν αναγνωρίστηκαν και ποσοτικοποιήθηκαν οι μεταβολίτες που υπήρχαν στις δύο ομάδες. Επίσης προέκυψε ένα επικυρωμένο στατιστικό μοντέλο διάκρισης OPLS-DA με Q2=0,64 και R2=0,73, που υποδηλώνουν την καλή ικανότητα πρόβλεψης και προσαρμογής του μοντέλου αντίστοιχα. Η ταυτοποίηση των φασμάτων, οδήγησε στον ποσοτικό προσδιορισμό 26 μεταβολιτών, με στατιστικώς σημαντικές διαφορές στις σχετικές τους συγκεντρώσεις μεταξύ των δύο ομάδων. Ακολούθησε νέα πολυμεταβλητή ανάλυση από τις σχετικές συγκεντρώσεις των μεταβολιτών για το κάθε δείγμα, από την οποία προέκυψε ένα επικυρωμένο μοντέλο διάκρισης OPLS-DA, με πολύ καλή ικανότητα πρόβλεψης και προσαρμογής (Q2=0,93 και R2=0,94). Με τη βοήθεια ενός διαγράμματος σημαντικότητας (VIP Plot), προσδιορίστηκαν οι μεταβολίτες ομοβανιλλικό οξύ, 2-οξοϊσοβαλερικό οξύ, θρεονικό οξύ, L-σερίνη, D-φρουκτόζη, D-γλυκόζη, γλυκολικό οξύ, ιππουρικό οξύ, γλυκερικό οξύ και L-λευκίνη, οι οποίοι είχαν τη μεγαλύτερη επίδραση στη διάκριση των ομάδων του μοντέλου αυτού. Από τους μεταβολίτες αυτούς, προσδιορίστηκαν τα μεταβολικά μονοπάτια που επηρεάζονται και τα οποία περιλαμβάνουν τη βιοσύνθεση και αποικοδόμηση βαλίνης, λευκίνης και ισολευκίνης, το μεταβολισμό γλυκοξυλικού και δικαρβοξυλικού οξέος, το μεταβολισμό γλυκίνης, σερίνης και θρεονίνης και τη βιοσύνθεση του αμινοάκυλο-tRNA. Τέλος, πραγματοποιήθηκε μονομεταβλητή ανάλυση για τους 26 μεταβολίτες, σε σχέση με τις ομάδες που προέκυψαν από τις απαντήσεις και ομαδοποιήσεις του ερωτηματολογίου και διαπιστώθηκε η ύπαρξη μεταβολιτών, που έχουν μεγαλύτερη επίδραση στο διαχωρισμό μεταξύ δύο ομάδων του ερωτηματολογίου, χωρίς όμως να είναι δυνατή η γενίκευση των αποτελεσμάτων και των σχετικών παρατηρήσεων.
Συμπερασματικά, η φυσική τάση διαχωρισμού των μελών του δειγματοχώρου μας σε δύο ομάδες, δεν μπόρεσε να συσχετιστεί με τις απαντήσεις του ερωτηματολογίου και έτσι πιθανά να οφείλεται σε άλλες παραμέτρους, οι οποίες θα μπορούσαν να αποτελέσουν βάση, για διατύπωση νέων ερευνητικών ερωτημάτων.
Περίληψη
Breast milk is an extremely complex and variable biological fluid and has great nutritional and immunological value for the newborn. Colostrum in particular has a major immune role in protecting the infant as it transitions from the relatively sterile environment of the womb to an environment with pathogenic microorganisms and contains high concentrations of oligosaccharides and many growth factors, which are important for nutrition, neonatal development and immunity. The analysis of the complex and dynamic composition of breast milk and the factors that affect it, is a research challenge and a field of great interest.
The aim of this master thesis is the comparative study of the metabolic footprint of colostrum, derived from healthy mothers of full-term infants, with different anthropometric characteristics and dietary habits. For this reason, 1H Nuclear Magnetic Resonance (NMR) spectra were processed, taken from a previous metabolic study in colostrum samples. Specifically, the present study includes the data processing from questionnaires completed during maternal colostrum collection, NMR spectral processing of the samples, and the multivariate analysis in the resulting data matrix. The multivariate analysis aimed at finding putative differences, trends and correlations between the samples highlighting the spectral regions and consequently the metabolites that contribute mainly to these differences and constructing a predictive model for the correct classification of new samples.
The multivariate analysis revealed a clear clustering of the samples into two groups. Specifically, a validated OPLS-DA model emerged with a relatively good goodness of fit (R2=0.73) and a good predictive ability (Q2=0.64). The spectral interpretation and assignment led to the quantification of 26 metabolites with statistically significant differences in their relative concentrations between the two clusters. Based on the relative concentrations of the metabolites for each sample, a new validated OPLS-DA model was generated with very good goodness of fit (R2=0.94) and predictive ability (Q2=0.93). With the use of a Variable Importance Plot (VIP Plot), the metabolites homovannilic acid, 2-oxoisovaleric acid, threonic acid, L-serine, D-fructose, D-glucose, glycolic acid, hippuric acid, glyceric acid, L-leucine were determined, as those who had the greatest influence on the discrimination of the groups of this model. The metabolic pathways affected include the biosynthesis and degradation of valine, leucine and isoleucine, the metabolism of glycoxylate and dicarboxylate, the metabolism of glycine, serine and threonine and the biosynthesis of aminoacyl-tRNA.
Finally, a univariate analysis was performed for the 26 metabolites in relation to the groups that emerged from the questionnaire derived groupings. Results indicated that although certain metabolites have a greater effect on the discrimination between the questionnaire groups, these observations cannot be transformed or extrapolated to more general assumptions. In conclusion, the clear discrimination of the samples of our data set into two clusters could not be linked to the answers of the questionnaire and is related to other parameters, which could be the basis for formulating new research questions.