Επεξεργασία μεταβολομικών δεδομένων με φασματοσκοπία πυρηνικού μαγνητικού συντονισμού
Processing of metabolomic data from nuclear magnetic resonance spectroscopy
Διπλωματική εργασία
Συγγραφέας
Κολάκη, Ευμορφία Άννα
Ημερομηνία
2022-07-19Επιβλέπων
Zoumpoulakis, PanagiotisΛέξεις-κλειδιά
Mεταβολομική ; Μεταβολίτες ; Στατιστική ανάλυση ; R ; Φασματοσκοπία NMR ; Πολυμεταβλητή στατιστική ανάλυση ; PCA ; PLS-DA ; OPLS-DAΠερίληψη
Η παρούσα διπλωματική έχει ως σκοπό την εφαρμογή της γλώσσας προγραμματισμού R
καθώς και μεθόδων πολυμεταβλητής στατιστικής ανάλυσης σε δεδομένα μεταβολομικής
από φασματοσκοπία Πυρηνικού Μαγνητικού Συντονισμού (NMR). Στόχος ήταν η αναζήτηση
του βέλτιστου τρόπου επεξεργασίας των φασματικών δεδομένων για την περαιτέρω
στατιστική ανάλυση. Συγκεκριμένα χρησιμοποιήθηκε μια βάση φασματοσκοπικών
δεδομένων που αναφέρονται στο μεταβολικό αποτύπωμα συγκεκριμένης ποικιλίας
ντομάτας καθώς και το ελεύθερα διαθέσιμο λογισμικό NMRProcFlow το οποίο αναλύει και
επεξεργάζεται φάσματα NMR χωρίς να είναι αναγκαία η γραφή κώδικα. Για την
πολυμεταβλητή στατιστική ανάλυση χρησιμοποιήθηκαν μέθοδοι - όπως η PCA, η PLS-DA
και η OPLS-DA. Επίσης, ταυτοποιήθηκαν και ποσοτικοποιήθηκαν οι μεταβολίτες των
φασμάτων μέσω εφαρμογής αυτοματοιποιημένου αλγορίθμου. Ακολούθησε συγκριτική
στατιστική ανάλυση με χρήση των συγκεντρώσεων των μεταβολιτών.
Περίληψη
The purpose of this thesis is the application of R-programming as well as multivariate
statistical analysis on metabolic data derived from Nuclear Magnetic Resonance (NMR)
Spectroscopy. The main aim was to find the best way to process the spectral data for further
statistical analysis. A spectroscopic data base which is the metabolic fingerprint of a specific
species of tomato was used. Also, the freely available software called NMRPRocFLow was
utilized which analyzes and processes NMR spectra, without the need to use coding skills.
We conducted multivariate statistical analysis by using PCA, PLS-DA and OPL-DA methods.
Quantification and identification of metabolites from the NMR spectra of tomatoes has
occurred by using a specialized, automated algorithm. Lastly, in order to assess the results, a
statistical analysis has been done over the concentration of metabolites.