Εφαρμογές της μηχανικής μάθησης σε επιλεγμένα προβλήματα λειτουργικής ταξινόμησης βιομορίων ή/και φαρμάκων
Applications of machine learning to selected functional classifications of biomolecules and/or drugs
Keywords
Μηχανική μάθηση ; Βιοπληροφορική ; Βιοϊατρική έρευνα ; Βαθιά μάθηση ; Λευχαιμία ; Καρκίνος ; Πάρκινσον ; Αιματοεγκεφαλικός φραγμόςAbstract
Σκοπός:
Στην σύγχρονη Βιοϊατρική έρευνα προκύπτουν συνεχώς ερωτήματα ταξινόμησης σε
διάφορα πεδία. Καθώς η έρευνα έχει προχωρήσει με γοργούς ρυθμούς σε μοριακό επίπεδο,
υπάρχουν διαθέσιμα μεγάλα σύνολα δεδομένων για τα οποία είναι αναγκαίο να προβούμε
σε λειτουργικές ταξινομήσεις. Η διπλωματική στοχεύει στην ανασκόπηση του πεδίου
εφαρμογών της Μηχανικής Μάθησης, όπου θα αναδειχθεί πόσο ικανές είναι αυτοί οι
μέθοδοι να διαχειρίζονται δεδομένα από διάφορα πεδία Βιοπληροφορικής αλλά να
προβλέπουν μελλοντικά γεγονότα και να ανακαλύπτουν κρυφές πληροφορίες.
Υλικά & Μεθοδολογία:
Οι εφαρμογές Μηχανικής Μάθησης βασίζονται από υπολογιστικούς αλγορίθμους και
σύνολα δεδομένων. Ουσιαστικά, συλλέχθηκαν τέσσερα σύνολα δεδομένων από
διαφορετικά πεδία Βιοπληροφορικής όπου το πρώτο αφορά την Λευχαιμία, το δεύτερο το
καρκίνο του μαστού, το τρίτο την νόσο του Πάρκινσον και το τέταρτο την διαπερατότητα
του αιματοεγκεφαλικού φραγμού από τα φάρμακα. Με την χρήση Η/Υ και της γλώσσας
προγραμματισμού R έγινε προεπεξεργασία για κάθε σύνολο δεδομένων ξεχωριστά και
στην συνέχεια έγινε εκπαίδευση, επικύρωση και αξιολόγηση για ευρέως γνωστούς
αλγορίθμους που χρησιμοποιούνται στην Μηχανική Μάθηση. Επίσης, για την αξιοπιστία
των εφαρμογών αυτών χρησιμοποιήθηκαν μετρητικές μέθοδοι όπως ακρίβεια, ευαισθησία,
ειδικότητα κ.τ.λ.
Αποτελέσματα:
Η Μηχανική Μάθηση έδειξε για κάθε διαφορετικό πεδίο πόσο ικανή είναι χειριστεί
σύνολα δεδομένων. Εντόπισε τα κύρια χαρακτηριστικά που διακρίνουν καλύτερα το κάθε
σύνολο δεδομένων αλλά και τον αλγόριθμο που έχει την καλύτερη επίδραση στην
ταξινόμηση τους. Βάσει λοιπόν των επιλεγμένων χαρακτηριστικών έγινε βιβλιογραφική
ανασκόπηση για την επαλήθευση των αποτελεσμάτων.
Συμπεράσματα:
Από τις επιδόσεις της είναι εμφανές ότι είναι μια τεχνική χαμηλού κόστους που έχει
προοπτικές να γίνει αρκετά χρήσιμη στην Βιοϊατρική έρευνα και να αντικαταστήσει
χρονοβόρες και ελαττωματικές μεθόδους αλλά και επεμβατικές τεχνικές που είναι
επιβλαβείς για τους ασθενείς. Σε μελλοντικές έρευνες καλύτερο θα ήταν να γίνουν
αναλύσεις με περισσότερα δείγματα ούτως ώστε να υπάρχουν πιο αξιόπιστα
αποτελέσματα.