Επεξεργασία και ανάλυση εικόνας μικροσκοπίας για την ανάδειξη, ανίχνευση και ταξινόμηση καρκίνου εγκέφαλου ανάλογα με το βαθμό κακοηθείας
Microscopy image processing and analysis for highlighting, detecting and classifying brain cancer according to the degree of malignancy
Keywords
Επεξεργασία εικόνας ; Ανάλυση εικόνας ; Οπτική μικροσκοπία ; Καρκίνος του εγκεφάλου ; ΑστροκύτωμαAbstract
Μια από τις σοβαρότερες ασθένειες που μαστίζουν την ανθρωπότητα είναι ο καρκίνος του εγκεφάλου. Γι’ αυτό το λόγο η επιστήμη επικεντρώνεται στην έρευνα και στην μελέτη αυτών των καρκινικών όγκων τόσο χαμηλής όσο και υψηλής κακοήθειας. Είναι μια διαρκής προσπάθεια προκειμένου να επιτευχθεί η αποτελεσματική αντιμετώπιση του. Μία από τις πιο συχνές περιπτώσεις καρκίνων του εγκεφάλου αποτελούν τα αστροκυτώματα, τα οποία δύνανται να εμφανιστούν σε διάφορα σημεία του ανθρώπινου σώματος ή να ξεκινήσουν από ένα σημείο και να κάνουν μετάσταση αλλού στο σώμα. Η παρούσα διπλωματική εργασία πραγματεύεται την επεξεργασία και ανάλυση εικόνας μικροσκοπίας για την ανάδειξη, ανίχνευση και ταξινόμηση των εικόνων καρκίνου εγκεφάλου ανάλογα με το βαθμό κακοήθειας, δίνοντας έμφαση στην εφαρμογή μεθόδων, για τη διάγνωση όγκων εγκεφάλου τύπου αστροκυτώματος. Σε αρχικό στάδιο, οι ψηφιακές εικόνες μικροσκοπίου τροποποιήθηκαν έτσι ώστε να διορθωθεί η ασάφεια και ο θόρυβος που παρουσίαζαν. Ακολούθως χρησιμοποιήθηκαν ειδικοί αλγόριθμοι για την τμηματοποίηση των πυρήνων, για να εξαχθούν τα μορφολογικά τους χαρακτηριστικά και συγκεκριμένα αναπτύχθηκε αλγόριθμος βασισμένος στο μετασχηματισμό της απόστασης. Στη συνέχεια ταξινομήθηκαν σε δύο κατηγορίες, μία για τις εικόνες χαμηλής κακοήθειας και μία για τις εικόνες υψηλής κακοήθειας. Έπειτα, υπολογίστηκε η μέγιστη ακρίβεια ταξινόμησης μέσω του ClassificationLearnerApp στο περιβάλλον του Matlab. Τελικά, προέκυψε μια σύνοψη χαρακτηριστικών, που είναι απαραίτητα για την εκπαίδευση των ταξινομητών που θέτει ο χρήστης και η επίτευξη του μέγιστου ποσοστού ακρίβειας του ταξινομητή με βάση τα υπάρχοντα δεδομένα. Ακολουθήθηκε η μέθοδος επικύρωσης cross-validation η οποία εφαρμόζει συνδυασμούς των χαρακτηριστικών μέχρι και ανά τέσσερις (k=4), έτσι ώστε να συνδυαστούν όλα τα πιθανά ενδεχόμενα ταξινόμησης. Τα αποτελέσματα έδειξαν ότι η καλύτερη ταξινόμηση επιτυγχάνεται με τον ταξινομητή Gaussian Naive Bayes και με ποσοστό ακρίβειας 57.1%. Φυσικά, υπάρχουν περιθώρια βελτίωσης, προκειμένου να υπάρξει εφαρμογή του αλγορίθμου σε ιστοπαθολογικές εικόνες και άλλων τύπου κακοήθειας καρκίνου. Τέλος, χρειάζεται η εφαρμογή του σε μεγαλύτερο αριθμό εικόνων και ο υπολογισμός περισσότερων χαρακτηριστικών, όπως τα χαρακτηριστικά υφής και αρχιτεκτονικής.
Abstract
One of the most serious diseases plaguing humanity is brain cancer. This is why science is focused on researching and studying both low and high malignancy cancerous tumors. It is a continuous effort in order to treat them effectively. One of the most common cases of brain cancer are astrocytomas, which can appear in various parts of the human body or start in one place and metastasize to another part of the body. This thesis deals with microscopy image processing and analysis for highlighting, detecting and classifying brain cancer images according to the degree of malignancy, emphasizing on applications for the diagnosis of astrocytoma-type brain tumors. Initially, the digital images were modified to correct the blur and noise. Subsequently, special algorithms were used for the segmentation of the nuclei, in order to extract their morphological characteristics. Specifically, an algorithm based on the distance transformation was developed. Then, the microscopy images were classified into two categories, one for low-malignancy images and one for high-malignancy images. Then, the maximum accuracy classification was calculated using the Classification Learner App in the Matlab environment. Finally, a summary of features is created that can be used to train the classifiers, which are set by the user and can achieve the maximum accuracy rate of the classifier, based on the existing data.The cross-validation method was followed, which applies combinations of the features up to four (k=4), so as to combine all possible classification scenarios. The results showed that the best classification is achieved with the Gaussian Naive Bayes classifier and and an accuracy rate of 57.1% was achieved. Of course, there is scope for improvement, in order to apply the algorithm to histopathological images and other types of cancer. Finally, the algorithm needs to be applied to a larger number of images and calculate more features, such as texture and architecture features.