Σχεδιασμός και κατασκευή λογισμικού επεξεργασίας και ανάλυσης εικόνας για εφαρμογές μικροσκοπίας
Design and development of image processing and analysis software for microscopy applications
Λέξεις-κλειδιά
Επεξεργασία εικόνας ; Ανάλυση εικόνας ; Οπτική μικροσκοπία ; Μηχανική μάθηση ; Καρκίνος του εγκεφάλου ; Τμηματοποίηση ; Ταξινόμηση ; Αστροκύτωμα ; ΙστοπαθολογίαΠερίληψη
Ένα σημαντικό μέρος της κλινικής έρευνας αποτελεί η διάγνωση καρκινικών όγκων στον εγκέφαλο. Το πρόβλημα αυτό παραμένει μέχρι και σήμερα ένα αντικείμενο μεπληθώρα μελετών και ερευνών σχετικά με την αντιμετώπισή του. Υπάρχει μια σημαντική και αρκετά συνηθισμένη περίπτωση καρκίνου του εγκεφάλου, η οποία ανήκει σε μια ομάδα νευρογλοιακών κυττάρων, τα αστροκύτταρα Ο καρκίνος αυτός ονομάζεται αστροκύτωμα και μπορεί να εμφανιστεί σχεδόν σε όλα τα μέρη του εγκεφάλου. Η παρούσα διπλωματική εργασία αποσκοπεί στη δημιουργία ενός λογισμικού το οποίο πραγματεύεται την επεξεργασία, ανάλυση και ταξινόμηση εικόνων που σχετίζονται με το αστροκύτωμα, με απώτερο στόχο την εκτίμηση του επιπέδου κακοήθειας. Για την υλοποίηση της συγκεκριμένης μεθόδου, αποκτήθηκαν ιστοπαθολογικές εικόνες με H&E χρώση, από μια βάση δεδομένων που έχει δημιουργηθεί από προηγούμενες δουλειές στο παρελθόν. Η δημιουργία του κώδικα έγινε σε περιβάλλον MATLAB. Οι εικόνες αρχικά τροποποιήθηκαν έτσι ώστε να διορθώνεται το πρόβλημα της ανομοιογένειας στον φωτισμό, κάτι που αποτελεί φυσικό
πρόβλημα στην απόκτηση ψηφιακών εικόνων από μικροσκόπιο. Στη συνέχεια έγινε τμηματοποίηση των πυρήνων με ειδικούς αλγορίθμους, προκειμένου να γίνει εξαγωγή μορφολογικών χαρακτηριστικών και χαρακτηριστικών υφής πρώτης και δεύτερης
τάξης. Τα χαρακτηριστικά που εξήχθησαν, διαχωρίστηκαν σε δύο ξεχωριστές κλάσεις, μια για την κατηγορία των εικόνων χαμηλής κακοήθειας και μια για τις εικόνες υψηλής κακοήθειας με σκοπό την ταξινόμησή τους. Η διαδικασία της ταξινόμησης
περιλαμβάνει την εύρεση των μέγιστων ακριβειών στην εκπαίδευση τεσσάρων διαφορετικών ταξινομητών, με συνδυασμούς των χαρακτηριστικών που εξήχθησαν μέχρι και ανά πέντε. Αυτό έγινε σύμφωνα με την μέθοδο της εξαντλητικής αναζήτησης
και της μεθόδου επικύρωσης leave-one-out, έτσι ώστε να εξεταστούν όλα τα δυνατά ενδεχόμενα ταξινόμησης. Οι ταξινομητές που χρησιμοποιήθηκαν είναι ο k-Nearest Neighbor (KNN), o Minimum Distance (MD), o Bayesian και ένα Probabilistic Neural Network (PNN). Η τελική ταξινόμηση μιας άγνωστης εικόνας περιλαμβάνει τον συνδυασμό των τριών ταξινομητών με τη μέγιστη ακρίβεια παρέχοντας μια πλειοψηφία για την απόφαση της διάγνωσης (majority voting). Τα αποτελέσματα έδειξαν ότι οι
ταξινομητές με τις μεγαλύτερες ακρίβειες ήταν ο Bayesian με ακρίβεια 95%, το PNN με ακρίβεια 93.3% και ο KNN με ακρίβεια 75%, παρέχοντας μια μέση ακρίβεια στο 87.8%. Σύμφωνα με τα αποτελέσματα αυτά, η συγκεκριμένη μέθοδος που υλοποιήθηκε
αποδεικνύεται αρκετά αξιόπιστη, δίνοντας τη δυνατότητα της εφαρμογής της και σε ιστοπαθολογικές εικόνες με διαφορετικούς τύπους καρκίνου. Σχετικά με τις πιθανές βελτιώσεις, υπάρχει μεγάλο περιθώριο βελτίωσης της τεχνικής αυτής, μέσω της
απόκτησης περισσότερων εικόνων και με την εξαγωγή περισσότερων χαρακτηριστικών, όπως τα χαρακτηριστικά αρχιτεκτονικής.
Περίληψη
An important part of clinical research is the diagnosis of cancerous tumours in the brain.
This problem still remains today as a field with plenty of study and research aiming
towards finding solutions. There is an important and quite common type of brain cancer,
that belongs to a group of neuroglial cells called astrocytes. This cancer type is called
astrocytoma and it can appear in almost every part of the brain. The aim of this thesis
is the development of a software that processes, analyses and classifies images related
with astrocytoma, an important condition of brain cancer. For the purposes of this work,
H&E stained histopathology images from astrocytoma were obtained through a
database that has been created from previous works. The code was created in a
MATLAB software. Initially the images were pre-processed so that illumination and
background inhomogeneity, an issue that exists when obtaining images from a
microscope, was corrected. The next step was to segment the nuclei using appropriate
algorithms, and then to extract morphological and textural features of 1st and 2nd class.
The features that were extracted, were divided in two separate classes, one for low grade
images and one for high grade images, in order to classify them. The classification
process includes the search of the maximum accuracies in the training of 4 different
classifiers, with combination of up to 5 features. This was done using the exhaustive
search method and the leave-one-out cross validation, in order to examine all the
possible classification outcomes. The classifiers that were used, are the k-Nearest
Neighbor (KNN), the Minimum Distance Classifier (MD), the Bayesian classifier and
a Probabilistic Neural Network (PNN). The final classification of an unknown image
includes the combination of the 3 classifiers with the maximum accuracy, using a
majority voting method to determine the final result. The results showed that the
classifiers with the highest accuracies were the Bayesian with an accuracy of 95%, the
PNN with 93.3% accuracy and the KNN with 75% accuracy, achieving an average
accuracy of 87.8%. Based on the results, the current method that was developed, proves
to be quite reliable, providing the ability to apply it in histopathology images from
different types of cancer. As for future improvements, there is plenty of room for
improving this technique in the future, by using more images and extracting more
features, like the architectural features.