Ταξινόμηση εικόνων οξείας λεμφοβλαστικής λευχαιμίας και υγιών κυττάρων
Classification of images of acute lymphoblastic leykemia and healthy cells
Keywords
Οξεία λεμφοβλαστική λευχαιμία ; Μηχανική μάθηση ; Τεχνητή νοημοσύνη ; Ταξινόμηση εικόνων ; Ιατρική διάγνωσηAbstract
Η παρούσα διπλωματική εργασία ασχολείται με την ταξινόμηση εικόνων
κυττάρων Οξείας Λεμφοβλαστικής Λευχαιμίας (ΟΛΛ) και υγιών κυττάρων μέσω της
εφαρμογής αλγορίθμων μηχανικής μάθησης. Η ΟΛΛ, ένας τύπος καρκίνου που
επηρεάζει το αίμα και τον μυελό των οστών, εμφανίζεται κυρίως σε παιδιά και
ενήλικες και απαιτεί ακριβή διάγνωση για την αποτελεσματική θεραπεία της. Η
μελέτη αυτή επικεντρώνεται στην ανάπτυξη αποδοτικών μοντέλων ταξινόμησης τα
οποία βασίζονται σε τεχνικές επεξεργασίας εικόνας και μηχανικής μάθησης, με στόχο
τη βελτίωση των διαγνωστικών πρακτικών στην κλινική πράξη.
Για την υλοποίηση αυτής της μελέτης χρησιμοποιήθηκε ένα σύνολο
δεδομένων από το Kaggle, το οποίο περιλαμβάνει εικόνες κυττάρων από καρκινικούς
και υγιείς ιστούς. Η διαδικασία περιλάμβανε την προεπεξεργασία των εικόνων για τη
διόρθωση ατελειών, την εξαγωγή χαρακτηριστικών και την εφαρμογή πολυάριθμων
αλγορίθμων μηχανικής μάθησης, όπως τα μοντέλα Ensemble, τις Μηχανές Στήριξης
Διανυσμάτων (SVM), και τα Νευρωνικά Δίκτυα. Επιπλέον, για την αντιμετώπιση της
ανισορροπίας του συνόλου δεδομένων, εφαρμόστηκε η τεχνική SMOTE (Synthetic
Minority Oversampling Technique) για τη δημιουργία συνθετικών δεδομένων,
ενισχύοντας έτσι την ακρίβεια του μοντέλου.
Τα αποτελέσματα κατέδειξαν υψηλή ακρίβεια στην ταξινόμηση, με την
ακρίβεια να φτάνει το 92.1% στο σύνολο ελέγχου, γεγονός που επιβεβαιώνει την
αποτελεσματικότητα των προτεινόμενων μεθόδων. Η εργασία επισημαίνει τη
δυναμική των τεχνικών μηχανικής μάθησης στην ιατρική διάγνωση και προτείνει
περαιτέρω διερεύνηση μελλοντικών ερευνητικών κατευθύνσεων, όπως η επέκταση
του συνόλου δεδομένων και η εφαρμογή νέων τεχνικών για την ενδυνάμωση των
διαγνωστικών ικανοτήτων συνολικά.
Abstract
This thesis focuses on the classification of Acute Lymphoblastic Leukemia
(ALL) cell images and healthy cells using machine learning algorithms. ALL, a type
of cancer that affects the blood and bone marrow, primarily occurs in children and
adults and requires accurate diagnosis for effective treatment. This study concentrates
on developing efficient classification models based on modern image processing and
machine learning techniques, aiming to improve diagnostic practices in clinical
settings.
For the implementation of this study, a dataset from Kaggle was used, which
includes images of cells from cancerous and healthy tissues. The process involved
preprocessing the images to correct imperfections, feature extraction, and the
application of various artificial intelligence algorithms such as Ensemble Models,
Support Vector Machines, and Neural Networks. Additionally, to address the
imbalance in the dataset, the SMOTE (Synthetic Minority Oversampling Technique)
technique was applied to generate synthetic data, thereby enhancing the model's
accuracy.
The results demonstrated high classification accuracy, reaching 92.1% on the
test set, confirming the effectiveness of the proposed methods. The thesis highlights
the potential of machine learning techniques in medical diagnosis and suggests further
exploration of future research directions, such as expanding the dataset and applying
new advanced techniques to strengthen diagnostic capabilities overall.