Επεξεργασία ακτινογραφιών θώρακος για την ανάλυση των επιδράσεων της νόσου COVID-19
Processing of chest X-ray radiographs for the analysis of the effects of the disease COVID-19
Διπλωματική εργασία
Συγγραφέας
Πετσαλάρη, Στέφανος
Ημερομηνία
2023-10-11Επιβλέπων
Kostopoulos, SpirosΛέξεις-κλειδιά
COVID-19 ; C# ; MATLAB ; Επεξεργασία ιατρικής εικόνας ; Μηχανική μάθησηΠερίληψη
Σκοπός: Αντικείμενο της παρούσας διπλωματικής εργασίας είναι o προσδιορισμός των χαρακτηριστικών εικόνας που παρουσιάζουν οι πνεύμονες υπό το καθεστώς του ιού SARS-CoV-2 πριν και μετά από την επεξεργασία και ανάλυση ακτινογραφιών θώρακος περιστατικών COVID-19.
Υλικό & Μέθοδοι: Η επεξεργασία των ιατρικών εικόνων έγινε με την βοήθεια εφαρμογής ανεπτυγμένη σε γλώσσα C#, με την ανάλυση εικόνας να εκτελείται από κώδικα γραμμένο σε MATLAB. Για τις ανάγκες της διπλωματικής εργασίας χρησιμοποιήθηκαν ακτινογραφίες θώρακος και οι αντίστοιχες μάσκες τους (ελεύθερα διαθέσιμες από βάση δεδομένων), οι οποίες χωρίστηκαν στις κλάσεις Covid-19 (CVD), Normal (NRM), Viral Pneumonia (VPN) και απαρτίζονται από ακτινογραφίες περιστατικών Covid-19, ακτινογραφίες φυσιολογικών πνευμόνων και ακτινογραφίες περιστατικών ιογενούς πνευμονίας αντίστοιχα. Οι κλάσεις που προαναφέρθηκαν ανήκουν στην κατηγορία των μη επεξεργασμένων ακτινογραφιών θώρακος (groupOriginal). Μια δεύτερη κατηγορία (groupProcessed) τριών κλάσεων δημιουργήθηκε και αποτελείται από τις ακτινογραφίες θώρακα των κλάσεων CVD, NRM & VPN αφού έχουν υποστεί επεξεργασία εικόνας. Η τεχνική επεξεργασίας ιατρικής εικόνας που χρησιμοποιήθηκε είναι η προσαρμοστική εξισορρόπηση ιστογράμματος περιορισμένης αντίθεσης (Contrast Limited Adaptive Histogram Equalization ή CLAHE). Αυτή η κατηγορία κλάσεων αποτελεί την κατηγορία επεξεργασμένων εικόνων και αποτελείται από τις κλάσεις Covid-19_processed (CVDp), Normal_processed (NRMp) και Viral Pneumonia_processed (VPNp) με τις επεξεργασμένες ακτινογραφίες των περιστατικών Covid-19, των φυσιολογικών πνευμόνων και των περιστατικών ιογενούς πνευμονίας αντίστοιχα. Ύστερα από εξαγωγή χαρακτηριστικών υφής και μορφολογικών χαρακτηριστικών από τις ακτινογραφίες και μάσκες κάθε κλάσης, συλλέχτηκαν συνολικά σαράντα τέσσερα (44) χαρακτηριστικά, εκ των οποίων εννέα (9) αντιστοιχούν σε μορφολογικά χαρακτηριστικά, δεκαεπτά (17) αντιστοιχούν σε χαρακτηριστικά πρώτης τάξης και δεκαοκτώ (18) αντιστοιχούν σε χαρακτηριστικά δεύτερης τάξης (οκτώ (8) χαρακτηριστικά συνεμφάνισης και δέκα (10) χαρακτηριστικά μήκους διαδρομής). Στη συνέχεια, τα δεδομένα που προέκυψαν ελέγχθηκαν ως προς την κανονικότητα τους με χρήση του τεστ Kolmogorov–Smirnov, οπού όρισε τα δεδομένα ως δεδομένα που δεν ακολουθούν κανονική κατανομή. Η επιλογή χαρακτηριστικών που εμφανίζουν στατιστική διαφορά μεταξύ των τριών κλάσεων κάθε κατηγορίας πραγματοποιήθηκε με το τεστ Kruskal–Wallis. Το πλήθος των χαρακτηριστικών που επιλέχθηκαν αριθμεί στα δεκαεννέα (19). Τέλος, διάφοροι ταξινομητές ελέγχθηκαν ως προς την αποδοτικότητα τους στις δυο κατηγορίες κλάσεων (groupOriginal και groupProcessed) χωριστά και έγινε σύγκριση μεταξύ των αντίστοιχων αποτελεσμάτων.
Αποτελέσματα: Από τους ταξινομητές που ελέγχθηκαν, η μηχανή διανυσματικής στήριξης (Support Vector Machine ή SVM) Quadratic SVM παρουσίασε την καλύτερη απόδοση ταξινόμησης με ακρίβεια = 81,6%, ευαισθησία = 88% και επιφάνεια υπό της καμπύλης ROC (Area Under the Curve ή AUC) AUC = 0,94. Ο ίδιος ταξινομητής απέδωσε καλυτέρα με δεδομένα επεξεργασμένων ακτινογραφιών κατά CLAHE, παρουσιάζοντας ακρίβεια = 85,8%, ευαισθησία = 86% και AUC = 0,95.
Συμπεράσματα: Η επεξεργασία ιατρικής εικόνας κατά CLAHE συνολικά επηρέασε θετικά την απόδοση του επιλεγμένου ταξινομητή, αυξάνοντας την ακρίβειά του και την τιμή της AUC, καθιστώντας πιο ακριβής την ταξινόμηση και διάγνωση περιστατικών COVID–19.
Περίληψη
Aim: The subject of this thesis is the analysis of chest x-ray radiographs of Covid-19 cases before and after applying
medical image processing techniques in order to determine the characteristics that the human lungs display under
the influence of the SARS-CoV-2 virus.
Material & Methods: Image processing was executed by a desktop application developed in C# while image
analysis (extraction of features from the radiographs) was achieved with MATLAB scripts. For the needs of the
present work, x-ray chest radiographs and their corresponding masks (freely available from a database) were divided
based on medical case. This division creates the first class group (groupOriginal) that contains the classes Covid-
19 (CVD), Normal (NRM), VIRAL PNEUMONIA (VPN) with x–rays from Covid-19 cases, normal lung x–rays
and Viral Pneumonia cases respectively. The aforementioned classes were duplicated and then processed to create
a second class group (groupProcessed) with the classes Covid-19_processed (CVDp), Normal_processed (NRMp)
and Viral Pneumonia_processed (VPNp) with processed x-rays from Covid-19 cases, normal lung x-rays and Viral
Pneumonia cases respectively. The medical image processing technique applied is the Contrast Limited Adaptive
Histogram Equalization (CLAHE). After extracting texture features from the radiographs and masks of each class,
a total of forty-four (44) features were collected, of which nine (9) correspond to morphological features, seventeen
(17) correspond to first-order features and eighteen (18) correspond to second order features (eight (8) cooccurrence
features and ten (10) run length features). The resulting datasets were then tested for their normality
using the Kolmogorov-Smirnov test, which defined the datasets as datasets that do not follow a normal distribution.
The process of feature selection was accomplished using the Kruskal-Wallis test with the selected features
amounting to a total of nineteen (19). Finally, various classifiers were tested for their performance with the datasets
of both groupOriginal and groupProcessed.
Results: Of the classifiers tested, the Quadratic Support Vector Machine presented the best classification
performance with accuracy of 81,6%, sensitivity of 88% and Area Under the Curve (AUC) of 0,94. The same
classifier tested with the CLAHE-processed radiograph datasets displayed 85,8% accuracy, 86% sensitivity, and
0,95 AUC.
Conclusions: After implementing the medical image processing technique CLAHE the classifier displayed better
classification performance, increasing its accuracy and the AUC, making the classification and identification of
COVID–19 cases more accurate.