Ανίχνευση όγκου εγκεφάλου χρησιμοποιώντας αλγόριθμους ανίχνευσης αντικειμένων και νευρωνικά δίκτυα και απεικόνιση σε υπολογιστικό νέφος
Brain tumor detection using object detection algorithms and neural networks with raspberry Pi and cloud
Λέξεις-κλειδιά
Raspberry Pi ; Faster R-CNN ; CNN ; Object detection ; Computer visionΠερίληψη
Στην παρούσα εργασία έγινε έρευνα ως προς τις λειτουργίες ενός συστήματος υπολογιστικής όρασης, με σκοπό την εκπαίδευσή του ώστε να είναι σε θέση να ανιχνεύει και να αναγνωρίζει τύπους όγκου εγκεφάλου από μαγνητικές τομογραφίες.
Ξεκινώντας θα εξηγηθούν βασικές αρχές-έννοιες, που σχετίζονται με την υπολογιστική όραση, την κατάτμηση εικόνας, την ταξινόμηση εικόνας. Επίσης θα αναλυθούν έννοιες που έχουν να κάνουν με τον ταξινομητή του αντικειμένου, την ταξινόμηση, τα ειδή των ταξινομητών, την ανίχνευση μέσω της υπολογιστικής όρασης, την συλλογή των δεδομένων και τέλος τη δημιουργία ενός μοντέλου που θα μπορεί να αποκωδικοποιήσει χαρακτηριστικά και να αντλήσει χρήσιμες πληροφορίες εξάγοντάς τες με κάποιους αλγορίθμους από ένα σύνολο δεδομένων. Για το κομμάτι της υλοποίησης μέσω συνελικτικών νευρωνικών δικτύων θα γίνει εκπαίδευση ενός ταξινομητή ανίχνευσης αντικειμένων, με σκοπό την ανίχνευση και αναγνώριση είδους όγκου στον εγκέφαλο.Η εκπαίδευση θα γίνει με την χρήση της βιβλιοθήκης που δημιουργήθηκε από την ομάδα Google Brain για αριθμητικούς υπολογισμούς και μηχανική μάθηση, το TensorFlow μαζί με την πρόσθετη υπολογιστική ισχύ μιας κάρτας γραφικών μέσω της παράλληλης υπολογιστικής πλατφόρμας CUDA. Όλα τα βήματα και τα λογισμικά που χρησιμοποιήθηκαν για την υλοποίηση περιγράφονται αναλυτικά. Ακολούθως, θα γίνουν παρατηρήσεις μεταξύ των εκπαιδεύσεων αποκλειστικά με GPU και CPU ώστε να εξαχθούν συμπεράσματα για τους λόγους που η χρήση GPU είναι σημαντική κατά την εκπαίδευση μοντέλων βαθιάς μάθησης.Τέλος αφού ο ανιχνευτής είναι ολοκληρωμένος θα γίνει η ενσωμάτωσή του σε ένα Raspberry Pi ώστε να παρουσιαστεί η δυνατότητα φορητότητας και θα αναλυθεί η διαδικασία βημάτων υλοποίησής του.
Από τους ανιχνευτές υψηλής τεχνολογίας που αναλύθηκαν, χρησιμοποιήθηκε ένας Faster R-CNN ανιχνευτής, που κρίθηκε αρκετά αποτελεσματικός ως προς την έρευνα που υλοποιήθηκε. Σύμφωνα με τις μετρήσεις αξιολόγησης που έγιναν ως προς την τιμή F1 Score, που αντικατοπτρίζει τον συνδυασμό της ακρίβειας και της ανάκλησης του εκπαιδευμένου μοντέλου, με ποσοστό 70% κρίνεται ένα ικανοποιητικό μοντέλο λαμβάνοντας υπόψη το ανισόρροπο σύνολο δεδομένων που χρησιμοποιήθηκε, την επεξεργασία στην οποία υποβλήθηκε προτού δοθεί στο μοντέλο για να εκπαιδευτεί και της ισχύος του συστήματος . Τέλος παραθέτονται τα αποτελέσματα σε έκθεση μέσω των τεχνολογιών του υπολογιστικού νέφους για μελλοντική πιθανή χρήση.
Περίληψη
In the present work, research was performed on the functions of a computer vision system, in order to train it to be able to detect and recognize types of brain tumors from magnetic resonance imaging.
To begin with, basic principles-concepts related to computer vision, image segmentation, image classification will be explained. It will also analyze concepts related to object classifier, classification, types of classifier, computational vision detection, data collection and finally the creation of a model that can decode features and extract useful information by exporting them to some algorithms from a data set.
For the implementation part through convolutional neural networks, an object detection classifier will be trained, with the aim of detecting and recognizing a type of tumor in the brain. The training will be done using the library created by the Google Brain team for arithmetic and machine learning, TensorFlow together with the additional computing power of a graphics card through the parallel computing platform CUDA. All the steps and software used for the implementation are described in detail. Next, observations will be made between GPU and CPU-only training to draw conclusions as to why GPU usage is important in teaching deep learning models. Finally, after the detector is complete, it will be integrated into a Raspberry Pi in order to present the possibility of portability and the process of its implementation steps will be analyzed.
From the high-tech detectors analyzed, a Faster R-CNN detector was used, which was considered quite effective in terms of the research carried out. According to the evaluation metrics made for the F1 Score value, which reflects the combination of precision and recall of the trained model, with a percentage of 70% is considered a satisfactory model taking into account the unbalanced set of data used, the processing that was submitted before given to the model to train and system power. Finally, the results are presented in a report through cloud computing technologies for possible future use.