Σύγκριση νευρωνικών δικτύων βαθιάς μάθησης σε εφαρμογές ταξινόμησης εικόνων σε θεματικές κατηγορίες
Comparison of deep learning neural networks in applications of image classification into thematic categories

Λέξεις-κλειδιά
Συνελικτικά νευρωνικά δίκτυα ; Μεταφορά μάθησης ; Μάθηση συνόλου ; ΣύγκρισηΠερίληψη
Στη σύγχρονη εποχή, τα πολύ βαθιά νευρωνικά δίκτυα βρίσκονται στο επίκεντρο της καινοτομίας στον τομέα της ταξινόμησης εικόνων. Ωστόσο, η εκπαίδευση και η χρήση τέτοιων δικτύων παραμένει απρόσιτη για έργα που δεν διαθέτουν την απαραίτητη υπολογιστική ισχύ. Η παρούσα εργασία εστιάζει στην αναζήτηση στρατηγικών για τον σχεδιασμό αποδοτικών νευρωνικών δικτύων με χαμηλές υπολογιστικές απαιτήσεις και στη σύγκριση της απόδοσής τους στην ταξινόμηση εικόνων σε θεματικές κατηγορίες.
Η έρευνα κατέληξε σε δύο μοντέλα τα οποία υλοποιήθηκαν και αξιολογήθηκαν. Το ένα είναι μοντέλο επαγωγικής μεταφοράς μάθησης στο οποίο μεταφέρθηκε ο εξαγωγέας χαρακτηριστικών του EfficientNetB0 σε διαφορετικό στρώμα ταξινομητή. Το δεύτερο μοντέλο είναι ένα σύνολο από Συνελικτικά Νευρωνικά Δίκτυα τα οποία εκπαιδεύτηκαν με την χρήση της τεχνικής Bagging. Το σύνολο δεδομένων προέρχεται από την βάση Fashion MNIST το οποίο είναι ένα σύνολο εικόνων ελεύθερης πρόσβασης. Τα δεδομένα του συνόλου χωρίζονται σε 60.000 παραδείγματα εκπαίδευσης και 10.000 παραδείγματα αξιολόγησης. Η αποδοτικότητα των μοντέλων στο σύνολο αξιολόγησης φέρνει το μοντέλο μεταφοράς μάθησης σε ακρίβεια 88.56% και 91.59% για το Bagging μοντέλο.
Περίληψη
Very deep neural networks are at the heart of innovation in image classification. However, training and using such networks remains out of reach for projects that do not have the required computational power. This paper focuses on finding strategies for designing efficient neural networks with low computational requirements and comparing their performance in classifying images into thematic categories.
The research resulted in two models which were implemented and evaluated. One is an inductive transfer learning model in which the feature extractor of EfficientNetB0 was moved to a different classifier layer. The second model is an ensemble of Convolutional Neural Networks, which were trained using the Bagging technique. The dataset is derived from Fashion MNIST, an open-access collection of images. Its data is divided into 60,000 training examples and 10,000 test examples. The efficiency of the models on the test set brings the transfer learning model to an accuracy of 88.56% and 91.59% for the Bagging model.