Πρόβλεψη Έκβασης Αγώνων Ποδοσφαίρου με Αλγορίθμους Μηχανικής Μάθησης
Prediction of Football Matches Outcomes with Machine Learning Algorithms

Λέξεις-κλειδιά
Classification ; Αλγόριθμοι ; Μηχανική μάθηση ; Τεχνητή νοημοσύνη ; Logistic regression ; Random forest ; Gradient boosting ; K-Nearest neighbors ; Feature engineering ; Multi-Layer perceptronΠερίληψη
Η παρούσα διπλωματική εξετάζει τη χρήση αλγορίθμων μηχανικής μάθησης για την
πρόβλεψη αποτελεσμάτων ποδοσφαιρικών αγώνων, με στόχο την αξιολόγηση
διάφορων μοντέλων που μπορούν να βελτιώσουν την ακρίβεια των προβλέψεων. Στην
αρχή, διεξήχθη αναλυτική βιβλιογραφική ανασκόπηση, κατά την οποία αναλύθηκαν
οι προσεγγίσεις και οι τεχνικές από προηγούμενες έρευνες, εντοπίζοντας αδυναμίες
και περιορισμούς στις μεθόδους πρόβλεψης. Στη συνέχεια, παρουσιάστηκε το
θεωρητικό υπόβαθρο των αλγορίθμων μηχανικής μάθησης, όπως Logistic Regression,
Random Forest, Gradient Boosting, k-Nearest Neighbors και Multi-Layer Perceptron,
εξετάζοντας πώς αυτές οι τεχνικές μπορούν να βελτιστοποιηθούν για πιο ακριβείς
προβλέψεις. Η εργασία εστιάζει κυρίως στην προσέγγιση με ταξινόμηση δύο κλάσεων
(binary classification) για την πρόβλεψη των αποτελεσμάτων. Ακολούθησε μια
ανάλυση των βημάτων δημιουργίας μοντέλων μηχανικής μάθησης, από τη συλλογή
των δεδομένων μέχρι τη βελτιστοποίησή τους. Στο πειραματικό μέρος,
χρησιμοποιήθηκαν πραγματικά δεδομένα από ποδοσφαιρικούς αγώνες και
εφαρμόστηκαν τεχνικές feature engineering για τη βελτίωση της απόδοσης των
αλγορίθμων. Μετά από δύο φάσεις εκτέλεσης και βελτιστοποίησης των αλγορίθμων,
τα αποτελέσματα έδειξαν βελτιώσεις στην ακρίβεια των προβλέψεων, ενώ
πραγματοποιήθηκε επίσης ανάλυση για την ανίχνευση φαινομένων overfitting και
underfitting. H εργασία εξετάζει και την ταξινόμηση πολλαπλών κλάσεων (Multiclass
Classification), υπογραμμίζοντας τις προκλήσεις και τις δυνατότητές της. Τέλος, η
μελέτη συγκρίνει τα αποτελέσματα των μοντέλων σε όρους ακρίβειας και απόδοσης,
αναδεικνύοντας τις διαφορές ανάμεσα στις διάφορες προσεγγίσεις και αναγνωρίζει
τους περιορισμούς που υπήρξαν . Συνολικά, η εργασία συμβάλλει στην κατανόηση και
βελτίωση των υπαρχουσών μεθόδων πρόβλεψης ποδοσφαιρικών αγώνων,
προσφέροντας πιο αξιόπιστα μοντέλα που μπορούν να εφαρμοστούν για τη λήψη
αποφάσεων σε επαγγελματικό επίπεδο ή την ανάπτυξη στρατηγικών σε στοιχηματικές
και αθλητικές αναλύσεις.
Περίληψη
This thesis examines the use of machine learning algorithms for predicting the
outcomes of football matches, aiming to evaluate various models that can improve the
accuracy of predictions. Initially, a comprehensive literature review was conducted,
analyzing the approaches and techniques from previous research, identifying
weaknesses and limitations in the prediction methods. Subsequently, the theoretical
background of machine learning algorithms was presented, such as Logistic
Regression, Random Forest, Gradient Boosting, k-Nearest Neighbors, and Multi-Layer
Perceptron, exploring how these techniques can be optimized for more accurate
predictions. The work primarily focuses on the binary classification approach for
predicting outcomes. An analysis of the steps involved in creating machine learning
models was then performed, from data collection to optimization. In the experimental
section, real data from football matches was used, and feature engineering techniques
were applied to improve the performance of the algorithms. After two phases of
execution and optimization of the algorithms, the results showed improvements in
prediction accuracy, and an analysis was also conducted for detecting overfitting and
underfitting phenomena. The study examines also multiclass classification,
highlighting its challenges and potential. Finally, the research compares the results of
the models in terms of accuracy and performance, highlighting the differences between
various approaches and recognizing the limitations that existed. Overall, the work
contributes to understanding and improving existing methods for predicting football
match outcomes, providing more reliable models that can be applied for decision-making at a professional level or for developing strategies in betting and sports
analytics.