Πρόβλεψη εκπομπών διοξειδίου του άνθρακα με την χρήση αλγορίθμων μηχανικής μάθησης
Prediction of carbon dioxide emissions using machine learning algorithms
Διπλωματική εργασία
Συγγραφέας
Καλλιγεράκη, Αλεξάνδρα
Ημερομηνία
2024-07-30Επιβλέπων
Tselenti, PanagiotaΛέξεις-κλειδιά
Μηχανική μάθηση ; Εκπομπές διοξειδίου του άνθρακα ; Μοντέλο πρόβλεψης ; Κλιματική αλλαγή ; Machine learning ; Carbon dioxide emissions ; Prediction model ; Climate changeΠερίληψη
Η παρούσα διπλωματική εργασία εξετάζει τη χρήση αλγορίθμων μηχανικής μάθησης για την πρόβλεψη εκπομπών διοξειδίου του άνθρακα (CO2), στοχεύοντας στην ανάπτυξη και αξιολόγηση διαφόρων μοντέλων για την ακριβή πρόβλεψη των εκπομπών και την αναγνώριση των σημαντικότερων χαρακτηριστικών που τις επηρεάζουν. Αρχικά, πραγματοποιήθηκε εκτενής βιβλιογραφική ανασκόπηση για να αναλυθούν προηγούμενες έρευνες και τεχνικές, ενώ στη συνέχεια παρουσιάστηκε το θεωρητικό υπόβαθρο των αλγορίθμων μηχανικής μάθησης, όπως Gradient Boosting, XGBoost, Random Forest, Decision Tree, Ridge Regression και Lasso Regression. Το πειραματικό μέρος περιλάμβανε τη συλλογή και προεπεξεργασία δεδομένων, την επιλογή χαρακτηριστικών, την εκπαίδευση και αξιολόγηση των μοντέλων, καθώς και τη σύγκριση της απόδοσής τους. Τα αποτελέσματα έδειξαν ότι τα μοντέλα Gradient Boosting και XGBoost παρουσίασαν την καλύτερη απόδοση, με το XGBoost να επιτυγχάνει το χαμηλότερο μέσο τετραγωνικό σφάλμα (MSE) και τον υψηλότερο συντελεστή προσδιορισμού (R2), καθιστώντας το πιο αποδοτικό μοντέλο. Αναγνωρίστηκαν ορισμένοι περιορισμοί, όπως η περιορισμένη διαθεσιμότητα δεδομένων και η υπερπροσαρμογή των μοντέλων, αλλά επίσης αναδείχθηκε η σημασία της προσεκτικής προεπεξεργασίας δεδομένων και της επιλογής χαρακτηριστικών. Προτάθηκαν κατευθύνσεις για μελλοντική έρευνα, όπως η εφαρμογή πιο προηγμένων αλγορίθμων και η χρήση μεγαλύτερων και πιο ποικιλόμορφων συνόλων δεδομένων για τη βελτίωση της ακρίβειας και της γενίκευσης των προβλέψεων. Τα ευρήματα της έρευνας έχουν σημαντικές εφαρμογές στην ανάπτυξη πολιτικών και στρατηγικών για τη μείωση των εκπομπών CO2, προσφέροντας πολύτιμα εργαλεία για την αντιμετώπιση της κλιματικής αλλαγής.
Περίληψη
This thesis examines the use of machine learning algorithms for predicting carbon dioxide (CO2) emissions, aiming to develop and evaluate different models for accurate prediction of emissions and identification of the most important characteristics that influence them. Initially, an extensive literature review was conducted to analyse previous research and techniques, followed by a theoretical background of machine learning algorithms such as Simple Linear Regression, Gradient Boosting, XGBoost, Random Forest, Decision Tree, Ridge Regression and Lasso Regression. The experimental part included data collection and pre-processing, feature selection, training and evaluation of the models, and comparison of their performance. The results showed that the Gradient Boosting and XGBoost models performed best, with XGBoost achieving the lowest mean square error (MSE) and the highest coefficient of determination (R2), making it the most efficient model. Some limitations were acknowledged, such as limited data availability and model over-fitting, but the importance of careful data preprocessing and feature selection was also highlighted. Directions for future research were suggested, such as the application of more advanced algorithms and the use of larger and more diverse datasets to improve the accuracy and generalizability of the predictions. The findings of the research have important applications in the development of policies and strategies to reduce CO2 emissions, providing valuable tools to address climate change.