Spatial-temporal crime prediction using deep learning
Χωρική – χρονική πρόβλεψη του εγκλήματος χρησιμοποιώντας βαθιά μάθηση
Μεταπτυχιακή διπλωματική εργασία
Author
Μποτσαράκος, Γεώργιος
Date
2022-09-26Advisor
Kasnesis, PanagiotisKeywords
Crime prediction ; Deep learning ; Neural networks ; Spatial-temporal deep learning ; Real-time prediction ; Βαθιά μάθηση ; Πρόβλεψη εγκληματικότητας ; Νευρωνικά δίκτυα ; Χωροχρονική βαθιά μάθησηAbstract
Dealing with crime is one of the main purposes of a society. Therefore, the law enforcement authorities with the limited resources they have are trying to fight crime, which is characterized by dynamic spatio-temporal changes, by distributing their forces accordingly. In order to make this distribution optimal, significant assistance could be provided by predicting spatiotemporal changes in crime. The use of artificial intelligence and specifically deep learning has been used in several spatio-temporal prediction tasks, based on historical data, such as movement prediction. The subject of this postgraduate thesis is the examination of the application of deep learning methods for the prediction of spatial and temporal criminal activity based on historical criminal data. In this context, different deep learning models, namely LSTM (Long Short-Term Memory), CLSTM (Convolutional LSTM), 3DCNN (Three-dimensional Convolutional Neural Networks) and GCNN (Graph CNN), are examined in order to evaluate which one can better capture spatial and temporal correlations of crime patterns and produce the most accurate predictions.
Historical data of property crimes that occurred in the cities of New York City and Attica were used to train and evaluate the above mentioned models. For the case of New York, a corresponding dataset was used that is freely accessible in the "open data" that New York provides on the internet. While for the case of Attica, a dataset provided by the Hellenic Police upon request was used for the purpose of this study. In order to feed these models with the corresponding data each time, the data were modified into different structures such as matrices and graphs. Moreover, for the evaluation of the models various standard metrics were used (MSE, RMSE, MAE, Accuracy Score and Roc Accuracy Score) depending on the case. Finally, the model found to provide the most accurate predictions was the CLSTM model, which was able to better capture the spatiotemporal correlations between historical crime data. This model is a combination of the operations of CNN and LSTM deep learning models. The crime predictions in the case of New York were more accurate than in the case of Attica due to the existence of a large percentage of noise in the crime data of the Attica region.
Abstract
Η αντιμετώπιση του εγκλήματος αποτελεί έναν από τους κυριότερους σκοπούς μίας κοινωνίας. Συνεπώς οι αρχές επιβολής του νόμου με τους πεπερασμένους πόρους που διαθέτουν προσπαθούν να καταπολεμήσουν την εγκληματικότητα η οποία χαρακτηρίζεται από δυναμικές χωροχρονικές αλλαγές κατανέμοντας ανάλογα τις δυνάμεις τους. Για να γίνει βέλτιστη αυτή η κατανομή σημαντική συνδρομή θα μπορούσε να παράσχει η πρόβλεψη των χωροχρονικών αλλαγών της εγκληματικότητας.
H χρήση τεχνητής νοημοσύνης και συγκεκριμένα βαθιάς μάθησης έχει χρησιμοποιηθεί σε αρκετές περιπτώσεις πρόβλεψης χωροχρονικών δεδομένων, με βάση ιστορικά δεδομένα, όπως είναι η πρόβλεψη της κίνησης. Αντικείμενο της παρούσας μεταπτυχιακή διατριβής αποτελεί η εξέταση η εξέταση της εφαρμογής μεθόδων βαθιάς μάθησης για την πρόβλεψη της χωρικής και χρονικής εγκληματικής δραστηριότητας με βάση χωρικά και χρονικά ιστορικά εγκληματικά δεδομένα. Στο πλαίσιο αυτό, εξετάζονται διαφορετικά μοντέλα βαθιάς μάθησης, συγκεκριμένα ΜΜ (Μακροπρόθεσμη Μνήμη), ΣΜΜ (Συνελικτική ΜΜ), 3ΔΣΝΔ (Συνελικτικά Νευρωνικά Δίκτυα Τριών Διαστάσεων) και ΓΣΝΔ (Συνελικτικά Νευρωνικά Δίκτυα Γράφων), προκειμένου να διαπιστωθεί ποιο από αυτά μπορεί να αποτυπώσει καλύτερα χωρικές και χρονικές συσχετίσεις της εγκληματικότητας και να παράγει τις ακριβέστερες προβλέψεις. Για την εκπαίδευση και αξιολόγηση των μοντέλων χρησιμοποιήθηκαν ιστορικά δεδομένα εγκλημάτων κατά της ιδιοκτησίας που έλαβαν χώρα στην πόλη της Νέας Υόρκης και στην Αττική. Για την περίπτωση της Νέας Υόρκης χρησιμοποιήθηκε αντίστοιχο σύνολο δεδομένων που είναι ελεύθερα προσβάσιμο στα «ανοιχτά δεδομένα» που διαθέτει η Νέα Υόρκη στο διαδίκτυο. Ενώ για την περίπτωση της Αττικής χρησιμοποιήθηκε σύνολο δεδομένων που παρασχέθηκε από την Ελληνική Αστυνομία κατόπιν αιτήματος για τον σκοπό της παρούσας έρευνας. Προκειμένου να τροφοδοτηθούν τα εν λόγω μοντέλα με τα αντίστοιχα δεδομένα κάθε φορά αυτά τροποποιήθηκαν σε διαφορετικές δομές όπως μήτρες, γράφοι. Ενώ για την αξιολόγηση των μοντέλων χρησιμοποιήθηκαν διάφορες τυπικές μετρικές ανάλογα την περίπτωση (MSE, RMSE, MAE, Accuracy Score και Roc Accuracy Score). Τέλος το μοντέλο που διαπιστώθηκε ότι παρείχε τις ακριβέστερες προβλέψεις ήταν το CLSTM το οποίο μπόρεσε να αποτυπώσει σε καλύτερο βαθμό τις χωροχρονικές συσχετίσεις μεταξύ των ιστορικών εγκληματικών δεδομένων. Το εν λόγω μοντέλο αποτελεί έναν συνδυασμό των χαρακτηριστικών των μοντέλων Συνελικτικών Νευρωνικών Δίκτυων (ΣΝΔ) και μοντέλων Μακροπρόθεσμης Μνήμης (ΜΜ) βαθιάς μάθησης. Όσον αφορά τα σύνολα δεδομένων οι προβλέψεις στην περίπτωση της Νέας Υόρκης ήταν ακριβέστερες από την περίπτωση της Αττικής λόγω ύπαρξης μεγάλου ποσοστού θορύβου στα εγκληματικά δεδομένα της περιοχής της Αττικής.
Number of pages
72Faculty
Σχολή ΜηχανικώνAcademic Department
Τμήμα Ηλεκτρολόγων και Ηλεκτρονικών ΜηχανικώνΤμήμα Μηχανικών Βιομηχανικής Σχεδίασης και Παραγωγής