Πρόβλεψη δραστηριοτήτων επιχειρησιακών διεργασιών με πιθανοτικά μοντέλα μάθησης.
Activity prediction of business processes with probabilistic learning models.
Διπλωματική εργασία
Συγγραφέας
Πρασίδης, Ιωάννης
Ημερομηνία
2021-07-21Επιβλέπων
Bousdekis, AlexandrosMiaoulis, Georgios
Λέξεις-κλειδιά
Εξόρυξη ; Επιχειρησιακές διεργασίες ; Πρόβλεψη δραστηριοτήτων ; Πιθανοτικά μοντέλα μάθησης ; Μοντέλο διεργασιών ; Αρχείο καταγραφής συμβάντων ; Αλγόριθμοι εξόρυξης διεργασιών ; Μπεϋζιανό δίκτυο ; Νόμος ΜπέυζΠερίληψη
Οι διαδικασίες αποτελούν το πιο σημαντικό στοιχείο μιας επιχείρησης, καθώς η επιτυχής
εκτέλεση τους συμβάλλει στην ολοκλήρωση των οργανωτικών της στόχων. Προκειμένου
όμως να είναι σε θέση να πετυχαίνει τους στόχους της, πρέπει να γίνεται ανάλυση των
διαδικασιών αυτών για τυχόν αποκλίσεις αλλά και να δημιουργηθεί ένα μοντέλο το οποίο
θα περιγράφει αναλυτικά το σύνολο των δραστηριοτήτων που εκτελούνται, αλλά και των
σχέσεων μεταξύ των. Μέσω των παραπάνω τεχνικών, γίνεται ευκολότερη η κατανόηση
των διαδικασιών που πραγματοποιούνται σε μια επιχείρηση, των προβλημάτων αλλά και
των συνεισφορών που μπορεί να προσφέρει μια αλλαγή.
Δεν είναι λίγες οι φορές που, κάποιο μοντέλο δεν «ταυτίζεται» με τις υπάρχουσες
διαδικασίες της επιχείρησης, καθώς είτε υπάρχουν σχέσεις μεταξύ δραστηριοτήτων που
φαινομενικά δεν μπορούν να πραγματοποιηθούν είτε δεν υπάρχουν στο σύστημα της
επιχείρησης. Και όλα αυτά γιατί από μόνη της μια διαδικασία μπορεί να γίνει αρκετά
πολύπλοκη από τη φύση της, όταν προσπαθήσουμε να την εφαρμόσουμε σε κάποιο
σύστημα. Επομένως, χρήζει αντιμετώπισης η αβεβαιότητα που συναντάμε στις
επιχειρησιακές διαδικασίες, μέσω κάποιου πιθανοτικού μοντέλου μάθησης.
Ειδικότερα, η διπλωματική εργασία αφορά την εξόρυξη επιχειρησιακών διεργασιών και
την πρόβλεψη δραστηριοτήτων με τη χρήση πιθανοτικών μοντέλων μάθησης.
Πιο συγκεκριμένα, το πρώτο βήμα της προσέγγισης είναι η εξαγωγή των μοντέλων
διεργασιών (process models) και των δικτύων Petri (Petri nets) από αρχεία καταγραφής
συμβάντων (event logs) με τη χρήση των αλγορίθμων εξόρυξης διεργασιών. Έπειτα,
γίνεται ανάλυση των παραπάνω με σκοπό την περεταίρω μελέτη και προβολή επιμέρους
λεπτομερών σχετικά με τα αρχεία καταγραφής συμβάντων (event logs) αλλά και πιο
συγκεκριμένα των διεργασιών που εμπεριέχουν. Στη συνέχεια, τα events logs και το
process model εισέρχονται σε ένα Μπεϋζιανό δίκτυο (Bayesian Network), προκειμένου να
δημιουργηθεί ένα πιθανοτικό μοντέλο, το οποίο μπορεί να «μαθαίνει» κάθε φορά που θα
εισάγονται νέες εγγραφές.
Με αυτόν τον τρόπο, η προσέγγιση της διπλωματικής επιτρέπει τη διαχείριση της
αβεβαιότητας, που αφορά τη μετάβαση στην επόμενη δραστηριότητα, με τον υπολογισμό
των αντίστοιχων πιθανοτήτων κατά τον νόμο του Μπέυζ (Bayes).
Η υλοποίηση γίνεται με τη χρήση της γλώσσας προγραμματισμού Python.
Περίληψη
Processes are the most important element of a business, as their successful execution
contributes to the completion of its organizational goals. However, in order to be able to
achieve its goals, these processes must be analyzed for any deviations and a model must
be created that will describe in detail all the activities performed, but also the relationships
between them. Through the above techniques, it becomes easier to understand the
processes that take place in a business, the problems and the contributions that a change
can offer.
It is not uncommon for a model not to "identify" with existing business processes, as there
are either relationships between activities that seemingly cannot be accomplished or do not
exist in the business system. And all this because a process can become quite complex in
nature, when we try to apply it to a system. Therefore, the uncertainty we encounter in
business processes needs to be addressed, through some probabilistic learning model.
In particular, this thesis discusses the business process mining and the activity prediction
with probabilistic learning models.
More specifically, the first step in the approach is to export process models and Petri nets
from the event log using process mining algorithms. Then, the above is analyzed in order
to further study and view individual details about the event logs and more specifically the
processes involved. Afterwards, the event log and process model are entered into a
Bayesian Network in order to create a probabilistic model that can “learn” each time new
entries are entered.
In this way, this thesis approach allows the uncertainty, regarding the transition to the next
activity, to be managed by calculating the corresponding probabilities under Bayes law.
The implementation is done using the Python programming language