Show simple item record

Σχεδίαση και υλοποίηση ροών εργασιών βασισμένων σε κατευθυνόμενους άκυκλους γράφους. Εφαρμογή των αλληλοεξαρτήσεων δεδομένων και των διεργασιών των συστημάτων ερευνητικού προγράμματος

dc.contributor.advisorΓιαννακόπουλος, Παναγιώτης
dc.contributor.authorΚουτάνης, Άγγελος
dc.date.accessioned2021-10-27T07:17:40Z
dc.date.available2021-10-27T07:17:40Z
dc.date.issued2021-10-11
dc.identifier.urihttps://polynoe.lib.uniwa.gr/xmlui/handle/11400/1445
dc.identifier.urihttp://dx.doi.org/10.26265/polynoe-1296
dc.description.abstractΤα τελευταία χρόνια ο όγκος δεδομένων που διαχειρίζονται οι επιχειρήσεις και οργανισμοί είναι τεράστιος. Συνήθως, τα δεδομένα αυτά προκύπτουν από διάφορες πηγές και σε διάφορες μορφές και πρέπει να επεξεργαστούν προκειμένου να τροφοδοτήσουν μετέπειτα άλλα συστήματα. Για να γίνει αυτό πρέπει να εκτελεστούν κάποιες διεργασίες, οι οποίες λαμβάνουν αυτά τα δεδομένα, τα επεξεργάζονται και τα μεταφέρουν στον προορισμό τους. Το σύνολο αυτών των διεργασιών χαρακτηρίζεται ως σωληναγωγός δεδομένων (Data Pipeline). Για τον σχεδιασμό, την επίβλεψη και τον προγραμματισμό τέτοιων σωληναγωγών χρησιμοποιούνται πλατφόρμες ενορχήστρωσης ροών εργασιών (Workflow Orchestration Platforms) ή αλλιώς συστήματα διαχείρισης ροών εργασιών (Workflow Management Systems - WfMS). Η εργασία αυτή ερευνά το πεδίο της μηχανικής δεδομένων που ασχολείται συγκεκριμένα με την κατασκευή των σωληναγωγών και εξετάζει κάποιες από τις πιο δημοφιλείς ανοιχτού κώδικα πλατφόρμες ενορχήστρωσης ροών εργασιών. Επιπλέον, επιλέγεται η κατάλληλη πλατφόρμα ενορχήστρωσης ροών εργασιών για να χρησιμοποιηθεί στην ανάπτυξη του εργαλείου Hyperion Community Engagement Tool, ενός εργαλείου που είναι μέρος του Hyperion Project, το οποίο αφορά την προστασία των χώρων πολιτιστικής κληρονομιάς. Τέλος, γίνεται ανάλυση απαιτήσεων, σχεδιασμός και υλοποίηση των διεργασιών που αποτελούν τον σωληναγωγό δεδομένων και υλοποίηση αυτού με την επιλεγμένη πλατφόρμα ενορχήστρωσης ροών εργασιών.el
dc.format.extent117el
dc.language.isoelel
dc.publisherΠανεπιστήμιο Δυτικής Αττικήςel
dc.rightsΑναφορά Δημιουργού - Μη Εμπορική Χρήση - Παρόμοια Διανομή 4.0 Διεθνές*
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 Διεθνές*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/*
dc.subjectData pipelinesel
dc.subjectWorkflow management systemsel
dc.subjectProcess schedulingel
dc.subjectWorkflow orchestration platformsel
dc.subjectData processingel
dc.titleΣχεδίαση και υλοποίηση ροών εργασιών βασισμένων σε κατευθυνόμενους άκυκλους γράφους. Εφαρμογή των αλληλοεξαρτήσεων δεδομένων και των διεργασιών των συστημάτων ερευνητικού προγράμματοςel
dc.title.alternativeDesign and Implementation of DAG-based workflows. Application of the interdependencies according to the existing data and tasks for an H2020 projectel
dc.typeΔιπλωματική εργασίαel
dc.contributor.committeeΠρεζεράκος, Γεώργιος
dc.contributor.committeeΒουλόδημος, Αθανάσιος
dc.contributor.facultyΣχολή Μηχανικώνel
dc.contributor.departmentΤμήμα Μηχανικών Πληροφορικής και Υπολογιστώνel
dc.description.abstracttranslatedIn recent years the amount of data that companies and organizations are managing is enormous. Usually, these data belong to numerous data sources and can have different formats. It is important that these data will be processed and validated before feeding other systems. In order to make this happen, the orchestration and execution of tasks is necessary. These tasks are retrieving the data from all these sources, processing them and delivering them to the appropriate destination. This set of processes assembles a data pipeline. For the implementation and monitoring of data pipelines there are numerous open-source Workflow Orchestration platforms available. This thesis reviews the field of Data Engineering regarding the fundamentals of data pipelines, as well as, investigates some of the most famous Workflow orchestration platforms. Additionally, the most suitable Workflow Orchestration Platform is picked to implement a data pipeline for the Hyperion Community Engagement Tool. This tool is part of Hyperion Project, a real-life project that helps to protect cultural heritage sites. Finally, before the implementation of the data pipeline; the analysis and definition of requirements for each task is taking place and then the procedure continues further with the implementation of the data pipeline according to the most suitable workflow orchestration platform.el


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record

Αναφορά Δημιουργού - Μη Εμπορική Χρήση - Παρόμοια Διανομή 4.0 Διεθνές
Except where otherwise noted, this item's license is described as
Αναφορά Δημιουργού - Μη Εμπορική Χρήση - Παρόμοια Διανομή 4.0 Διεθνές