Μουσική παραγωγή με τη χρήση Μηχανικής Μάθησης
Music generation using Machine Learning
Λέξεις-κλειδιά
Σύνθεση μουσικής ; Παραγωγή μουσικής ; Κατηγοριοποίηση μουσικής ; Μηχανική μάθηση ; Βαθιά μάθηση ; Νευρωνικά δίκτυα ; Μοντέλα βαθιάς μάθησηςΠερίληψη
Η μουσική, ιδίως η κλασσική μουσική, είναι αναγκαία για τους ανθρώπους, αφού καταργεί τα πολιτισμικά σύνορα και αγγίζει τους ανθρώπους σε όλες τις πτυχές της ζωής τους εδώ και αιώνες. Στην εποχή μας, η σύνθεση μουσικής με τις μεθόδους της τεχνητής νοημοσύνης έχει κερδίσει τον δικό της χώρο ως επιστημονικός τομέας έχοντας τραβήξει το ενδιαφέρον πολλών ερευνητών. Η εφαρμογή που πραγματεύεται η εργασία βοηθάει τον καλλιτέχνη να μπορεί να προσδιορίσει μια ιδέα/κομμάτι του, με βάση έναν από τους συνθέτες Mozart, Bach, Haydn ή Chopin, και να παραχθεί ένα μουσικό κομμάτι βασισμένο στα χαρακτηριστικά που χαρακτηρίζουν τον συνθέτη, που είναι πιο κοντά στο στυλ του καλλιτέχνη, με σκοπό την ενσωμάτωση του στυλ του συνθέτη στην σύνθεση του καλλιτέχνη. Για την κατηγοριοποίηση χρησιμοποιούνται και αξιολογούνται διάφοροι αλγόριθμοι Μηχανικής Μάθησης όπως Decision Trees, Random Forest, Support Vector Machine κ.α., ενώ για την παραγωγή μουσικής χρησιμοποιούνται τα δυο μοντέλα βαθιάς μάθησης, το Long short-term memory (LSTM) και το WaveNet. Εμβαθύνοντας στα δυο μοντέλα, πραγματοποιείται διερεύνηση πάνω στην εκπαίδευση αυτών των μοντέλων σε τέσσερα διαφορετικά σύνολα δεδομένων, διαφόρων μεγεθών και μουσικών συνθέσεων. Με την εκτέλεση της παραγωγής κομματιών, παράγονται συνθέσεις για κάθε εκπαιδευμένο μοντέλο και αξιολογούνται. Τέλος, τονίζονται οι περιορισμοί, οι πιθανές βελτιώσεις αυτών και τα πεδία μελλοντικής έρευνας.
Περίληψη
Music, especially classical music, is necessary for people, as it breaks down cultural barriers and has touched people in all aspects of their lives for centuries. Nowadays, music composition using artificial intelligence methods has earned its own space as a scientific field having attracted the interest of many researchers. The application discussed in the paper helps the artist to be able to identify an idea/piece of music based on one of the composers Mozart, Bach, Haydn or Chopin, and produce a piece of music based on the characteristics of the composer that is closer to the artist's style, with the aim of incorporating the composer's style into the artist's composition. Various Machine Learning algorithms such as Decision Trees, Random Forest, Support Vector Machine etc. are used and evaluated for categorization, while the two deep learning models, Long short-term memory (LSTM) and WaveNet are used for music generation. Delving deeper into the two models, an investigation on the training of these models on four different datasets of different sizes and musical compositions is carried out. By performing track generation, compositions for each trained model are produced and evaluated. Finally, limitations, possible improvements of these and areas for future research are highlighted.