Σύγχρονες και αποδοτικές μέθοδοι ψηφιακής επεξεργασίας υψίρρυθμων συστημάτων οπτικών επικοινωνιών
Modern and efficient digital signal processing methods for high baud-rate optical communication systems
Keywords
Οπτικές επικοινωνίες ; Ψηφιακά σύμφωνα συστήματα ; Διαμόρφωσης έντασης και άμεση ανίχνευση ; Μη-γραμμική επεξεργασία σήματος ; Διασπορά οπτικών ινών ; Επαναλαμβανόμενα νευρωνικά δίκτυα ; Βαθιά μάθηση ; Ψηφιακή επεξεργασία σήματος και μηχανική μάθησηAbstract
Τα σύγχρονα συστήματα οπτικών επικοινωνιών παρουσιάζουν ραγδαία ανάπτυξη εξαιτίας της εμφάνισης αρχιτεκτονικών δικτύωσης υπολογιστικού νέφους/άκρου που σχετίζονται με σύγχρονες εφαρμογές και υπηρεσίες και καθορίζουν πώς θα εξελιχθεί το διαδίκτυο τις επόμενες δεκαετίες. Καθώς οι ρυθμοί μετάδοσης μεγαλώνουν διαρκώς πλησιάζοντας τα φυσικά όρια της μονότροπης οπτικής ίνας, ο στόχος της επίτευξης εξαιρετικά υψηλής χωρητικότητας ανά οπτική ίνα είναι επιτακτική ανάγκη και χωρίς ουσιαστική αύξηση της κατανάλωσης ενέργειας, αποτελεί σημαντική πρόκληση.
Στα συστήματα μετάδοσης μεγάλων αποστάσεων, όπου επικρατούν οι ψηφιακές σύμφωνες λύσεις, η βελτίωση της φασματικής απόδοσης παρεμποδίζεται κυρίως από τα μη γραμμικά φαινόμενα που αποδίδονται στο φαινόμενο Kerr. Στα συστήματα διαμόρφωσης έντασης/άμεσης ανίχνευσης (Intensity Modulation/Direct Detection, IM/DD) που προτιμώνται στις μικρές αποστάσεις η κύρια υποβάθμιση προέρχεται από το φαινόμενο εξασθένισης ισχύος, που προκαλείται από τη χρωματική διασπορά, από τους περιορισμούς του εύρους ζώνης και από τις μη-γραμμικότητες των πομποδεκτών.
H εξέλιξη των αλγορίθμων μηχανικής μάθησης και των τεχνικών βαθιάς μάθησης δίνει τη δυνατότητα εφαρμογής τους σε ψηφιακούς επεξεργαστές τελευταίας τεχνολογίας, προκειμένου να επιλύσουν αποτελεσματικά, σύνθετα μη γραμμικά προβλήματα. Συνεπώς η υιοθέτησή τους για την αντιμετώπιση των μη-γραμμικών φαινομένων της οπτικής διάδοσης κερδίζει σταδιακά έδαφος.
Τα κύρια αποτελέσματα της διατριβής ήταν η αντιμετώπιση των μη γραμμικοτήτων της οπτικής ίνας μέσω της εφαρμογής επαναλαμβανόμενων νευρωνικών δικτύων (recurrent neural networks, RNN) και η προσομοίωση μη-γραμμικών φωτονικών συστημάτων με τη χρήση αλγορίθμων μηχανικής μάθησης. Ειδικότερα, η χρήση αμφίδρομων RNN επιφέρει τη σημαντική βελτίωση της απόδοσης των υψίρρυθμων συστημάτων οπτικών επικοινωνιών. Η διατριβή βασίστηκε σε αναλύσεις, προσομοιώσεις και πειράματα που πραγματοποιήθηκαν σε διάφορα σενάρια εφαρμογής, τόσο σε δίκτυα μεγάλων αποστάσεων (>1000 km) που χρησιμοποιούν σύμφωνο δέκτη, όσο και σε οπτικά δίκτυα μικρών αποστάσεων (< 120 km) που βασίζονται σε IM/DD συστήματα.
Οι σημαντικότερες θεματικές που αναλύθηκαν κατά τη διάρκεια εκπόνησης της συγκεκριμένης διατριβής είναι οι ακόλουθες:
• Παρουσιάστηκε για πρώτη φορά η χρήση νευρωνικού δικτύου μακριάς βραχυπρόθεσμης μνήμης (Long Short Term Memory Neural Network, LSTM) για την αντιστάθμιση της μη γραμμικότητας των οπτικών ινών σε ψηφιακά σύμφωνα συστήματα. Πραγματοποιήθηκαν αριθμητικές προσομοιώσεις διάδοσης στη ζώνη-C και τη ζώνη-Ο, διαμόρφωσης 16-QAM με πολυπλεξία πόλωσης, ενός ή πολλών καναλιών. Αναλύθηκε λεπτομερώς η επίδραση του αριθμού των κρυφών μονάδων και του μήκους της λέξης των συμβόλων. Μελετήθηκε εκτενώς η απόδοση και τα όρια λειτουργίας ενώ αναδείχθηκε η ανθεκτικότητα του προτεινόμενου ισοσταθμιστή σε διάφορα σενάρια μεταβολής των συνθηκών διάδοσης. Οι προσομοιώσεις απέδειξαν πως τα νευρωνικά δίκτυα τύπου LSTM μπορούν να είναι πολύ αποτελεσματικά ως ψηφιακοί επεξεργαστές σήματος στον δέκτη και την ίδια στιγμή είναι λιγότερο πολύπλοκα συγκρινόμενα με τους ισοσταθμιστές τύπου Digital Back Propagation (DBP), ειδικά στο σενάριο διάδοσης πολλαπλών καναλιών σε μεγάλες αποστάσεις (> 1000 km.).
• Μελετήθηκε η πολυπλοκότητα και η απόδοση μονάδων επεξεργασίας για την άρση των μη γραμμικών φαινομένων. Συγκρίθηκαν οι επικρατέστεροι τύποι RNN, bi-LSTM, bi-GRU και bi-Vanilla-RNN ως προς την πολυπλοκότητα και τις επιδόσεις τους και αποδείχθηκε πως όλοι οι τύποι διαθέτουν τη δυνατότητα να επιτύχουν μη γραμμική εξισορρόπηση ιδιαίτερα σε συστήματα μεγάλης διασποράς σε ψηφιακά σύμφωνα συστήματα, που μεταφέρουν σήματα διαμόρφωσης 16 και 32 QAM, με πολυπλεξία πόλωσης, ενός ή πολλών καναλιών. Οι προσομοιώσεις έδειξαν ότι τα τρία μοντέλα παρέχουν παρόμοια απόδοση αντιστάθμισης, επομένως, σε πραγματικά συστήματα, πρέπει να προτιμηθεί το απλούστερο σχήμα που βασίζεται στο μοντέλο Vanilla-RNN. Προτάθηκε η προσέγγιση πολλαπλών εισόδων πολλαπλών εξόδων (many to many) ως μια ιδιαίτερα αποδοτική μέθοδος ελαχιστοποίησης της πολυπλοκότητας. Πραγματοποιήθηκε σύγκριση με τους μη γραμμικούς ισοσταθμιστές τύπου Volterra και επιδείχθηκε η υπεροχή του Vanilla-RNN τόσο από την άποψη των επιδόσεων όσο και της πολυπλοκότητας.
• Με βάση ένα πειραματικό σύστημα διάδοσης με διαίρεση μήκους κύματος (CWDM) στη ζώνη-O, διαμόρφωσης έντασης και άμεσης ανίχνευσης (IM/DD) και ρυθμού 4 × 50-Gb/s, αποδείχθηκε η σημαντικά καλύτερη επίδοση ρυθμού σφάλματος (bit error rate, BER) του σχήματος Vanilla-RNN σε σχέση με τον συμβατικό ισοσταθμιστή ανάδρασης απόφασης (DFE) για διαμορφώσεις OOK και PAM4. Αναδείχθηκε η ικανότητα του ισοσταθμιστή Vanilla-RNN να αντισταθμίζει τόσο τις γραμμικές όσο και τις μη γραμμικές αλλοιώσεις που προκαλούνται από τον πομποδέκτη και τη μονότροπη ίνα. Ως απότοκο της δράσης του Vanilla-RNN ισοσταθμιστή, επετεύχθη οπτική διάδοση έως και 100 km και 75 km για τις ΟΟΚ και PΑM4 διαμορφώσεις αντίστοιχα. Επιπλέον, μέσω της σύγκρισης με άλλα σχήματα εξισορρόπησης, συμπεριλαμβανομένου του γραμμικού ισοσταθμιστή, του ισοσταθμιστή 3ης τάξης Volterra και του Volterra+DFE, αποδείχθηκε ότι ο ισοσταθμιστής Vanilla-RNN επιτυγχάνει την καλύτερη επίδοση BER παρουσιάζοντας επίσης χαμηλότερη πολυπλοκότητα υλοποίησης σε σύγκριση με σχήματα που βασίζονται στο Volterra.
• Προτάθηκε και εφαρμόστηκε η πολυκαναλική ισοστάθμιση WDM καναλιών προκειμένου να εξισορροπηθούν τα μη γραμμικά φαινόμενα μεταξύ των καναλιών, τροποποιώντας κατάλληλα τους επεξεργαστές bi-RNN των προηγούμενων εργασιών. Ο ισοσταθμιστής χρησιμοποιεί την αρχιτεκτονική επεξεργασίας πολλαπλών εισόδων πολλαπλών εξόδων (multi-input multi-output, MIMO) για την αποκωδικοποίηση των WDM καναλιών. Με αυτόν τον τρόπο, εκμεταλλεύεται τη χρήσιμη πληροφορία από τα γειτονικά κανάλια για την καλύτερη αναγνώριση και άρση των διακαναλικών αλληλεπιδράσεων. Αποδείχθηκε μέσω εκτεταμένων αριθμητικών προσομοιώσεων και πειραματικών αποτελεσμάτων ότι η προτεινόμενη προσέγγιση ξεπερνά τόσο την τυπική εξισορρόπηση πολλαπλών καναλιών με τη μορφή προσαρμοστικών ισοσταθμιστών, όσο και τους ισοσταθμιστές τύπου DBP αλλά και το μονοκαναλικό bi-RNN.
• Χρησιμοποιήθηκαν οι προηγούμενες δομές RNN για την εξομοίωση της δυναμικής συμπεριφοράς ενός πραγματικού οπτικού συστήματος διάδοσης, βασιζόμενου σε laser επιφανειακής εκπομπής, VCSEL ρυθμού 106.25 Gb/s και PAM4 διαμόρφωσης. Αποδείχθηκε πως τα RNN δίκτυα είναι ικανά να αναπαράγουν τα δυναμικά χαρακτηριστικά του οπτικού συστήματος με ακρίβεια πρόβλεψης που πλησιάζει το 100%. Μελετήθηκε τέλος η ικανότητα εξομοίωσης περιοχών λειτουργίας του οπτικού συστήματος στις οποίες το διαθέσιμο νευρωνικό δίκτυο δεν έχει εκπαιδευτεί.
Abstract
Modern optical communication systems exhibit rapid growth due to the advent of edge-cloud networking architectures that fuel the future of 5G/B5G define how internet will evolve in the next decades. As transmission rates continue to grow approaching the physical limits of single-mode fiber, the goal of high capacity without substantially increasing power consumption is a significant challenge.
In long haul systems, where digital coherent solutions prevail, the improvement of spectral efficiency is mainly hindered by the nonlinear effects attributed to the Kerr effect. In intensity modulation/direct detection (IM/DD) systems the main degradation comes from power fading, caused by chromatic dispersion, bandwidth limitations and transceiver nonlinearities.
The evolution of machine learning algorithms and deep learning techniques makes it possible to apply them to state-of-the-art digital processors in order to efficiently solve complex nonlinear problems. Hence, machine learning becomes a significant candidate for deal with nonlinear transmission impairments in optical fibers.
The main results of this thesis were the treatment of optical fiber nonlinearities through the application of recurrent neural networks (RNN) and the emulation of photonic systems using machine learning algorithms.
The use of bidirectional RNNs brings about the significant improvement of the performance of high-speed optical communication systems. The thesis was based on analyses, simulations and experiments carried out in various application scenarios, both in long haul networks (>1000 km) using a coherent receiver and in short reach optical networks (< 120 km) based on IM/DD systems.
The most important topics analyzed during the preparation of this thesis are the following:
• The use of a Long Short Term Memory Neural Network (LSTM) to compensate for optical fiber nonlinearity in digital coherent systems was presented for the first time. Numerical simulations of C-band and O-band transmission systems for single channel and multi-channel 16-QAM modulation format with polarization multiplexing were performed. The effect of the number of hidden units and the length of the word of symbols were analyzed in detail. The performance and operating limits were extensively studied while the robustness of the proposed equalizer in various scenarios of channel variability was highlighted. The simulations proved that LSTM-type neural networks can be very efficient as digital processors, providing superior performance and at the same time are less complex compared to Digital Back Propagation (DBP) equalizers, especially in the long-distance multi-channel scenario ( > 1000 km).
• The complexity and performance of processing units for the removal of non-linear effects were studied. The dominant types of RNN, bi-LSTM, bi-GRU and bi-Vanilla-RNN were compared in terms of complexity and performance, and it was shown that all have the potential to achieve nonlinear compensation especially in digital coherent systems with no in-line dispersion compensation, which carry 16 and 32 QAM modulation signals, with polarization multiplexing, single or multi-channel. Simulations show that the three models provide similar compensation performance, so in real systems, the simpler scheme based on the Vanilla-RNN model should be preferred. The many-to-many approach was proposed as a particularly efficient method of minimizing complexity. A comparison with non-linear Volterra-type equalizers was performed and the superiority of Vanilla-RNN was demonstrated in terms of both performance and complexity.
• Based on an experimental 4 × 50-Gb/s IM/DD O-band CWDM system, the significantly better BER performance was demonstrated of the Vanilla-RNN scheme versus the conventional decision feedback equalizer (DFE) for OOK and PAM4 configurations. The ability of the Vanilla-RNN equalizer to compensate for both linear and non-linear impairments induced by the transmitter and single-mode fiber was demonstrated. As a result, optical transmission of up to 100 km and 75 km for the OOK and PΑM4 modulation formats respectively can be realized. Furthermore, through comparison with other equalization schemes including the linear equalizer, the 3rd-order Volterra equalizer and the Volterra+DFE, it was shown that the Vanilla-RNN equalizer achieves the best performance.
• Multi-channel equalization of WDM channels was proposed and implemented in order to compensate for the non-linear effects between channels by suitably modifying the bi-RNN processors of the previous works. The equalizer used the multi-input multi-output (MIMO) processing architecture to decode the WDM channels. In this way, it exploited useful information from neighboring channels to better identify and remove inter-channel crosstalk. It was demonstrated through extensive numerical simulations and experimental results that the proposed approach outperformed both standard multi-channel equalization in the form of adaptive equalizers, DBP-type equalizers, and single-channel bi-RNN.
• The previous RNN structures were used to emulate the dynamic behavior of a real-life 106.25 Gb/s PAM4 optical transmission system based on a vertical cavity surface-emitting laser (VCSEL). It was shown that RNN networks are capable of reproducing the dynamic characteristics of the optical system with a prediction accuracy approaching 100%. Finally, the ability to emulate functional areas of the system in which the neural network has not been trained was studied.