A Deep Learning approach for modeling the spatial distribution of contaminants in the Black Sea
Μεταπτυχιακή διπλωματική εργασία
Συγγραφέας
Alygizakis, Nikiforos
Ημερομηνία
2022-05-04Επιβλέπων
Giannakopoulos, TheodorosΛέξεις κλειδιά
deep learning ; convolutional neural network ; Black Sea ; non-target screening ; contaminants of emerging concern ; spatial distribution prioritization ; modeling spatial distribution ; source identificationΠερίληψη
Black Sea (BS) is an important ecosystem, which is affected by various anthropogenic pressures, such as shipping activities, wastewater inputs from large coastal cities and most importantly loads by major rivers (e.g., Danube, Dniester, Dnieper). The chemical pollution that rivers transfer to the BS is significant considering that the Danube river alone discharges 6550 m3/s to the BS. This study focuses on the Ukrainian shelf (the northwestern part of the Black Sea) and investigates the river sources of chemicals in the shelf. To achieve this objective, data generated by the Joint Black Sea Surveys (JBSS) was used. JBSS took place in 2016 and 2017 in context of the EU/UNDP EMBLAS II project (www.emblasproject.org). During the JBSS campaign, seawater samples were collected, extracted and analyzed by highthroughput analytical methods such as liquid chromatography high-resolution mass spectrometry (LC-HRMS). The analysis resulted in data, which was processed using open-source algorithms to generate a dataset with the detected chemical signals and their intensity in the sampling stations. The dataset was used to generate images, representing the spatial distribution of the signals. The figures were then used as an input to a deep learning convolutional neural network classification model. The aim of the study was to create an end-to-end solution for the estimation of the pollution potential of the major contributing rivers (Dnieper and Danube) in the Ukrainian shelf. Finally, a dashboard to facilitate data visualization and results’ evaluation was built. The generation of such models can also serve to the prioritization of unknown chemical signals, which is the key for non-target screening.
Περίληψη
Η Μαύρη Θάλασσα είναι ένα σημαντικό οικοσύστημα, το οποίο επηρεάζεται από διάφορες ανθρωπογενείς πιέσεις, όπως ναυτιλιακές δραστηριότητες, εισροές λυμάτων από μεγάλες παράκτιες πόλεις και κυρίως φορτία από μεγάλα ποτάμια (π.χ. Δούναβης, Δνείστερος, Δνείπερος). Η χημική ρύπανση που μεταφέρουν τα ποτάμια στη Μαύρη Θάλασσα είναι σημαντική, δεδομένου ότι μόνο ο ποταμός Δούναβης απορρίπτει 6550 m3/s. Αυτή η μελέτη εστιάζει στην ουκρανική υφαλοκρηπίδα (το βορειοδυτικό τμήμα της Μαύρης Θάλασσας) και διερευνά τις πηγές χημικών ουσιών απο τα ποτάμια. Για την επίτευξη αυτού του στόχου, χρησιμοποιήθηκαν δεδομένα απο δείγματα που συλλέχθηκαν από τις κοινές έρευνες της Μαύρης Θάλασσας (ΚΕΜΘ). Οι ΚΕΜΘ πραγματοποιήθηκαν το 2016 και 2017 στο πλαίσιο του έργου EU / UNDP EMBLAS II (www.emblasproject.org). Κατά τη διάρκεια της εκστρατείας ΚΕΜΘ, συλλέχθηκαν δείγματα θαλασσινού νερού, τα οποία εκχυλίστηκαν και αναλύθηκαν με αναλυτικές μεθόδους υψηλής απόδοσης, όπως υγρή χρωματογραφία φασματομετρία μάζας υψηλής διακριτικής ικανότητας. Η χημική ανάλυση δημιούργησε δεδομένα τύπου XML, τα οποία υποβλήθηκαν σε επεξεργασία χρησιμοποιώντας αλγόριθμους ανοιχτού κώδικα. Το αποτέλεσμα της επεξεργασίας ήταν η δημιουργία ενός σετ δεδομένων με τα ανιχνευμένα χημικά σήματα και την έντασή τους στους σταθμούς δειγματοληψίας. Το σετ δεδομένων χρησιμοποιήθηκε για τη δημιουργία εικόνων, που αντιπροσωπεύουν τη χωρική κατανομή των σημάτων. Οι εικόνες στη συνέχεια χρησιμοποιήθηκαν ως είσοδος σε ένα μοντέλο ταξινόμησης συνελικτικών νευρωνικών δικτύων βαθιάς μάθησης. Στόχος της μελέτης ήταν να δημιουργηθεί μια ολοκληρωμένη υπολογιστική διαδικασία για την εκτίμηση του δυναμικού ρύπανσης των σημαντικότερων ποταμών που συμβάλλουν (Δνείπερος και Δούναβης) στη θάλασσα της Ουκρανίας. Τέλος, κατασκευάστηκε μια ιστοσελίδα για τη διευκόλυνση της οπτικοποίησης και της αξιολόγησης των αποτελεσμάτων. Η δημιουργία τέτοιων μοντέλων μπορεί επίσης να χρησιμεύσει για την ιεράρχηση άγνωστων σημάτων, που είναι το κλειδί για την επίτευξη της λεγόμενης μη στοχευμένης ανάλυσης.