Εμφάνιση απλής εγγραφής

Deep Metric Learning for Music Information Retrieval

dc.contributor.advisorΓιαννακόπουλος, Θεόδωρος
dc.contributor.authorΜουχάκης, Βασίλειος
dc.date.accessioned2024-08-27T10:55:41Z
dc.date.available2024-08-27T10:55:41Z
dc.date.issued2023-10-18
dc.identifier.urihttps://amitos.library.uop.gr/xmlui/handle/123456789/8189
dc.identifier.urihttp://dx.doi.org/10.26263/amitos-1691
dc.descriptionΜ.Δ.Ε. 94el
dc.description.abstractThis master thesis explores the application of Deep Metric Learning (DML) for creating effective audio representations in tasks like audio classification, music retrieval, and speech recognition. DML uses deep neural networks to learn hierarchical representations from raw audio waveforms, capturing intricate relationships between audio samples. The thesis evaluates different deep neural network architectures and loss functions, including triplet loss and contrastive loss. The models are tested using various distance metrics and normalization techniques. The research aims to enhance our understanding of DML for audio representations and its potential applications. The findings contribute valuable insights to guide the design of powerful audio representations for diverse audio-related tasks.el
dc.format.extentσελ. 58el
dc.language.isoenel
dc.publisherΠανεπιστήμιο Πελοποννήσουel
dc.rightsΑναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/gr/*
dc.titleDeep Metric Learning for Music Information Retrievalel
dc.title.alternativeDeep Metric Learning για Ανάκτηση Μουσικών Πληροφοριώνel
dc.typeΜεταπτυχιακή διπλωματική εργασίαel
dc.contributor.departmentΤμήμα Πληροφορικής και Τηλεπικοινωνιώνel
dc.contributor.facultyΣχολή Οικονομίας και Τεχνολογίαςel
dc.contributor.masterΕπιστήμη Δεδομένωνel
dc.description.abstracttranslatedΑυτή η μεταπτυχιακή διατριβή διερευνά την εφαρμογή της Deep Metric Learning (DML) για τη δημιουργία αποτελεσματικών αναπαραστάσεις ήχου σε εργασίες όπως η ταξινόμηση ήχου, η ανάκτηση μουσικής και η αναγνώριση ομιλίας. Η DML χρησιμοποιεί βαθιά νευρωνικά δίκτυα για να μάθει ιεραρχικές αναπαραστάσεις από ακατέργαστες κυματομορφές ήχου, καταγράφοντας περίπλοκες σχέσεις μεταξύ δειγμάτων ήχου. Η διατριβή αξιολογεί διαφορετικά βαθιά Αρχιτεκτονικές νευρωνικών δικτύων και συναρτήσεις απώλειας, συμπεριλαμβανομένης της απώλειας τριπλής και της απώλειας αντίθεσης. ο Τα μοντέλα ελέγχονται χρησιμοποιώντας διάφορες μετρήσεις απόστασης και τεχνικές κανονικοποίησης. Η έρευνα στοχεύει να βελτιώσει την κατανόησή μας για το DML για αναπαραστάσεις ήχου και τις δυνατότητές του εφαρμογές. Τα ευρήματα συνεισφέρουν πολύτιμες πληροφορίες για να καθοδηγήσουν τη σχεδίαση ισχυρού ήχου αναπαραστάσεις για διάφορες εργασίες που σχετίζονται με τον ήχο.el


Αρχεία σε αυτό το τεκμήριο

Thumbnail

Αυτό το τεκμήριο εμφανίζεται στις ακόλουθες συλλογές

Εμφάνιση απλής εγγραφής

Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα
Εκτός από όπου επισημαίνεται κάτι διαφορετικό, το τεκμήριο διανέμεται με την ακόλουθη άδεια:
Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα