Συλλογή δεδομένων ήχου, εκπαίδευση και εφαρμογή μοντέλου μηχανικής μάθησης σε περιβάλλον υποβοηθούμενης διαβίωσης.

Loading...
Thumbnail Image

Journal Title

Journal ISSN

Volume Title

Publisher

Πανεπιστήμιο Πελοποννήσου

Abstract

Η παρούσα διπλωματική εργασία παρουσιάζει τον σχεδιασμό, την υλοποίηση και την αξιολόγηση ενός χαμηλού κόστους ενσωματωμένου συστήματος αναγνώρισης λέξεων-κλειδιών στην ελληνική γλώσσα, με στόχο την ανίχνευση των λέξεων «βοήθεια» και «πονάω». Το σύστημα υλοποιήθηκε με χρήση του μικροελεγκτή ESP32-S3 και του MEMS μικροφώνου INMP441, σε συνδυασμό με την πλατφόρμα Edge Impulse για τη διαχείριση δεδομένων, την εξαγωγή χαρακτηριστικών και την εκπαίδευση νευρωνικών δικτύων. Η συλλογή δεδομένων πραγματοποιήθηκε σε ποικίλες συνθήκες, τα δείγματα επεξεργάστηκαν με συντελεστές MFCC και χρησιμοποιήθηκαν για την εκπαίδευση συνελικτικών νευρωνικών δικτύων βελτιστοποιημένων για την εκτέλεση στο TensorFlow Lite for Microcontrollers. Το καλύτερο μοντέλο πέτυχε ακρίβεια επικύρωσης 98% και διατήρησε μέση απόδοση περίπου 90% σε πραγματικές θορυβώδεις συνθήκες. Η πειραματική αξιολόγηση ανέδειξε την αξιοπιστία του συστήματος σε πραγματικό χρόνο, επιδεικνύοντας ικανοποιητική δεδομένων των συνθηκών και του εξοπλισμού ανθεκτικότητα απέναντι σε θόρυβο, την πολυφωνία και παραλλαγές ομιλίας (ψίθυρος, φωνή). Σημαντικό χαρακτηριστικό του προτεινόμενου συστήματος αποτελεί η προσιτή τιμή και η ευκολία εγκατάστασης, με συνολικό κόστος υλικού μόλις ~20 €, καθιστώντας το προσβάσιμο για πιλοτικές ή ευρείας κλίμακας εφαρμογές στον τομέα της υγείας και της υποβοηθούμενης διαβίωσης. Τα αποτελέσματα καταδεικνύουν τη δυναμική των συστημάτων TinyML για αναγνώριση φωνής, ως οικονομικά αποδοτικών εργαλείων με άμεσο κοινωνικό αντίκτυπο.

Description

Keywords

Citation

Endorsement

Review

Supplemented By

Referenced By