Ποσοτικοποίηση Αβεβαιότητας μέσω Νευρωνικών Δικτύων: η μέθοδος PI3NN για Μη-Διασταυρούμενα Διαστήματα Πρόβλεψης

Πλιάγκας, Γεώργιος

Ποσοτικοποίηση Αβεβαιότητας μέσω Νευρωνικών Δικτύων: η μέθοδος PI3NN για Μη-Διασταυρούμενα Διαστήματα Πρόβλεψης

Files

Pliagkas_19133.pdf (1.08 MB)

Date

2025-12

Authors

Πλιάγκας, Γεώργιος

Publisher

Πανεπιστήμιο Πελοποννήσου

Abstract

Στην παρούσα εργασία εξετάζεται ένα θέμα που εμφανίζεται συχνά στη σύγχρονη εφαρμοσμένη επιστήμη δεδομένων: η μοντελοποίηση με νευρωνικά δίκτυα συνήθως παράγει μια μόνο αριθμητική έξοδο, αφήνοντας τον χρήστη να αγνοεί πόσο αξιόπιστη είναι πραγματικά αυτή η τιμή. Σε τομείς όπου τα σφάλματα πρόβλεψης συνεπάγονται λειτουργικό ή οικονομικό κίνδυνο, η ποσοτικοποίηση της αβεβαιότητας γίνεται απαραίτητη. Η προσέγγιση μέσω διαστημάτων πρόβλεψης δίνει μια άμεση ερμηνεία, αλλά οι συνήθεις τεχνικές, οι οποίες βασίζονται σε εκτιμήσεις ποσοστημορίων, οδηγούν συχνά σε διασταύρωση των ορίων. Έτσι, σε αρκετές περιπτώσεις, το κατώτερο όριο εμφανίζεται υψηλότερο από το ανώτερο, κάτι που καθιστά το αποτέλεσμα άκυρο και πρακτικά μη εφαρμόσιμο. Η μεθοδολογία PI3NN (Prediction Intervals from Three Neural Networks) που μελετάμε αποφεύγει το παραπάνω αδιέξοδο. Η λογική της στηρίζεται στην εκπαίδευση τριών δικτύων, όπου το πρώτο εκτιμά τη μέση τιμή και τα δύο υπόλοιπα περιγράφουν την απόκλιση εκατέρωθεν αυτής. Και τα τρία εκπαιδεύονται με την τυπική ελαχιστοποίηση του μέσου τετραγωνικού σφάλματος (MSE). Το επίπεδο εμπιστοσύνης δεν κωδικοποιείται στη συνάρτηση απώλειας, αλλά οι παράμετροι κλιμάκωσης υπολογίζονται εκ των υστέρων μέσω διαδικασιών εύρεσης ρίζα (bisection), διασφαλίζοντας ότι επιτυγχάνεται η απαιτούμενη πιθανότητα κάλυψης. Ένα βασικό αποτέλεσμα είναι ότι τα παραγόμενα διαστήματα είναι μαθηματικά εγγυημένα ότι τα παραγόμενα διαστήματα είναι αυστηρά μη-διασταυρούμενα. Πιο συγκεκριμένα, αν γ1< γ2, τότε το διάστημα που σχετίζεται με το γ1 είναι κατάλληλα φωλιασμένο μέσα σε αυτό που αντιστοιχεί στο γ2. Αυτό δεν είναι εμπειρικό αποτέλεσμα, αλλά απορρέει από ιδιότητες μονοτονίας των συντελεστών κλιμάκωσης, ενισχυμένες μέσω δύο βοηθητικών λημμάτων σχετικά με την ύπαρξη και τη μοναδικότητα. Κατά συνέπεια, οι τελικές ζώνες πρόβλεψης παραμένουν λογικά συνεκτικές ακόμη και όταν ζητούνται πολλά επίπεδα εμπιστοσύνης ταυτόχρονα, κάτι που σπανίως υπάρχει σε ανάλογες προσεγγίσεις. Η πειραματική αξιολόγηση πραγματοποιήθηκε σε εννέα σύνολα δεδομένων UCI. Η PI3NN παρήγαγε διαστήματα με κάλυψη πολύ κοντά στις ονομαστικές τιμές (π.χ.γ=95%), με μικρή διακύμανση μεταξύ επαναληπτικών πειραμάτων. Επιπλέον, δεν απαιτείται επανεκπαίδευση του μοντέλου για διαφορετικά επίπεδα εμπιστοσύνης γ, γεγονός που μειώνει σημαντικά το υπολογιστικό κόστος και καθιστά τη μέθοδο κατάλληλη για περιβάλλοντα όπου η πιθανότητα εμπιστοσύνης πρέπει να αναπροσαρμόζεται δυναμικά εκ των υστέρων.