Εξαγωγή πληροφοριών από αγγελίες εργασίας με χρήση εργαλείων από διαλογικά συστήματα τεχνητής νοημοσύνης
Μεταπτυχιακή διπλωματική εργασία
Συγγραφέας
Σιώζιου, Κυριακή
Ημερομηνία
2024-06Επιβλέπων
Τζήμας, ΙωάννηςΛέξεις κλειδιά
Μεγάλα Γλωσσικά Μοντέλα, Επεξεργασία Φυσικής Γλώσσας, Ανάλυση αγοράς εργασίας, Εξαγωγή Πληροφορίας, Διαδικτυακά δεδομέναΠερίληψη
Σιώζιου Κυριακή, Πανεπιστήμιο Πελοποννήσου, Τμ. ΗΜΜΥ vi
Περίληψη
Η πρόσφατη πρόοδος στα Μεγάλα Γλωσσικά Μοντέλα έχει ανοίξει νέες δυνατότητες για την χρήση τους σε διάφορους τομείς. Αυτή η εργασία επικεντρώνεται στη διερεύνηση των δυνατοτήτων των LLM στη δομημένη εξαγωγή πληροφοριών από αδόμητο κείμενο, ειδικά αναφορικά με τις αγγελίες θέσεων εργασίας. Συγκρίνουμε εμπορικά και ανοιχτού κώδικα Μεγάλα Γλωσσικά Μοντέλα για να δούμε πόσο καλά μπορούν να αντλήσουν βασικές πληροφορίες από ένα σύνολο αγγελιών εργασίας από τον τουριστικό τομέα της Ελλάδας. Στόχος μας είναι να κατανοήσουμε τις διαφορές απόδοσης μεταξύ αυτών των μοντέλων και να αξιολογήσουμε τη γενική τους εφαρμογή σε εργασίες εξαγωγής πληροφοριών πραγματικού κόσμου. Επιδιώκουμε να αξιολογήσουμε και να συγκρίνουμε την ικανότητα αυτών των μοντέλων στον ακριβή εντοπισμό και την εξαγωγή συγκεκριμένων σημείων δεδομένων όπως ο τίτλος εργασίας, η εταιρεία, η βιομηχανία, η τοποθεσία, οι δεξιότητες και οι δεξιότητες. Απώτερος στόχος είναι η εργασία αυτή να συμβάλλει στην κατανόησή μας για το πόσο αποτελεσματικά είναι τα LLM σε εργασίες εξαγωγής πληροφοριών στον πραγματικό κόσμο και να υπογραμμίσει τις διαφορές στην απόδοση μεταξύ διαφόρων μοντέλων τελευταίας τεχνολογίας.
Περίληψη
The recent progress in Large Language Models has opened up new possibilities for their application in different domains. This work focuses on exploring the potential of LLMs in structured information extraction, specifically in the context of job postings. We compare commercial and open-source LLMs to see how well they can extract key information from job postings in Greece's tourism sector. Our goal is to understand the performance differences between these models and assess their general applicability in real-world information extraction tasks. We aim to evaluate and compare the capability of these models in accurately identifying and extracting specific data points such as Job Title, Company, Industry, Location, Soft Skills, and Hard Skills. This research contributes to our understanding of how practical LLMs are in real-world information extraction tasks and highlights the differences in performance among various state-of-the-art models.