Implementation of machine learning algorithms for the classification of online customer support tickets
Μεταπτυχιακή διπλωματική εργασία
Συγγραφέας
Καστελιανού, Ολυμπία
Ημερομηνία
2024-09-30Επιβλέπων
Γιαννακόπουλος, ΘεόδωροςΘεματική επικεφαλίδα
Machine Learning ; Μηχανική Μάθηση ; Consumer services ; Υπηρεσίες πελατώνΛέξεις κλειδιά
NLPΠερίληψη
This master thesis presents a study on the use of machine learning techniques for the
classification of customer support tickets. The objective is to develop a model that can
accurately classify support tickets into predefined categories, based on the summary of
the messages.
The study begins with a thorough literature review on the existing methods and techniques
for support ticket classification, including text preprocessing, feature extraction,
and machine learning algorithms. Based on the literature review, a methodology is proposed,
which includes data collection, preprocessing, feature extraction, model training,
and evaluation.
The proposed methodology is applied to a dataset of support tickets collected from
a real-world customer support system. The dataset is preprocessed and labeled, and
several feature extraction techniques are applied, including word embeddings and bag-ofwords
representations. A variety of machine learning algorithms are evaluated, including
logistic regression, decision trees, and convolutional neural networks.
Experimental results show that the best performing model is a Logistic Regression
model, which achieves a F1 score of 0.69. In contrast, GaussianNB and the second Neural
Network implementation were less effective, highlighting the importance of selecting and
fine-tuning models based on the specific needs of the task at hand.
The proposed methodology and the experimental results demonstrate the feasibility
and effectiveness of using machine learning techniques for support ticket classification.
The developed model can assist customer support teams in efficiently managing and
resolving customer issues, leading to improved customer satisfaction and reduced operational
costs.
Overall, this master thesis contributes to the field of natural language processing
and machine learning, and provides insights and recommendations for future research on
support ticket classification.
Περίληψη
Η παρούσα διατριβή μελετά τη χρήση τεχνικών μηχανικής μάθησης για την κατηγοριοποίηση
των αιτημάτων υποστήριξης πελατών. Στόχος είναι να αναπτυχθεί ένα μοντέλο που μπορεί
να κατηγοριοποιεί ακριβώς τα αιτήματα υποστήριξης σε προκαθορισμένες κατηγορίες, βασι-
ζόμενο στην περίληψη των μηνυμάτων.
Η μελέτη ξεκινά με μια λεπτομερή ανασκόπηση της βιβλιογραφίας για τις υπάρχουσες
μεθόδους και τεχνικές για την κατηγοριοποίηση αιτημάτων υποστήριξης, συμπεριλαμβανο-
μένης της προ-επεξεργασίας κειμένου, της εξαγωγής χαρακτηριστικών και των αλγορίθμων
μηχανικής μάθησης. Βασιζόμενο στην ανασκόπηση της βιβλιογραφίας, προτείνεται μια με-
θοδολογία, η οποία περιλαμβάνει συλλογή δεδομένων, προ-επεξεργασία, εξαγωγή χαρακτη-
ριστικών, εκπαίδευση μοντέλου και αξιολόγηση.
Η προτεινόμενη μεθοδολογία εφαρμόζεται σε ένα σύνολο δεδομένων αιτημάτων υπο-
στήριξης που συλλέγονται από ένα πραγματικό σύστημα υποστήριξης πελατών. Τα δεδομένα
προ-επεξεργάζονται και επισημαίνονται, και εφαρμόζονται διάφορες τεχνικές εξαγωγής χαρα-
κτηριστικών, συμπεριλαμβανομένων των ενσωματωμένων λέξεων και των αναπαραστάσεων
bag-of-words. Αξιολογούνται διάφοροι αλγόριθμοι μηχανικής μάθησης, όπως η λογιστική
παλινδρόμηση, οι δέντρα απόφασης και νευρωνιά δίκτυα.
Τα πειραματικά αποτελέσματα δείχνουν ότι το καλύτερο αποτέλεσμα παράγει ένα μοντέλο
λογιστικής παλινδρόμησης, το οποίο επιτυγχάνει F1 score 0.69 στο σύνολο ελέγχου. Α-
ντιθέτως, τα μοντέλα GaussianNB και η δεύτερη υλοποίηση του Νευρωνικού Δικτύου ήταν
λιγότερο αποτελεσματικά, υπογραμμίζοντας τη σημασία της επιλογής και της βελτιστοποίη-
σης των μοντέλων με βάση τις συγκεκριμένες ανάγκες του εκάστοτε έργου.
Η προτεινόμενη μεθοδολογία και τα πειραματικά αποτελέσματα δείχνουν την εφικτότητα
και αποτελεσματικότητα της χρήσης τεχνικών μηχανικής μάθησης για την κατηγοριοποίηση
εισερχόμενων εισιτηρίων υποστήριξης.
Συνολικά, αυτή η διπλωματική εργασία συνεισφέρει στο πεδίο της επεξεργασίας φυσικής
γλώσσας και της μηχανικής μάθησης, και παρέχει εισηγήσεις και προτάσεις για μελλοντικές
έρευνες στην κατηγοριοποίηση εισερχόμενων εισιτηρίων υποστήριξης.