Evolutionary Ensemble Classification
Μεταπτυχιακή διπλωματική εργασία
Συγγραφέας
Mema, Gerald
Ημερομηνία
2021-11-23Λέξεις κλειδιά
Evolutionary Classification ; Evolutionary Learning ; Genetic Algorithms ; Ensemble ; Feature SelectionΠερίληψη
During the last decades, in the area of machine learning and data mining, the development of
ensemble methods has gained significant attention from the scientific community. Machine
learning ensemble methods combine multiple learning algorithms to obtain better predictive performance than could be obtained from any of the constituent learning algorithms alone. One of the
most challenging tasks in ensemble models is to create classifiers that are accurate and diverse. This
optimization problem can be addressed by using evolutionary learning algorithms. In this thesis, we
have developed an Evolutionary Ensemble Classification (EVENC) algorithm which approaches the
ensemble construction by evolving a population of accurate and diverse classifiers. The EVENC was
evaluated on over 100 classification datasets and compared with the most popular ensemble models,
such as Random Forest, Gradient Boosting, and XGBoost. The experiments show that our model
outperforms competing models in some datasets.
Περίληψη
Τις τελευταίες δεκαετίες, στον τομέα της μηχανικής μάθησης και της εξόρυξης δεδομένων, η
ανάπτυξη συνδυαστικών μεθόδων έχει κερδίσει σημαντική προσοχή από την επιστημονική κοινότητα. Τα συνδυαστικά μοντέλα μηχανικής μάθησης συνδυάζουν πολλαπλούς αλγορίθμους μάθησης
για να επιτύχουν καλύτερη προβλεψη από αυτή που θα είχε ένα μοντέλο που απαρτίζεται από έναν αλγόριθμο μάθησης. ΄Ενα από τα πιο δύσκολα προβλήματα στα συνδυαστικα μοντέλα είναι η δημιουργία
ταξινομητών που είναι ακριβείς και διαφορετικοί μεταξύ τους. Αυτό το πρόβλημα βελτιστοποίησης μπορεί
να αντιμετωπιστεί με τη χρήση εξελικτικών αλγορίθμων μάθησης. Στην παρούσα διατριβή αναπτύξαμε ένα μοντελο (EVENC), το οποίο προσεγγίζει την κατασκευή του τελικού συνδυαστικού μοντέλου
εξελίσσοντας έναν πληθυσμό απο ακριβείς και διαφορετικούς μεταξύ τους ταξινομητές. Το EVENC
αξιολογήθηκε σε πάνω από 100 σύνολα δεδομένων ταξινόμησης και συγκρίθηκε με κάποια απο τα πιο
δημοφιλή συνδυαστικά μοντέλα, όπως τα Τυχαία Δάση, η Βελτιστοποίηση Συναρτήσεων και η Ραγδαία
Βελτιστοποίηση Συναρτήσεων. Τα πειράματα δείχνουν ότι το μοντέλο μας υπερέχει σε ορισμένα σύνολα
δεδομένων που έχουν συγκεκριμένα χαρακτηριστικά, σε σύγκριση με τα άλλα σύγχρονα συνδυαστικα
μοντέλα.