Πρόβλεψη αποτελέσματος σε ποδοσφαιρικούς αγώνες με τη χρήση μοντέλων παλινδρόμησης
Predicting final result of football match using regression models
Μεταπτυχιακή διπλωματική εργασία
Συγγραφέας
Γεωργακόπουλος, Σωτήριος
Ημερομηνία
2022-10Επιβλέπων
Γιακουμάτος, ΣτέφανοςΘεματική επικεφαλίδα
Πρόβλεψη ; ΠοδόσφαιροΛέξεις κλειδιά
Μοντέλα ; Παλινδρόμηση ; Κατανομή ; Πρόβλεψη ; Ποδόσφαιρο ; Models ; Regression ; Distribution ; Predict ; FootballΠερίληψη
Η παρούσα διπλωματική εργασία πραγματεύεται την επεξεργασία δεδομένων από αθλητικούς αγώνες ποδοσφαίρου. Τα δεδομένα υποβάλλονται σε στατιστική επεξεργασία, μέσω κατάλληλων στατιστικών μεθόδων. Τα μοντέλα που χρησιμοποιούνται σε όλη την έκταση της εργασίας είναι μοντέλα παλινδρόμησης, ενώ δίνεται έμφαση στις κατανομές Poisson και αρνητική διωνυμική. Τα μοντέλα παλινδρόμησης μοντελοποιούν την τιμή μιας μεταβλητής η οποία εξαρτάται από ένα σύνολο άλλων μεταβλητών, ενώ στοχεύουν να βρουν με ακρίβεια την τάση των δεδομένων και να κάνουν προβλέψεις από παλαιότερα δεδομένα.
Τα δεδομένα που αναλύονται αφορούν το τελικό αποτέλεσμα αγώνων ποδοσφαίρου, δηλαδή πόσα γκολ σημείωσαν οι αντίπαλες ομάδες. Τα αποτελέσματα της μοντελοποίησης παρουσιάζονται μέσα από γραφήματα και κατάλληλα λογισμικά στατιστικά πακέτα. Από την στατιστική μοντελοποίηση των δεδομένων και την ερμηνεία των αποτελεσμάτων επιδιώκεται η πρόβλεψη του τελικού αποτελέσματος σε ένα αγώνα ποδοσφαίρου. Παράλληλα αναδεικνύεται μια ενιαία θεωρητική και εννοιολογική δομή για μοντελοποίηση στη στατιστική, ώστε ο αναγνώστης να κατανοήσει περισσότερο τις στατιστικές τεχνικές που χρησιμοποιούνται στην ανάλυση δεδομένων και να αποκομίσει τις περισσότερες δυνατές πληροφορίες.
Περίληψη
This master thesis deals with athlete data processing of football matches. The data shall be submitted to processing through appropriate statistical methods. The models used in this thesis are regression models and the accent is given on Poisson and negative binomial distributions. Regression models model the value of a variable, which depends on other variables, while the models target is to find accurately the data trend and make predictions from older data.
The data analyzed in the paper are related to the final football score, that is how many goals scored by the opponents teams. The results of modeling are presented through graphs and appropriate statistical software packages. The aim is to provide α prediction for the final result of a football match from the statistical data modeling and the interpretation of results. Furthermore a unified theoretical structure is emerging, for modeling in statistics, so the reader understands more the statistical techniques that been used in data analysis and derive as much information as possible.