Streszczenie:
Tematem niniejszej pracy jest porównanie modeli machine learning na zbiorze zawierającym dane graczy e-sportu. Powodem, dla którego powyższe zagadnienie zostało wybrane, była zwiększająca się liczba graczy dopuszczających się oszustw w grach komputerowych. Z roku na rok coraz większa liczba ludzi decyduje się na użycie niedozwolonych programów, które zdecydowanie ułatwiają rozgrywkę. Powoduje to tym samym niechęć uczciwych zawodników do uczestnictwa w rywalizacji.
Celem tej pracy było stworzenie algorytmów, które bez ingerencji człowieka potrafiłyby rozpoznać oszukującego gracza. Zadanie nie było łatwe, gdyż nawet na podstawie statystyk trudno rozpoznać, czy gracz dopuścił się oszustwa. Udało się ostatecznie stworzyć modele, które w zadawalający sposób przewidywały przynależność do danej klasy.
W teoretycznej części pracy omówione zostały zagadnienia związane z dziedziną e-sportu w szczególności historia oraz główne dyscypliny sportów elektronicznych. Przedstawione zostały także trendy oraz czynniki warunkujące popularyzacją tej dziedziny. Następnie podane zostały statystyki dotyczące osób dopuszczających się oszustw.
W dalszej części poruszone zostały zagadnienia związane z Data Science. Omówiono także czym jest metoda machine-learning oraz świat Big Data. Następnie wytłumaczono najczęściej używane algorytmy klasyfikujące oraz regresyjne.