Streszczenie:
Głównym celem pracy było porównanie algorytmów uczenia maszynowego w poszukiwaniu optymalnego narzędzia do predykcji przychodowości poszczególnych klientów polskiej firmy pożyczkowej. Wykorzystano dane dotyczące klientów firmy w momencie wnioskowania przez nich o pierwszą pożyczkę w latach 2018-2020, wraz z informacją o ich zmierzonej przychodowości na koniec tego okresu. W tym celu stworzone i porównane zostały cztery modele uczenia maszynowego - naiwny model bayesowski, model wzmocnionych drzew XGBoost, głęboka sieć neuronowa powstała z wykorzystaniem pakietu scikit-learn i głęboka sieć powstała przy użyciu biblioteki Keras. Takie porównanie pozwoliło na wybranie optymalnego modelu, dającego najlepsze rezultaty przy klasyfikacji do jednej z czterech grup.
Praca składa się z trzech części. W pierwszej z nich przedstawiono bieżący stan badań nad wartością klienta w czasie w branży finansowej ze szczególnym naciskiem na metody uczenia maszynowego zastosowane w badaniach. Następnie opisano podstawowe pojęcia dotyczące wartości klienta w czasie oraz przedstawiono charakterystykę każdego z wykorzystanych modeli. Część pierwsza kończy się opisem macierzy pomyłek i metryk wynikających z niej, jako narzędzi służących do oceny i porównania modeli klasyfikacyjnych.
Druga część pracy poświęcona jest analizie rezultatów modeli stworzonych przy użyciu języka Python. Każdemu z modeli poświęcony jest kolejny podrozdział. Opis każdego z modeli zawiera przedstawienie procesu tworzenia wariantu bazowego, a następnie przeprowadzonej optymalizacji. Przedstawione zostały również metryki oceny modeli zarówno dla wersji przed, jak i po optymalizacji.
Ostatnia, trzecia część pracy poświęcona jest syntezie wyników modeli, podsumowaniu różnic i podobieństw w wynikach oraz wybraniu modelu dającego najlepsze rezultaty w przeprowadzonym porównaniu. Wskazane zostały dalsze kroki w celu produkcyjnego wdrożenia modelu w przedsiębiorstwie, a także trudności możliwe do napotkania podczas wdrożenia. Na końcu nakreślone zostały potencjalne kierunki dalszego rozwoju badania.