Klasyfikacja przyszłej przychodowości klienta usługi pożyczkowej - przegląd rozwiązań

Repozytorium PJATK
→
Wydział Informatyki / Faculty of Information Technology
→
Praca magisterska - Data Science 2021
→
Zobacz pozycję

dc.contributor.author	Stocki, Michał
dc.date.accessioned	2023-01-02T10:42:35Z
dc.date.available	2023-01-02T10:42:35Z
dc.date.issued	2023-01-02
dc.identifier.issn	2021/M/DS/24
dc.identifier.uri	https://repin.pjwstk.edu.pl/xmlui/handle/186319/2062
dc.description.abstract	Głównym celem pracy było porównanie algorytmów uczenia maszynowego w poszukiwaniu optymalnego narzędzia do predykcji przychodowości poszczególnych klientów polskiej firmy pożyczkowej. Wykorzystano dane dotyczące klientów firmy w momencie wnioskowania przez nich o pierwszą pożyczkę w latach 2018-2020, wraz z informacją o ich zmierzonej przychodowości na koniec tego okresu. W tym celu stworzone i porównane zostały cztery modele uczenia maszynowego - naiwny model bayesowski, model wzmocnionych drzew XGBoost, głęboka sieć neuronowa powstała z wykorzystaniem pakietu scikit-learn i głęboka sieć powstała przy użyciu biblioteki Keras. Takie porównanie pozwoliło na wybranie optymalnego modelu, dającego najlepsze rezultaty przy klasyfikacji do jednej z czterech grup. Praca składa się z trzech części. W pierwszej z nich przedstawiono bieżący stan badań nad wartością klienta w czasie w branży finansowej ze szczególnym naciskiem na metody uczenia maszynowego zastosowane w badaniach. Następnie opisano podstawowe pojęcia dotyczące wartości klienta w czasie oraz przedstawiono charakterystykę każdego z wykorzystanych modeli. Część pierwsza kończy się opisem macierzy pomyłek i metryk wynikających z niej, jako narzędzi służących do oceny i porównania modeli klasyfikacyjnych. Druga część pracy poświęcona jest analizie rezultatów modeli stworzonych przy użyciu języka Python. Każdemu z modeli poświęcony jest kolejny podrozdział. Opis każdego z modeli zawiera przedstawienie procesu tworzenia wariantu bazowego, a następnie przeprowadzonej optymalizacji. Przedstawione zostały również metryki oceny modeli zarówno dla wersji przed, jak i po optymalizacji. Ostatnia, trzecia część pracy poświęcona jest syntezie wyników modeli, podsumowaniu różnic i podobieństw w wynikach oraz wybraniu modelu dającego najlepsze rezultaty w przeprowadzonym porównaniu. Wskazane zostały dalsze kroki w celu produkcyjnego wdrożenia modelu w przedsiębiorstwie, a także trudności możliwe do napotkania podczas wdrożenia. Na końcu nakreślone zostały potencjalne kierunki dalszego rozwoju badania.	pl_PL
dc.language.iso	other	pl_PL
dc.relation.ispartofseries	;Nr 6321
dc.subject	uczenie maszynowe	pl_PL
dc.subject	wartość klienta w czasie (CLV)	pl_PL
dc.subject	klasyfikacja wieloklasowa	pl_PL
dc.subject	naiwny model Bayesa	pl_PL
dc.subject	XGBoost	pl_PL
dc.subject	głębokie sieci neuronowe	pl_PL
dc.subject	ML w branży finansowej	pl_PL
dc.title	Klasyfikacja przyszłej przychodowości klienta usługi pożyczkowej - przegląd rozwiązań	pl_PL
dc.type	Thesis	pl_PL