Repozytorium PJATK

Klasyfikacja przyszłej przychodowości klienta usługi pożyczkowej - przegląd rozwiązań

Repozytorium Centrum Otwartej Nauki

Pokaż uproszczony rekord

dc.contributor.author Stocki, Michał
dc.date.accessioned 2023-01-02T10:42:35Z
dc.date.available 2023-01-02T10:42:35Z
dc.date.issued 2023-01-02
dc.identifier.issn 2021/M/DS/24
dc.identifier.uri https://repin.pjwstk.edu.pl/xmlui/handle/186319/2062
dc.description.abstract Głównym celem pracy było porównanie algorytmów uczenia maszynowego w poszukiwaniu optymalnego narzędzia do predykcji przychodowości poszczególnych klientów polskiej firmy pożyczkowej. Wykorzystano dane dotyczące klientów firmy w momencie wnioskowania przez nich o pierwszą pożyczkę w latach 2018-2020, wraz z informacją o ich zmierzonej przychodowości na koniec tego okresu. W tym celu stworzone i porównane zostały cztery modele uczenia maszynowego - naiwny model bayesowski, model wzmocnionych drzew XGBoost, głęboka sieć neuronowa powstała z wykorzystaniem pakietu scikit-learn i głęboka sieć powstała przy użyciu biblioteki Keras. Takie porównanie pozwoliło na wybranie optymalnego modelu, dającego najlepsze rezultaty przy klasyfikacji do jednej z czterech grup. Praca składa się z trzech części. W pierwszej z nich przedstawiono bieżący stan badań nad wartością klienta w czasie w branży finansowej ze szczególnym naciskiem na metody uczenia maszynowego zastosowane w badaniach. Następnie opisano podstawowe pojęcia dotyczące wartości klienta w czasie oraz przedstawiono charakterystykę każdego z wykorzystanych modeli. Część pierwsza kończy się opisem macierzy pomyłek i metryk wynikających z niej, jako narzędzi służących do oceny i porównania modeli klasyfikacyjnych. Druga część pracy poświęcona jest analizie rezultatów modeli stworzonych przy użyciu języka Python. Każdemu z modeli poświęcony jest kolejny podrozdział. Opis każdego z modeli zawiera przedstawienie procesu tworzenia wariantu bazowego, a następnie przeprowadzonej optymalizacji. Przedstawione zostały również metryki oceny modeli zarówno dla wersji przed, jak i po optymalizacji. Ostatnia, trzecia część pracy poświęcona jest syntezie wyników modeli, podsumowaniu różnic i podobieństw w wynikach oraz wybraniu modelu dającego najlepsze rezultaty w przeprowadzonym porównaniu. Wskazane zostały dalsze kroki w celu produkcyjnego wdrożenia modelu w przedsiębiorstwie, a także trudności możliwe do napotkania podczas wdrożenia. Na końcu nakreślone zostały potencjalne kierunki dalszego rozwoju badania. pl_PL
dc.language.iso other pl_PL
dc.relation.ispartofseries ;Nr 6321
dc.subject uczenie maszynowe pl_PL
dc.subject wartość klienta w czasie (CLV) pl_PL
dc.subject klasyfikacja wieloklasowa pl_PL
dc.subject naiwny model Bayesa pl_PL
dc.subject XGBoost pl_PL
dc.subject głębokie sieci neuronowe pl_PL
dc.subject ML w branży finansowej pl_PL
dc.title Klasyfikacja przyszłej przychodowości klienta usługi pożyczkowej - przegląd rozwiązań pl_PL
dc.type Thesis pl_PL


Pliki tej pozycji

Plik Rozmiar Format Przeglądanie

Nie ma plików powiązanych z tą pozycją.

Pozycja umieszczona jest w następujących kolekcjach

Pokaż uproszczony rekord

Szukaj


Szukanie zaawansowane

Przeglądaj

Moje konto