Streszczenie:
W niniejszej pracy porównano ze sobą wybrane platformy MLOps - Kubeflow i MLFlow
pod kątem przydatności do opracowywania systemów predykcyjnych. W tym celu
opracowano i zaimplementowano na platformach system przewidujący wysokość pensji
na podstawie danych z ogłoszenia.
Na platformie MLFlow opracowany system wykonywał transformację danych i trening
dla pięciu różnych modeli regresji, zapisując wszystkie artefakty, metryki i modele
(wraz z wersją), z których najlepszy okazał się model Random Forest (MAE - 2258).
Najlepszy z modeli został wdrożony w aplikacji opracowanej w języku Python.
Implementacja na platformie Kubeflow polegała na opracowaniu i zapisaniu potoku
transformującego dane i wykonującego trening dwóch modeli (z zapisaniem
najważniejszych metryk). Najlepszy okazał się model Random Forest (MAE - 2422).
Model został wdrożony jako serwis Kubernetes.
Przeprowadzone studium przypadku umożliwiło ocenę wybranych platform
i przedstawienie zastosowań, w których najlepiej się sprawdzą.