<?xml version="1.0" encoding="UTF-8"?>
<feed xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns="http://www.w3.org/2005/Atom">
<title>Praca magistrska - Data Science 2022</title>
<link href="https://repin.pjwstk.edu.pl/xmlui/handle/186319/2210" rel="alternate"/>
<subtitle/>
<id>https://repin.pjwstk.edu.pl/xmlui/handle/186319/2210</id>
<updated>2026-04-10T11:33:35Z</updated>
<dc:date>2026-04-10T11:33:35Z</dc:date>
<entry>
<title>Systemy rozproszone czy implementacje lokalne?</title>
<link href="https://repin.pjwstk.edu.pl/xmlui/handle/186319/2719" rel="alternate"/>
<author>
<name>Jastrzębski, Jakub Zdzisław</name>
</author>
<id>https://repin.pjwstk.edu.pl/xmlui/handle/186319/2719</id>
<updated>2023-05-24T07:31:35Z</updated>
<published>2023-05-24T00:00:00Z</published>
<summary type="text">Systemy rozproszone czy implementacje lokalne?
Jastrzębski, Jakub Zdzisław
Celem niniejszej pracy jest przedstawienie sugestii dotyczących metodologii&#13;
przetwarzania danych. Głównym kryterium wydajności przetwarzania&#13;
danych był czas wykonania poszczególnych algorytmów. Przetwarzanie&#13;
różnych algorytmów było obserwowane pod wieloma kątami, takimi&#13;
jak język programowania, implementacja lokalna czy rozproszona i&#13;
rozmiar danych. Porównywane zostały prędkości wykonania przy użyciu&#13;
jednego serwera oraz klastrów obliczeniowych, w tym celu zostało&#13;
użyto środowisko Spark. Z badań wynika, że dla mniejszych rozmiarów&#13;
danych, mniej więcej poniżej 1GB, nie opłaca się korzystanie z klastrów&#13;
obliczeniowych. Co prawda można zauważyć zmniejszenie czasu wykonania,&#13;
lecz jest ono zbyt kosztowane, aby angażować więcej niż jedną maszynę.&#13;
Z kolei dla dużych danych sięgających rozmiarów 8GB i większych,&#13;
warto korzystać z klastrów obliczeniowych, gdyż wzrost jest bardzo&#13;
zauważalny. Wybór sprzętu i technologii może być problematycznym&#13;
problemem, z którym zmaga się wiele osób chcących jak najwydajniej&#13;
przetwarzać dane o dużych rozmiarach dlatego ta praca jest swego&#13;
rodzaju pomocą w wyborze sprzętowym i technologicznym do rozmiaru&#13;
danych.
</summary>
<dc:date>2023-05-24T00:00:00Z</dc:date>
</entry>
<entry>
<title>Analiza porównawcza wybranych algorytmów grupowania</title>
<link href="https://repin.pjwstk.edu.pl/xmlui/handle/186319/2718" rel="alternate"/>
<author>
<name>Szymańczyk, Damian</name>
</author>
<id>https://repin.pjwstk.edu.pl/xmlui/handle/186319/2718</id>
<updated>2023-05-24T07:24:49Z</updated>
<published>2023-05-24T00:00:00Z</published>
<summary type="text">Analiza porównawcza wybranych algorytmów grupowania
Szymańczyk, Damian
W niniejszej pracy dokonano analizy porównawczej trzech algorytmów grupowania: k-średnich, grupowania hierarchicznego oraz DBSCAN. Praca rozpoczyna się wprowadzeniem w dziedzinę grupowania danych oraz omawia sposób działania ww. algorytmów. Kolejnym etapem są eksperymenty, które zostały przeprowadzone na kilku zbiorach danych opublikowanych jako „Fundamental Clustering Problems Suite” (FCPS): Atom, Chainlink, WingNut, Golfball, Lsun, TwoDiamonds. FCPS składa się z zestawów danych o znanych a priori klasyfikacjach, które mają być odtworzone przez algorytm. Porównanie działania ww. algorytmów przeprowadzono z wykorzystaniem skorygowanego indeksu Rand oraz F-miary. Przedstawiono wizualizację działania ww. algorytmów dla wszystkich zbiorów wykorzystanych w pracy
</summary>
<dc:date>2023-05-24T00:00:00Z</dc:date>
</entry>
<entry>
<title>Zastosowanie technik uczenia maszynowego w klasyfikacji ryzyka pożyczkowego</title>
<link href="https://repin.pjwstk.edu.pl/xmlui/handle/186319/2717" rel="alternate"/>
<author>
<name>Sawicka, Monika</name>
</author>
<id>https://repin.pjwstk.edu.pl/xmlui/handle/186319/2717</id>
<updated>2023-05-24T07:19:20Z</updated>
<published>2023-05-24T00:00:00Z</published>
<summary type="text">Zastosowanie technik uczenia maszynowego w klasyfikacji ryzyka pożyczkowego
Sawicka, Monika
Ta praca miała na celu zbadanie, przeanalizowanie i zbudowanie algorytmu uczenia maszynowego, aby poprawnie określić, czy dana osoba, mając określone atrybuty, ma wysokie prawdopodobieństwo niespłacenia pożyczki. Tego typu model mógłby zostać wykorzystany do identyfikacji pewnych cech finansowych przyszłych pożyczkobiorców, którzy mogą mieć potencjał do niespłacania zobowiązań i nie spłaty pożyczki w wyznaczonym terminie. W pracy tej przyjrzano się najpopularniejszym narzędziom wykorzystanym w dziedzinie uczenia maszynowego do oceny ryzyka kredytowego. Pracując na zbiorze danych zawierającym flagowane informacje o pożyczkobiorcach, zaimplementowano klasyczne modele uczenia maszynowego – model SVM, regresji logistycznej, drzew decyzyjnych, lasów losowych oraz model XGBoost.
</summary>
<dc:date>2023-05-24T00:00:00Z</dc:date>
</entry>
<entry>
<title>Wykorzystanie technik analizy szeregów czasowych w handlu detalicznym</title>
<link href="https://repin.pjwstk.edu.pl/xmlui/handle/186319/2698" rel="alternate"/>
<author>
<name>Białach, Michał</name>
</author>
<id>https://repin.pjwstk.edu.pl/xmlui/handle/186319/2698</id>
<updated>2023-03-23T12:41:17Z</updated>
<published>2023-03-23T00:00:00Z</published>
<summary type="text">Wykorzystanie technik analizy szeregów czasowych w handlu detalicznym
Białach, Michał
W pracy tej przyjrzano się najpopularniejszym narzędziom wykorzystanym w dziedzinie uczenia maszynowego w celu predykcji marży dla jednej z największych firm specjalizującej się w handlu detalicznym. Pracując na zbiorze danych zawierającym blisko 500 tyś rekordów, stworzono szeregi czasowe zagregowane do tygodni. Następnie wykorzystano sieć neuronową oraz procedurę Prophet w celu predykcji wyników oraz porównania ich ze sobą.
</summary>
<dc:date>2023-03-23T00:00:00Z</dc:date>
</entry>
</feed>
