<?xml version="1.0" encoding="UTF-8"?>
<rdf:RDF xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns="http://purl.org/rss/1.0/" xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#">
<channel rdf:about="https://repin.pjwstk.edu.pl/xmlui/handle/186319/2210">
<title>Praca magistrska - Data Science 2022</title>
<link>https://repin.pjwstk.edu.pl/xmlui/handle/186319/2210</link>
<description/>
<items>
<rdf:Seq>
<rdf:li rdf:resource="https://repin.pjwstk.edu.pl/xmlui/handle/186319/2719"/>
<rdf:li rdf:resource="https://repin.pjwstk.edu.pl/xmlui/handle/186319/2718"/>
<rdf:li rdf:resource="https://repin.pjwstk.edu.pl/xmlui/handle/186319/2717"/>
<rdf:li rdf:resource="https://repin.pjwstk.edu.pl/xmlui/handle/186319/2698"/>
</rdf:Seq>
</items>
<dc:date>2026-04-10T11:31:50Z</dc:date>
</channel>
<item rdf:about="https://repin.pjwstk.edu.pl/xmlui/handle/186319/2719">
<title>Systemy rozproszone czy implementacje lokalne?</title>
<link>https://repin.pjwstk.edu.pl/xmlui/handle/186319/2719</link>
<description>Systemy rozproszone czy implementacje lokalne?
Jastrzębski, Jakub Zdzisław
Celem niniejszej pracy jest przedstawienie sugestii dotyczących metodologii&#13;
przetwarzania danych. Głównym kryterium wydajności przetwarzania&#13;
danych był czas wykonania poszczególnych algorytmów. Przetwarzanie&#13;
różnych algorytmów było obserwowane pod wieloma kątami, takimi&#13;
jak język programowania, implementacja lokalna czy rozproszona i&#13;
rozmiar danych. Porównywane zostały prędkości wykonania przy użyciu&#13;
jednego serwera oraz klastrów obliczeniowych, w tym celu zostało&#13;
użyto środowisko Spark. Z badań wynika, że dla mniejszych rozmiarów&#13;
danych, mniej więcej poniżej 1GB, nie opłaca się korzystanie z klastrów&#13;
obliczeniowych. Co prawda można zauważyć zmniejszenie czasu wykonania,&#13;
lecz jest ono zbyt kosztowane, aby angażować więcej niż jedną maszynę.&#13;
Z kolei dla dużych danych sięgających rozmiarów 8GB i większych,&#13;
warto korzystać z klastrów obliczeniowych, gdyż wzrost jest bardzo&#13;
zauważalny. Wybór sprzętu i technologii może być problematycznym&#13;
problemem, z którym zmaga się wiele osób chcących jak najwydajniej&#13;
przetwarzać dane o dużych rozmiarach dlatego ta praca jest swego&#13;
rodzaju pomocą w wyborze sprzętowym i technologicznym do rozmiaru&#13;
danych.
</description>
<dc:date>2023-05-24T00:00:00Z</dc:date>
</item>
<item rdf:about="https://repin.pjwstk.edu.pl/xmlui/handle/186319/2718">
<title>Analiza porównawcza wybranych algorytmów grupowania</title>
<link>https://repin.pjwstk.edu.pl/xmlui/handle/186319/2718</link>
<description>Analiza porównawcza wybranych algorytmów grupowania
Szymańczyk, Damian
W niniejszej pracy dokonano analizy porównawczej trzech algorytmów grupowania: k-średnich, grupowania hierarchicznego oraz DBSCAN. Praca rozpoczyna się wprowadzeniem w dziedzinę grupowania danych oraz omawia sposób działania ww. algorytmów. Kolejnym etapem są eksperymenty, które zostały przeprowadzone na kilku zbiorach danych opublikowanych jako „Fundamental Clustering Problems Suite” (FCPS): Atom, Chainlink, WingNut, Golfball, Lsun, TwoDiamonds. FCPS składa się z zestawów danych o znanych a priori klasyfikacjach, które mają być odtworzone przez algorytm. Porównanie działania ww. algorytmów przeprowadzono z wykorzystaniem skorygowanego indeksu Rand oraz F-miary. Przedstawiono wizualizację działania ww. algorytmów dla wszystkich zbiorów wykorzystanych w pracy
</description>
<dc:date>2023-05-24T00:00:00Z</dc:date>
</item>
<item rdf:about="https://repin.pjwstk.edu.pl/xmlui/handle/186319/2717">
<title>Zastosowanie technik uczenia maszynowego w klasyfikacji ryzyka pożyczkowego</title>
<link>https://repin.pjwstk.edu.pl/xmlui/handle/186319/2717</link>
<description>Zastosowanie technik uczenia maszynowego w klasyfikacji ryzyka pożyczkowego
Sawicka, Monika
Ta praca miała na celu zbadanie, przeanalizowanie i zbudowanie algorytmu uczenia maszynowego, aby poprawnie określić, czy dana osoba, mając określone atrybuty, ma wysokie prawdopodobieństwo niespłacenia pożyczki. Tego typu model mógłby zostać wykorzystany do identyfikacji pewnych cech finansowych przyszłych pożyczkobiorców, którzy mogą mieć potencjał do niespłacania zobowiązań i nie spłaty pożyczki w wyznaczonym terminie. W pracy tej przyjrzano się najpopularniejszym narzędziom wykorzystanym w dziedzinie uczenia maszynowego do oceny ryzyka kredytowego. Pracując na zbiorze danych zawierającym flagowane informacje o pożyczkobiorcach, zaimplementowano klasyczne modele uczenia maszynowego – model SVM, regresji logistycznej, drzew decyzyjnych, lasów losowych oraz model XGBoost.
</description>
<dc:date>2023-05-24T00:00:00Z</dc:date>
</item>
<item rdf:about="https://repin.pjwstk.edu.pl/xmlui/handle/186319/2698">
<title>Wykorzystanie technik analizy szeregów czasowych w handlu detalicznym</title>
<link>https://repin.pjwstk.edu.pl/xmlui/handle/186319/2698</link>
<description>Wykorzystanie technik analizy szeregów czasowych w handlu detalicznym
Białach, Michał
W pracy tej przyjrzano się najpopularniejszym narzędziom wykorzystanym w dziedzinie uczenia maszynowego w celu predykcji marży dla jednej z największych firm specjalizującej się w handlu detalicznym. Pracując na zbiorze danych zawierającym blisko 500 tyś rekordów, stworzono szeregi czasowe zagregowane do tygodni. Następnie wykorzystano sieć neuronową oraz procedurę Prophet w celu predykcji wyników oraz porównania ich ze sobą.
</description>
<dc:date>2023-03-23T00:00:00Z</dc:date>
</item>
</rdf:RDF>
