Streszczenie:
Tematem niniejszej pracy jest zastosowanie systemów ekstrakcji danych
ze stron internetowych w celu agregacji artykułów naukowych i
wizualizacji ich wzajemnych powiązań. We wstępie wyjaśniono problem
wyszukiwania treści naukowych w internecie i przedstawiono
proponowane rozwiązanie.
Pierwszy rozdział poświecono modułowi ekstrakcji danych ze stron
internetowych, który został wykorzystany do pobierania informacji o
artykułach naukowych i ich wzajemnych relacjach. Zawiera analizę
wyzwań jakie stwarza zagadnienie oraz obszerną ewaluację zaproponowanych
rozwiązań.
Drugi rozdział poświecono modułowi funkcjonalnemu, odpowiedzialnemu
za porządkowanie i analizę zebranych danych posiłkując się
algorytmami do przetwarzania zbiorów danych. Ponadto, przeanalizowano
dostępne narzędzia oraz ich cechy w kontekście niniejszego
projektu.
Trzeci rozdział opisuje sposoby wizualizacji przetworzonych danych.
Wprowadza interfejs użytkownika w formie strony internetowej by
ułatwić pracę z opracowanym narzędziem. Dużo miejsca poświęcono
różnym bibliotekom pozwalającym na wizualizację zebranych
danych.
Praca jest zakończona podsumowaniem, w którym przedstawiono możliwy
zakres dalszego rozwoju aplikacji oraz dotychczasowo osiągnięte
rezultaty.