Repozytorium PJATK

Zastosowanie technik uczenia maszynowego i przetwarzania języka naturalnego w szczegółowej analizie treści o tematyce sportowej.

Repozytorium Centrum Otwartej Nauki

Pokaż uproszczony rekord

dc.contributor.author Szczypek, Maciej
dc.date.accessioned 2021-08-24T06:40:01Z
dc.date.available 2021-08-24T06:40:01Z
dc.date.issued 2021-08-24
dc.identifier.issn 2021/M/DS/4
dc.identifier.uri https://repin.pjwstk.edu.pl/xmlui/handle/186319/924
dc.description.abstract W niniejszej pracy magisterskiej przedstawiono projekt oraz wyniki działania oprogramowania służącego do szczegółowej analizy treści o tematyce sportowej napisanych w języku angielskim. Oprogramowanie to skutecznie realizuje najistotniejsze zadania związane z przetwarzaniem języka naturalnego, tj. przetwarzanie i przygotowywanie korpusu do analizy, sumaryzację treści, modelowanie tematów oraz analizę i klasyfikację sentymentu. Funkcjonalności te zostały efektywnie zaimplementowane przy wykorzystaniu starannie dobranych, złożonych technik i modeli z dziedziny uczenia maszynowego oraz przetwarzania języka naturalnego. Oprogramowanie generuje podsumowania za pomocą dwóch różnych metod - ekstraktywnej i abstrakcyjnej - przy czym ta pierwsza wykorzystuje algorytm PageRank, a druga uprzednio wytrenowany model RoBERTa. Modelowanie tematów przeprowadzane jest przy pomocy nieujemnej faktoryzacji macierzy (NMF), która to metoda okazała się przynosić znacznie lepsze rezultaty niż LDA i LSA. Najskuteczniejszym modelem w kontekście klasyfikacji sentymentu w poszczególnych dokumentach okazał się być oparty na leksykonach model VADER, i to on został wykorzystany do realizacji tego zadania. pl_PL
dc.language.iso other pl_PL
dc.relation.ispartofseries ;Nr 5988
dc.subject uczenie maszynowe pl_PL
dc.subject przetwarzanie języka naturalnego pl_PL
dc.subject przetwarzanie korpusu pl_PL
dc.subject sumaryzacja tekstu pl_PL
dc.subject modelowanie tematów pl_PL
dc.subject analiza sentymentu pl_PL
dc.title Zastosowanie technik uczenia maszynowego i przetwarzania języka naturalnego w szczegółowej analizie treści o tematyce sportowej. pl_PL
dc.title.alternative Application of machine learning and natural language processing techniques in detailed analysis of sports-related content. pl_PL
dc.type Thesis pl_PL


Pliki tej pozycji

Plik Rozmiar Format Przeglądanie

Nie ma plików powiązanych z tą pozycją.

Pozycja umieszczona jest w następujących kolekcjach

Pokaż uproszczony rekord

Szukaj


Szukanie zaawansowane

Przeglądaj

Moje konto