dc.contributor.author |
Szczypek, Maciej |
|
dc.date.accessioned |
2021-08-24T06:40:01Z |
|
dc.date.available |
2021-08-24T06:40:01Z |
|
dc.date.issued |
2021-08-24 |
|
dc.identifier.issn |
2021/M/DS/4 |
|
dc.identifier.uri |
https://repin.pjwstk.edu.pl/xmlui/handle/186319/924 |
|
dc.description.abstract |
W niniejszej pracy magisterskiej przedstawiono projekt oraz wyniki działania
oprogramowania służącego do szczegółowej analizy treści o tematyce sportowej napisanych
w języku angielskim. Oprogramowanie to skutecznie realizuje najistotniejsze
zadania związane z przetwarzaniem języka naturalnego, tj. przetwarzanie i przygotowywanie
korpusu do analizy, sumaryzację treści, modelowanie tematów oraz analizę
i klasyfikację sentymentu. Funkcjonalności te zostały efektywnie zaimplementowane
przy wykorzystaniu starannie dobranych, złożonych technik i modeli z dziedziny
uczenia maszynowego oraz przetwarzania języka naturalnego.
Oprogramowanie generuje podsumowania za pomocą dwóch różnych metod -
ekstraktywnej i abstrakcyjnej - przy czym ta pierwsza wykorzystuje algorytm PageRank,
a druga uprzednio wytrenowany model RoBERTa. Modelowanie tematów
przeprowadzane jest przy pomocy nieujemnej faktoryzacji macierzy (NMF), która
to metoda okazała się przynosić znacznie lepsze rezultaty niż LDA i LSA. Najskuteczniejszym
modelem w kontekście klasyfikacji sentymentu w poszczególnych
dokumentach okazał się być oparty na leksykonach model VADER, i to on został
wykorzystany do realizacji tego zadania. |
pl_PL |
dc.language.iso |
other |
pl_PL |
dc.relation.ispartofseries |
;Nr 5988 |
|
dc.subject |
uczenie maszynowe |
pl_PL |
dc.subject |
przetwarzanie języka naturalnego |
pl_PL |
dc.subject |
przetwarzanie korpusu |
pl_PL |
dc.subject |
sumaryzacja tekstu |
pl_PL |
dc.subject |
modelowanie tematów |
pl_PL |
dc.subject |
analiza sentymentu |
pl_PL |
dc.title |
Zastosowanie technik uczenia maszynowego i przetwarzania języka naturalnego w szczegółowej analizie treści o tematyce sportowej. |
pl_PL |
dc.title.alternative |
Application of machine learning and natural language processing techniques in detailed analysis of sports-related content. |
pl_PL |
dc.type |
Thesis |
pl_PL |