dc.contributor.author |
Kopaczewski, Piotr |
|
dc.date.accessioned |
2023-01-02T09:04:24Z |
|
dc.date.available |
2023-01-02T09:04:24Z |
|
dc.date.issued |
2023-01-02 |
|
dc.identifier.issn |
2021/M/DS/14 |
|
dc.identifier.uri |
https://repin.pjwstk.edu.pl/xmlui/handle/186319/2052 |
|
dc.description.abstract |
Przedmiotem pracy jest analiza danych tekstowych zebranych z platformy Twitter[1]
w kontekście pandemii wirusa COVID-19. Dane przefiltrowano względem hashtagu
#koronawirus oraz #coronavirus odpowiednio dla dokumentów polskojęzycznych
i anglojęzycznych. Wykorzystując techniki NLP, otrzymano tematy najczęściej
przewijające się w dokumentach tekstowych zebranych z platformy Twitter dla każdego
miesiąca w roku 2020 (luty-grudzień), osobno dla każdego z języków. Pozwoliło to
uzyskać wgląd w sposób kształtowania się dyskusji wokół pandemii w Polsce i na
świecie na przestrzeni roku. Umożliwiło to również porównanie tych dwóch środowisk
(polsko- i anglojęzycznego) między sobą. Oprócz przeprowadzonych analiz, w pracy
wskazano również możliwe problemy, jak i pomysły na rozwiązanie niektórych z tych
trudności. |
pl_PL |
dc.language.iso |
other |
pl_PL |
dc.relation.ispartofseries |
;Nr 6283 |
|
dc.subject |
Przetwarzanie języka naturalnego |
pl_PL |
dc.subject |
Rozpoznawanie nazw własnych |
pl_PL |
dc.subject |
Modelowanie tematyczne |
pl_PL |
dc.title |
Analiza treści w strumieniu mediów społecznościowych na przykładzie dyskusji nt. COVID-19 na Twitterze |
pl_PL |
dc.type |
Thesis |
pl_PL |