Streszczenie:
Przedmiotem pracy jest analiza danych tekstowych zebranych z platformy Twitter[1]
w kontekście pandemii wirusa COVID-19. Dane przefiltrowano względem hashtagu
#koronawirus oraz #coronavirus odpowiednio dla dokumentów polskojęzycznych
i anglojęzycznych. Wykorzystując techniki NLP, otrzymano tematy najczęściej
przewijające się w dokumentach tekstowych zebranych z platformy Twitter dla każdego
miesiąca w roku 2020 (luty-grudzień), osobno dla każdego z języków. Pozwoliło to
uzyskać wgląd w sposób kształtowania się dyskusji wokół pandemii w Polsce i na
świecie na przestrzeni roku. Umożliwiło to również porównanie tych dwóch środowisk
(polsko- i anglojęzycznego) między sobą. Oprócz przeprowadzonych analiz, w pracy
wskazano również możliwe problemy, jak i pomysły na rozwiązanie niektórych z tych
trudności.