dc.contributor.author |
Rutkowski, Paweł |
|
dc.date.accessioned |
2022-10-17T06:44:42Z |
|
dc.date.available |
2022-10-17T06:44:42Z |
|
dc.date.issued |
2022-10-17 |
|
dc.identifier.issn |
6216 |
|
dc.identifier.uri |
https://repin.pjwstk.edu.pl/xmlui/handle/186319/1629 |
|
dc.description.abstract |
Celem niniejszej pracy jest analiza i porównanie metod wektoryzacji oraz ekstrakcji cech do zadania
analizy sentymentu w pisanym tekście z wykorzystaniem technik uczenia maszynowego. W ramach
pracy zostało przeprowadzone badanie dwóch podejść ekstrakcji cech z dokumentów tekstowych -
TF-IDF oraz osadzanie słów (ang. word embedding), różniące się od siebie sposobem reprezentacji
tekstu w formie wektorów. Dla każdej z tych technik został przeprowadzony szereg testów badający
wpływ metod ekstrakcji i selekcji cech na skuteczność algorytmu analizy sentymentu.
Przeprowadzono analizę wpływu selekcji istotnych cech (dla metody TF-IDF) oraz wstępnej filtracji
słów (dla osadzania słów) na dokładność klasyfikacji. Dodatkowo zostaną porównane dwa zbiory
wektorów reprezentujących słowa - word2vec i GloVe, różniące się od siebie sposobem trenowania i
ustalania wartości składowych wektorów reprezentujących słowa. |
pl_PL |
dc.language.iso |
other |
pl_PL |
dc.relation.ispartofseries |
2021/I/G/78 |
|
dc.subject |
analiza sentymentu |
pl_PL |
dc.subject |
uczenie maszynowe |
pl_PL |
dc.subject |
ekstrakcja i selekcja cech |
pl_PL |
dc.subject |
TF-IDF |
pl_PL |
dc.subject |
osadzanie słów |
pl_PL |
dc.subject |
word2vec |
pl_PL |
dc.subject |
GloVe |
pl_PL |
dc.subject |
sztuczna sieć neuronowa |
pl_PL |
dc.subject |
konwolucyjna sieć neuronowa |
pl_PL |
dc.title |
Rozpoznawanie sentymentu w pisanym tekście |
pl_PL |
dc.type |
Thesis |
pl_PL |