dc.contributor.author |
Kuczkowska, Paulina |
|
dc.date.accessioned |
2023-01-02T12:36:34Z |
|
dc.date.available |
2023-01-02T12:36:34Z |
|
dc.date.issued |
2023-01-02 |
|
dc.identifier.issn |
2021/M/DS/34 |
|
dc.identifier.uri |
https://repin.pjwstk.edu.pl/xmlui/handle/186319/2072 |
|
dc.description.abstract |
Opisy zdarzeń medycznych zebranych w badaniach klinicznych wymagają
czasochłonnego oraz podatnego na błędy procesu kodowania zgodnie
z międzynarodowymi standardami terminologii medycznej. Celem niniejszej
pracy jest zbadanie możliwości wykorzystania metod z dziedziny wyszukiwania
informacji w celu automatyzacji procesu klasyfikacji tekstu do słownika
MedDRA. W części eksperymentalnej pozyskano dane z 17 badan klinicznych,
które poddano oczyszczeniu i wykorzystano przy przypisywaniu wartości
LLT na podstawie opisu zdarzenia zawartego w Verbatim Term. Sprawdzono
i porównano efektywność metod z zastosowaniem miar odległości łańcuchów
znaków (np. miarę Levenshteina) oraz metod opartych na miarach
częstości słów tj. miary wielkości przecięcia i podobieństwa kosinusowego.
Spośród przebadanych metod najlepszy wynik miary makro F1 równy 0.33
uzyskano dla połączenia miary podobieństwa kosinusowego z miara odległości
łańcuchów znaków. Stosunkowo niska efektywność w porównaniu do wyników
najnowszych doniesień naukowych możne wynikać z faktu zastosowania
prostych bezkontaktowych metod, a także specyfiki słownika MedDRA. |
pl_PL |
dc.language.iso |
other |
pl_PL |
dc.relation.ispartofseries |
;Nr 6358 |
|
dc.subject |
miary długosci łancuchów znaków |
pl_PL |
dc.subject |
tf-idf |
pl_PL |
dc.subject |
podobienstwo kosinusowe |
pl_PL |
dc.subject |
badania kliniczne |
pl_PL |
dc.title |
Przegląd metod przybliżonego dopasowania tekstu do kategorii na przykładzie opisu objawów niepożądanych w badaniach klinicznych |
pl_PL |
dc.title.alternative |
Review of methods of approximate text matching to categories on the example of medical events from clinical trials |
pl_PL |
dc.type |
Thesis |
pl_PL |