dc.description.abstract |
Celem poniższej pracy jest predykcja depresji lęku i stresu używając wybranych modeli uczenia maszynowego: drzew decyzyjnych, lasu losowego, maszyny wektorów nośnych, naiwnego Bayesa i KNN.
Dane pochodzą ze zbioru DASS. Są to wyniki ankiety przeprowadzonej online pośród 39774 badanych, a także informacje dodatkowe wygenerowane automatycznie przez komputer. Samym badanym zostało zadane po 42 pytania podstawowe mające określić czy cierpią na zaburzenia depresyjne, lękowe lub stres. Oprócz tego badanym zostały zadane pytania dodatkowe - o ich miejsce zamieszkania, płeć, wykształcenie, wyznanie, orientację seksualną, stan cywilny, wielkość rodziny, wiek, to czy głosowali w ostatnich wyborach, czy są lewo - czy praworęczni i czy angielski jest ich językiem ojczystym oraz każda z badanych osób odpowiedziała na 10 pytań o ich cechy charakteru.
Modele zostały oparte na pytaniach dodatkowych, aby sprawdzić czy na podstawie danych osobowych można przewidzieć czy osoba choruje na zaburzenia depresyjne, lękowe i stres. Wszystkie modele zostały utworzone i przetrenowane dzięki użyciu biblioteki sklearn. Miarami oceny tych klasyfikatorów są dokładność, F1, czułość, precyzja i walidacja krzyżowa (ang. accuracy, F1, recall, precision i cross validation score). Wyniki uzyskane przez wszystkie modele były stosunkowo niskie, najlepszy wynik uzyskał las losowy, który uzyskał wynik F1 0.46 dla predykcji lęku, 0.423 dla predykcji stresu i 0.387 dla predykcji depresji. Pozostałe modele osiągnęły niższe rezultaty. Możliwe, że przy zwiększeniu liczby danych wejściowych, a także dodaniu dodatkowych pozycji w ankiecie modele osiągnęłyby leprze wyniki. Możliwa jest również teza, że choroby takie jak depresja, lęk i stres nie są zależne od danych osobowych, więc modele nie osiągną wysokiej skuteczności nawet, kiedy pytania zadawane będą bardzo szczegółowe i będzie ich wiele. |
pl_PL |