Repozytorium PJATK

Analiza i rozpoznawanie znaków polskiego języka migowego.

Repozytorium Centrum Otwartej Nauki

Pokaż uproszczony rekord

dc.contributor.author Adamczyk, Maciej
dc.date.accessioned 2023-01-02T12:09:22Z
dc.date.available 2023-01-02T12:09:22Z
dc.date.issued 2023-01-02
dc.identifier.issn 2021/M/DS/33
dc.identifier.uri https://repin.pjwstk.edu.pl/xmlui/handle/186319/2071
dc.description.abstract W opisanej pracy magisterskiej autor zają się zagadnieniem rozpoznawania alfabetu polskiego języka migowego (PJM). Ze względu na specyfikę języka mało prac zostało poświęconych tej tematyce. Celem przeprowadzonego badania była detekcja i rozpoznawanie liter języka migowego na zdjęciach i krótkich nagraniach. Do rozwiązania problemu rozpoznawania znaków polskiego języka migowego została wykorzystana segmentacja obrazów, selekcja cech i klasyfkacja. Istotną różnicę tej pracy od innych prac jest to, że wykorzystane zbiory danych zostały stworzone w naturalnych warunkach (różne poziomy oświetlenia i różnorodne tła) oraz bez użycia sensorycznych rękawic do śledzenia ruchu. Pracę możemy podzielić na trzy główne części: stworzenie własnego zbioru filmów alfabetu PJM, przeprowadzenie eksperymentów na tych filmach i przeprowadzenie eksperymentów na zdjęciach. Na początku autor stworzył zbiór nagrań alfabetu PJM, który został nazwany PJMvideos. Następnie dokonał przekształceń tego zbioru tj. skalowanie, interpolacja i wybieranie klatek (ang. sampling). Później przeprowadził eksperymenty na zdjęciach oraz filmach. W pierwszej kolejności badania zostały przeprowadzone na filmach z własnego zbiory danych - PJMvideos, a potem na zdjęciach pozyskanych ze strony sun.aei.polsl.pl i własnego zbioru danych - PJMphotos. Podczas eksperymentów na filmach została przeprowadzona ekstrakcja cech z nagranych klatek. Do tego celu posłużyła sieć konwolucyjna. Natomiast do klasyfikacji gestów została użyta sieć LSTM. W przypadku eksperymentów na zdjęciach, zdjęcia zostały poddane segmentacji za pomocy zmodyfkowanej sieci UNet. Potem był etap klasyfikacji i dostrajania wytrenowanej sieci VGG16, CNN. Oprócz powyższych etapów został stworzony również generator zdjęć w celu poprawy jakości segmentacji zdjęć. pl_PL
dc.language.iso other pl_PL
dc.relation.ispartofseries ;Nr 6340
dc.subject Polski Język Migowy pl_PL
dc.subject Gesty pl_PL
dc.subject U-Net pl_PL
dc.subject Segmentacja pl_PL
dc.subject Transfer Learning pl_PL
dc.title Analiza i rozpoznawanie znaków polskiego języka migowego. pl_PL
dc.type Thesis pl_PL


Pliki tej pozycji

Plik Rozmiar Format Przeglądanie

Nie ma plików powiązanych z tą pozycją.

Pozycja umieszczona jest w następujących kolekcjach

Pokaż uproszczony rekord

Szukaj


Szukanie zaawansowane

Przeglądaj

Moje konto