Repozytorium PJATK

Automatyczne rozpoznawanie akcentu z wykorzystaniem uczenia maszynowego

Repozytorium Centrum Otwartej Nauki

Pokaż uproszczony rekord

dc.contributor.author Koziara, Krzysztof
dc.date.accessioned 2023-03-23T11:01:40Z
dc.date.available 2023-03-23T11:01:40Z
dc.date.issued 2023-03-23
dc.identifier.issn 2022/M/DS/22
dc.identifier.uri https://repin.pjwstk.edu.pl/xmlui/handle/186319/2688
dc.description.abstract W niniejszej pracy podejmowany jest problem identyfikacji akcentu w zakresie jednego języka. W tym celu wybrano zbiór pięciu akcentów hiszpańskich z Ameryki Łacińskiej: argentyński, kolumbijski, chilijski, peruwiański i wenezuelski. Do rozwiązania problemu wykorzystano 3 różne podejścia. Na początku wyodrębniono globalne parametry statystyczne obliczone na niskopoziomowych cechach akustycznych, dostępne w zestawach cech: eGeMAPSv02 oraz ComParE w obrębie biblioteki OpenSMILE [6]. Klasyfikacja cech została przeprowadzona za pomocą modeli SVM oraz głębokich sieci neuronowych. Następnie z nagrań pozyskano Mel-spektrogramy oraz podjęto próbę klasyfikacji za pomocą sieci konwolucyjnych. Ostatnim podejściem był Transfer Learning. Zbadano możliwość klasyfikacji cech-zagnieżdżeń uzyskanych poprzez przeprocesowanie nagrań przez pre-trenowane modele wav2vec 2.0 oraz Yamnet. Najlepsze wyniki uzyskano wykorzystując zestawy cech akustycznych eGeMAPSv02 oraz ComParE. Podejście z Melspektrogramami wygląda obiecująco, jednak problemem wydaje się zbyt mała ilość danych. Udało się uzyskać pewne sensowne wyniki z zagnieżdżeniami Yamnet, natomiast wykorzystanie zagnieżdżeń wav2vec 2.0 nie przyniosło pomyślnych rezultatów i wymaga dalszych badań. pl_PL
dc.language.iso other pl_PL
dc.relation.ispartofseries ;Nr 7144
dc.subject rozpoznawanie akcentu pl_PL
dc.subject eGeMAPSv02 pl_PL
dc.subject ComParE pl_PL
dc.subject OpenSMILE pl_PL
dc.subject Mel-spektrogram pl_PL
dc.subject wav2vec pl_PL
dc.subject Yamnet pl_PL
dc.title Automatyczne rozpoznawanie akcentu z wykorzystaniem uczenia maszynowego pl_PL
dc.title.alternative Automatic accent recognition using machine learning pl_PL
dc.type Thesis pl_PL


Pliki tej pozycji

Plik Rozmiar Format Przeglądanie

Nie ma plików powiązanych z tą pozycją.

Pozycja umieszczona jest w następujących kolekcjach

Pokaż uproszczony rekord

Szukaj


Szukanie zaawansowane

Przeglądaj

Moje konto