Automatyczne rozpoznawanie akcentu z wykorzystaniem uczenia maszynowego

Repozytorium PJATK
→
Wydział Informatyki / Faculty of Information Technology
→
Praca magistrska - Data Science 2022
→
Zobacz pozycję

dc.contributor.author	Koziara, Krzysztof
dc.date.accessioned	2023-03-23T11:01:40Z
dc.date.available	2023-03-23T11:01:40Z
dc.date.issued	2023-03-23
dc.identifier.issn	2022/M/DS/22
dc.identifier.uri	https://repin.pjwstk.edu.pl/xmlui/handle/186319/2688
dc.description.abstract	W niniejszej pracy podejmowany jest problem identyfikacji akcentu w zakresie jednego języka. W tym celu wybrano zbiór pięciu akcentów hiszpańskich z Ameryki Łacińskiej: argentyński, kolumbijski, chilijski, peruwiański i wenezuelski. Do rozwiązania problemu wykorzystano 3 różne podejścia. Na początku wyodrębniono globalne parametry statystyczne obliczone na niskopoziomowych cechach akustycznych, dostępne w zestawach cech: eGeMAPSv02 oraz ComParE w obrębie biblioteki OpenSMILE [6]. Klasyfikacja cech została przeprowadzona za pomocą modeli SVM oraz głębokich sieci neuronowych. Następnie z nagrań pozyskano Mel-spektrogramy oraz podjęto próbę klasyfikacji za pomocą sieci konwolucyjnych. Ostatnim podejściem był Transfer Learning. Zbadano możliwość klasyfikacji cech-zagnieżdżeń uzyskanych poprzez przeprocesowanie nagrań przez pre-trenowane modele wav2vec 2.0 oraz Yamnet. Najlepsze wyniki uzyskano wykorzystując zestawy cech akustycznych eGeMAPSv02 oraz ComParE. Podejście z Melspektrogramami wygląda obiecująco, jednak problemem wydaje się zbyt mała ilość danych. Udało się uzyskać pewne sensowne wyniki z zagnieżdżeniami Yamnet, natomiast wykorzystanie zagnieżdżeń wav2vec 2.0 nie przyniosło pomyślnych rezultatów i wymaga dalszych badań.	pl_PL
dc.language.iso	other	pl_PL
dc.relation.ispartofseries	;Nr 7144
dc.subject	rozpoznawanie akcentu	pl_PL
dc.subject	eGeMAPSv02	pl_PL
dc.subject	ComParE	pl_PL
dc.subject	OpenSMILE	pl_PL
dc.subject	Mel-spektrogram	pl_PL
dc.subject	wav2vec	pl_PL
dc.subject	Yamnet	pl_PL
dc.title	Automatyczne rozpoznawanie akcentu z wykorzystaniem uczenia maszynowego	pl_PL
dc.title.alternative	Automatic accent recognition using machine learning	pl_PL
dc.type	Thesis	pl_PL