Poprawa jakości nagrań mowy jako metoda wspierająca uczenie maszynowe

Repozytorium PJATK
→
Wydział Informatyki / Faculty of Information Technology
→
Praca magisterska - Data Science 2021
→
Zobacz pozycję

dc.contributor.author	Dmochowski, Mariusz
dc.date.accessioned	2023-01-02T11:48:33Z
dc.date.available	2023-01-02T11:48:33Z
dc.date.issued	2023-01-02
dc.identifier.issn	2021/M/DS/31
dc.identifier.uri	https://repin.pjwstk.edu.pl/xmlui/handle/186319/2069
dc.description.abstract	Głównym celem pracy magisterskiej pod tytułem “Poprawa jakości nagrań mowy jako metoda wspierająca uczenie maszynowe” jest zaprojektowanie modelu opartego o głębokie sieci neuronowe, który sprawdzi możliwości polepszenia jakości mowy dla jej dalszego zastosowania w innych systemach uczenia maszynowego. Rozdział 3 daje przegląd współczesnych metod stosowanych w tego typu zadaniach. Zaczynając od metod klasycznych, poprzez te oparte o uczenie maszynowe, a na głębokich sieciach neuronowych kończąc, autor chciał pokazać przesłanki motywujące do dalszego szukania rozwiązania dla postawionego w tytule problemu. Rozdział 4 pt. “Cykl eksperymentu” nakreśla przyjętą metodykę pracy nad tematem. W rozdziale 5 opisane są trudności, które można napotkać przy wyborze odpowiedniej metryki oceniającej jakość poprawianej mowy. Rozdział 6 krótko opisuje wady i zalety pracy w dziedzinie częstotliwości jak i czasu. Opisane są w nim też motywacje autora stojące za wyborem konkretnych rozwiązań w czasie projektowania eksperymentów z rozdziałów 7, 8. Rozdział 7 jest opisem eksperymentu na dwóch wariacjach autoenkodera wykonanego przez autora. Najlepsze wyniki osiągnęła sieć Unet. Oprócz tego testowano sieć GAN jak i głęboką zespoloną sieć neuronową, ale nie dały spodziewanych rezultatów.	pl_PL
dc.language.iso	other	pl_PL
dc.relation.ispartofseries	;Nr 6349
dc.subject	autoenkoder	pl_PL
dc.subject	cyfrowe przetwarzanie sygnałów	pl_PL
dc.subject	głębokie sieci neuronowe	pl_PL
dc.subject	odszumianie dźwięku mowy	pl_PL
dc.subject	uczenie maszynowe	pl_PL
dc.subject	wzbogacanie mowy	pl_PL
dc.title	Poprawa jakości nagrań mowy jako metoda wspierająca uczenie maszynowe	pl_PL
dc.title.alternative	Speech audio enhancement as a method for improving machine learning	pl_PL
dc.type	Thesis	pl_PL