dc.contributor.author |
Dmochowski, Mariusz |
|
dc.date.accessioned |
2023-01-02T11:48:33Z |
|
dc.date.available |
2023-01-02T11:48:33Z |
|
dc.date.issued |
2023-01-02 |
|
dc.identifier.issn |
2021/M/DS/31 |
|
dc.identifier.uri |
https://repin.pjwstk.edu.pl/xmlui/handle/186319/2069 |
|
dc.description.abstract |
Głównym celem pracy magisterskiej pod tytułem “Poprawa jakości nagrań mowy jako
metoda wspierająca uczenie maszynowe” jest zaprojektowanie modelu opartego o głębokie
sieci neuronowe, który sprawdzi możliwości polepszenia jakości mowy dla jej dalszego
zastosowania w innych systemach uczenia maszynowego.
Rozdział 3 daje przegląd współczesnych metod stosowanych w tego typu zadaniach.
Zaczynając od metod klasycznych, poprzez te oparte o uczenie maszynowe, a na głębokich
sieciach neuronowych kończąc, autor chciał pokazać przesłanki motywujące do dalszego
szukania rozwiązania dla postawionego w tytule problemu.
Rozdział 4 pt. “Cykl eksperymentu” nakreśla przyjętą metodykę pracy nad tematem.
W rozdziale 5 opisane są trudności, które można napotkać przy wyborze odpowiedniej
metryki oceniającej jakość poprawianej mowy.
Rozdział 6 krótko opisuje wady i zalety pracy w dziedzinie częstotliwości jak i czasu.
Opisane są w nim też motywacje autora stojące za wyborem konkretnych rozwiązań w czasie
projektowania eksperymentów z rozdziałów 7, 8.
Rozdział 7 jest opisem eksperymentu na dwóch wariacjach autoenkodera wykonanego przez
autora. Najlepsze wyniki osiągnęła sieć Unet. Oprócz tego testowano sieć GAN jak i głęboką
zespoloną sieć neuronową, ale nie dały spodziewanych rezultatów. |
pl_PL |
dc.language.iso |
other |
pl_PL |
dc.relation.ispartofseries |
;Nr 6349 |
|
dc.subject |
autoenkoder |
pl_PL |
dc.subject |
cyfrowe przetwarzanie sygnałów |
pl_PL |
dc.subject |
głębokie sieci neuronowe |
pl_PL |
dc.subject |
odszumianie dźwięku mowy |
pl_PL |
dc.subject |
uczenie maszynowe |
pl_PL |
dc.subject |
wzbogacanie mowy |
pl_PL |
dc.title |
Poprawa jakości nagrań mowy jako metoda wspierająca uczenie maszynowe |
pl_PL |
dc.title.alternative |
Speech audio enhancement as a method for improving machine learning |
pl_PL |
dc.type |
Thesis |
pl_PL |