Streszczenie:
Głównym celem pracy magisterskiej pod tytułem “Poprawa jakości nagrań mowy jako
metoda wspierająca uczenie maszynowe” jest zaprojektowanie modelu opartego o głębokie
sieci neuronowe, który sprawdzi możliwości polepszenia jakości mowy dla jej dalszego
zastosowania w innych systemach uczenia maszynowego.
Rozdział 3 daje przegląd współczesnych metod stosowanych w tego typu zadaniach.
Zaczynając od metod klasycznych, poprzez te oparte o uczenie maszynowe, a na głębokich
sieciach neuronowych kończąc, autor chciał pokazać przesłanki motywujące do dalszego
szukania rozwiązania dla postawionego w tytule problemu.
Rozdział 4 pt. “Cykl eksperymentu” nakreśla przyjętą metodykę pracy nad tematem.
W rozdziale 5 opisane są trudności, które można napotkać przy wyborze odpowiedniej
metryki oceniającej jakość poprawianej mowy.
Rozdział 6 krótko opisuje wady i zalety pracy w dziedzinie częstotliwości jak i czasu.
Opisane są w nim też motywacje autora stojące za wyborem konkretnych rozwiązań w czasie
projektowania eksperymentów z rozdziałów 7, 8.
Rozdział 7 jest opisem eksperymentu na dwóch wariacjach autoenkodera wykonanego przez
autora. Najlepsze wyniki osiągnęła sieć Unet. Oprócz tego testowano sieć GAN jak i głęboką
zespoloną sieć neuronową, ale nie dały spodziewanych rezultatów.