Streszczenie:
Konwolucyjne sieci neuronowe stanowią obecnie jedne z najlepszych
rozwiązań do budowy modeli klasyfikujących dźwięk. W niniejszej pracy autor
przedstawił proces tworzenia klasyfikatora gatunków ptaków na podstawie
wydawanych przez nie odgłosów, a także zarysował historyczne i aktualne
zagadnienia związane z tą dziedziną. Trzy zestawy danych zostały opracowane
na podstawie nagrań pozyskanych z serwisu Xeno-Canto.org. W celu
przeciwdziałania zjawisku szumu etykiet zastosowano klastrowanie, powiększanie
danych (data augemntation) i ręczną edycję próbek dźwięku. Model
opracowany wynikiem tych prac rozróżnia 15 gatunków ptaków i może być
łatwo rozbudowany.