Streszczenie:
Tematem pracy jest zbadanie możliwości stworzenia oprogramowania automatycznie dopasowującego zadany tekst do utworu muzycznego i tworzącego ścieżkę napisów w dowolnym formacie. Pomysł projektu wynika z osobistego doświadczenia autora. Występowanie w utworach akompaniamentu muzycznego w połączeniu z zmienną formą wokalną sprawia, że człowiek pierwszy raz słuchając utworu nie zawsze jest w stanie poprawnie rozpoznać wszystkie występujące w nim słowa. Jednak posiadanie tekstu utworu jest wystarczające by proces ten był łatwiejszy. Zależność ta jest szczególnie odczuwana w przypadku utworów w języku innym niż ojczysty. Dotyczy to zarówno utworów z prostą linią melodyczną jak i posiadających wokale zniekształcone syntezatorami lub śpiewanymi nieczysto, jak np. growl (Kato i Ito, 2013) . W tej pracy autor podjął próbę zbadania tematyki rozpoznawania śpiewu przez systemy komputerowe. Poddane zostało analizie czy obecna technologia cechuje się podobnymi jak człowiek problemami z przypisaniem tekstu do mowy w muzyce i zbadana została możliwość stworzenia systemu generującego napisy do zadanego utworu muzycznego automatycznie. Każdy analizowany proces został także oceniony pod kątem komercyjnego zastosowania oraz generowanych kosztów.