Multimediální zpracování signálů

| Kategorie: Diplomové, bakalářské práce  | Tento dokument chci!

Diplomová práce se zabývá vytvořením vhodných multimediálních podkladů z oblasti signálů a soustav se spojitým časem. Pochopení této problematiky je velmi důležité, neboť povinný předmět Signály a soustavy, resp. BSIS, je vyučován na bakalářském stupni oboru EST. Porozumění vyučované látky je nezbytnou prerekvizitou v dalších předmětech k úspěšnému zvládnutí navazující látky. Další část diplomové práce je zaměřena na jednorozměrné diskrétní signály. Konkrétně si klade za cíl realizaci softwarového systému. Navržený systém disponuje jak základními operacemi (energie signálu, počet průchodů nulou atd.) se zvukovými soubory, tak i funkcemi složitějšími, mezi které se řadí např. vyhledávání samohlásek v plynulé řeči. Systém je rozdělen na dvě části. První program analyzuje právě zvukové soubory, vytváří nový zvukový soubor s hledanou samohláskou a soubory s potřebnými parametry pro další zpracování. Druhý program analyzuje získaná data, která následně statisticky vyhodnocuje. Výsledný systém může být užitečný pro identifikaci mluvčího, jeho emočního stavu atd.

Vydal: FEKT VUT Brno Autor: Miroslav Staněk

Strana 42 z 79

Vámi hledaný text obsahuje tato stránku dokumentu který není autorem určen k veřejnému šíření.

Jak získat tento dokument?






Poznámky redaktora
Po provedení segmentace jsou vždy prováděny operace aktuálním úsekem. vykreslení .\n')) end name=input('Please set the name analyzed file without extension: ','s') Po provedení nezbytných počátečních operací zvukovým souborem jsou programem provedeny další operace. Vytvořený program využívá rozdělení zvukového souboru bez vzájemného překrytí sousedních úseků. Následně jsou daném úseku vypočteny LPC koeficienty lineární predikce řádu 10, pomocí kterých vyhotoveno příslušné LPC spektrum. V případě, daný úsek vyhodnocen jako užitečný, společně svými parametry uložen. Pokud celkový počet vzorků signálu celočíselně nedělitelný délkou okna (160 vzorků), signál doplněn potřebný počet nul tak, aby byl celkový počet vzorků signálu bezezbytku dělitelný délkou okna. opačném případě úsek zapomenut identické operace jsou prováděny s následujícím úsekem. Obr.\n')) break; else disp(sprintf('The sound file OK. Na konci celého procesu daný úsek vyhodnocen jako užitečný nebo neužitečný. 28: Rozdíl mezi segmenty bez překrytím. Let analyze it.wav file. Program nejprve vypočte velikost šířky okna.31 break; disp(sprintf('Resampling done. Uvažujeme-li vzorkovací kmitočet fvz= kHz, získáváme jednotlivé segmenty analyzování délce 160 vzorků. Please start the program again with the resampled *. Rozdíl mezi překrývajícími segmenty oddělenými segmenty znázorněn obrázku 28, kde jsou červeně znázorněna okna délce překrytím ms, černě okna délce 20 bez překrytí. V našem případě soubor rozdělen krátké úseky délce ms. Na daném úseku nejprve signál normován tak, aby příslušná absolutní hodnota amplitudy daném úseku dosahovala úrovně Následně normovaný signál váhován Hammingovým oknem potlačení nežádoucích efektů kraji jednotlivých segmentů