Multimediální zpracování signálů

| Kategorie: Diplomové, bakalářské práce  | Tento dokument chci!

Diplomová práce se zabývá vytvořením vhodných multimediálních podkladů z oblasti signálů a soustav se spojitým časem. Pochopení této problematiky je velmi důležité, neboť povinný předmět Signály a soustavy, resp. BSIS, je vyučován na bakalářském stupni oboru EST. Porozumění vyučované látky je nezbytnou prerekvizitou v dalších předmětech k úspěšnému zvládnutí navazující látky. Další část diplomové práce je zaměřena na jednorozměrné diskrétní signály. Konkrétně si klade za cíl realizaci softwarového systému. Navržený systém disponuje jak základními operacemi (energie signálu, počet průchodů nulou atd.) se zvukovými soubory, tak i funkcemi složitějšími, mezi které se řadí např. vyhledávání samohlásek v plynulé řeči. Systém je rozdělen na dvě části. První program analyzuje právě zvukové soubory, vytváří nový zvukový soubor s hledanou samohláskou a soubory s potřebnými parametry pro další zpracování. Druhý program analyzuje získaná data, která následně statisticky vyhodnocuje. Výsledný systém může být užitečný pro identifikaci mluvčího, jeho emočního stavu atd.

Vydal: FEKT VUT Brno Autor: Miroslav Staněk

Strana 39 z 79

Vámi hledaný text obsahuje tato stránku dokumentu který není autorem určen k veřejnému šíření.

Jak získat tento dokument?






Poznámky redaktora
Výpočet MFCC následující: nejprve nutné vypočítat pomocí DFT spektrum signálu, které následně umocněno vynásobeno trojúhelníkovým filtrem.6 MFCC Melové koeficienty (Mel-Frequecy Cepstral Coefficients) jsou další vhodnou metodou k vytěžování řečových parametrů. Převodní vztahem lze spatřit, že jedná zlogaritmování frekvenční osy, kterou následně rozloží banka korektně navržených filtrů. obrázku patrné, filtry (trojúhelníky) jsou hustěji rozmístěny nižších frekvencích. 26: Rozložení filtrů frekvenční osu hertzech [14]. Obr. 5. Přepočet frekvence na melovou frekvenci provede následujícím vztahem (14) kde fMEL frekvence melech fHz hertzech. Takto upravená osa reprezentována melech. Obdržené hodnoty sečtou, zlogaritmují pomocí DCT jsou z nich vypočteny koeficienty. Hlavní myšlenka metody spočívá tom, že frekvenční lineární osa modifikována osu nelineární, která pro lidský sluch přirozenější.28 Obrázek ilustruje vzájemnou relaci mezi vyhlazeným LPC spektrem příslušnými spektrálními páry. Obr. Tedy přesně tam, kde lidské ucho nejvnímavější. 25: LPC spektrum (modře) svými odpovídajícími spektrálními páry (fialově).