Multimediální zpracování signálů

| Kategorie: Diplomové, bakalářské práce  | Tento dokument chci!

Diplomová práce se zabývá vytvořením vhodných multimediálních podkladů z oblasti signálů a soustav se spojitým časem. Pochopení této problematiky je velmi důležité, neboť povinný předmět Signály a soustavy, resp. BSIS, je vyučován na bakalářském stupni oboru EST. Porozumění vyučované látky je nezbytnou prerekvizitou v dalších předmětech k úspěšnému zvládnutí navazující látky. Další část diplomové práce je zaměřena na jednorozměrné diskrétní signály. Konkrétně si klade za cíl realizaci softwarového systému. Navržený systém disponuje jak základními operacemi (energie signálu, počet průchodů nulou atd.) se zvukovými soubory, tak i funkcemi složitějšími, mezi které se řadí např. vyhledávání samohlásek v plynulé řeči. Systém je rozdělen na dvě části. První program analyzuje právě zvukové soubory, vytváří nový zvukový soubor s hledanou samohláskou a soubory s potřebnými parametry pro další zpracování. Druhý program analyzuje získaná data, která následně statisticky vyhodnocuje. Výsledný systém může být užitečný pro identifikaci mluvčího, jeho emočního stavu atd.

Vydal: FEKT VUT Brno Autor: Miroslav Staněk

Strana 37 z 79

Vámi hledaný text obsahuje tato stránku dokumentu který není autorem určen k veřejnému šíření.

Jak získat tento dokument?






Poznámky redaktora
Obrázek prezentuje nejvýznamnější části lidského vokálního aparátu, které ovlivňují cestu vygenerovaného signálu hlasivek interpretovaný zvuk úst. 24: Znázornění lidského hlasového aparátu. Hlasivky jsou svalem, tak nemohou pohybovat nekonečně rychle. McLoughlin [13] uvádí, díky pohybu hlasového ústrojí řečový signál tvarován. Obr. lineární predikce, popsaný rovnicí . Hlasivky vytvářejí tón požadované frekvenci intenzitě, který dále prochází krkem ústy. Tyto dvě části tvoří jakousi ozvučnici daného signálu a vytvářejí díky svým jedinečným proporcím odlišné rezonance pro jednotlivé mluvčí. Typickým počtem koeficientů lineární predikce hodnot. když se lidská mluva jeví souvislou, hlasivky potřebují svému přeuspořádání jiného tvaru cca ms. (5) . tuto dobu tedy zůstávají hlasivky pseudo-stacionárními. Pokud je hlasový signál digitálně zpracován vzorkovacím kmitočtem fvz= kHz, zjišťujeme, že pseudo-stacionarita hlasivek trvá 240 vzorků signálu. Jeho budiče, rezonátory další součásti [13].26 prediktor adaptivní filtr nastavující své koeficienty dle průběhu procházejícího signálu tak, aby docházelo právě predikci filtru jeho předpovídání). Dobu tohoto ustálení lze aproximovat pomocí malého počtu hodnot. Matematicky lze artikulační ústrojí vyjádřit přenosovou funkcí filtru (3) kde A(z) polynom popisující lineární predikci vztahem (4) kde řád polynomu, resp. Zpracování řeči pomocí lineární predikce vychází předpokladu, hlasový signál je generován hlasivkami