Multimediální zpracování signálů

| Kategorie: Diplomové, bakalářské práce  | Tento dokument chci!

Diplomová práce se zabývá vytvořením vhodných multimediálních podkladů z oblasti signálů a soustav se spojitým časem. Pochopení této problematiky je velmi důležité, neboť povinný předmět Signály a soustavy, resp. BSIS, je vyučován na bakalářském stupni oboru EST. Porozumění vyučované látky je nezbytnou prerekvizitou v dalších předmětech k úspěšnému zvládnutí navazující látky. Další část diplomové práce je zaměřena na jednorozměrné diskrétní signály. Konkrétně si klade za cíl realizaci softwarového systému. Navržený systém disponuje jak základními operacemi (energie signálu, počet průchodů nulou atd.) se zvukovými soubory, tak i funkcemi složitějšími, mezi které se řadí např. vyhledávání samohlásek v plynulé řeči. Systém je rozdělen na dvě části. První program analyzuje právě zvukové soubory, vytváří nový zvukový soubor s hledanou samohláskou a soubory s potřebnými parametry pro další zpracování. Druhý program analyzuje získaná data, která následně statisticky vyhodnocuje. Výsledný systém může být užitečný pro identifikaci mluvčího, jeho emočního stavu atd.

Vydal: FEKT VUT Brno Autor: Miroslav Staněk

Strana 37 z 79

Vámi hledaný text obsahuje tato stránku dokumentu který není autorem určen k veřejnému šíření.

Jak získat tento dokument?






Poznámky redaktora
Hlasivky vytvářejí tón požadované frekvenci intenzitě, který dále prochází krkem ústy. Dobu tohoto ustálení lze aproximovat pomocí malého počtu hodnot. Typickým počtem koeficientů lineární predikce hodnot. Tyto dvě části tvoří jakousi ozvučnici daného signálu a vytvářejí díky svým jedinečným proporcím odlišné rezonance pro jednotlivé mluvčí.26 prediktor adaptivní filtr nastavující své koeficienty dle průběhu procházejícího signálu tak, aby docházelo právě predikci filtru jeho předpovídání). Jeho budiče, rezonátory další součásti [13]. Pokud je hlasový signál digitálně zpracován vzorkovacím kmitočtem fvz= kHz, zjišťujeme, že pseudo-stacionarita hlasivek trvá 240 vzorků signálu. (5) . když se lidská mluva jeví souvislou, hlasivky potřebují svému přeuspořádání jiného tvaru cca ms. McLoughlin [13] uvádí, díky pohybu hlasového ústrojí řečový signál tvarován. Matematicky lze artikulační ústrojí vyjádřit přenosovou funkcí filtru (3) kde A(z) polynom popisující lineární predikci vztahem (4) kde řád polynomu, resp. 24: Znázornění lidského hlasového aparátu. Hlasivky jsou svalem, tak nemohou pohybovat nekonečně rychle. Obrázek prezentuje nejvýznamnější části lidského vokálního aparátu, které ovlivňují cestu vygenerovaného signálu hlasivek interpretovaný zvuk úst. lineární predikce, popsaný rovnicí . tuto dobu tedy zůstávají hlasivky pseudo-stacionárními. Zpracování řeči pomocí lineární predikce vychází předpokladu, hlasový signál je generován hlasivkami. Obr