Multimediální zpracování signálů

| Kategorie: Diplomové, bakalářské práce  | Tento dokument chci!

Diplomová práce se zabývá vytvořením vhodných multimediálních podkladů z oblasti signálů a soustav se spojitým časem. Pochopení této problematiky je velmi důležité, neboť povinný předmět Signály a soustavy, resp. BSIS, je vyučován na bakalářském stupni oboru EST. Porozumění vyučované látky je nezbytnou prerekvizitou v dalších předmětech k úspěšnému zvládnutí navazující látky. Další část diplomové práce je zaměřena na jednorozměrné diskrétní signály. Konkrétně si klade za cíl realizaci softwarového systému. Navržený systém disponuje jak základními operacemi (energie signálu, počet průchodů nulou atd.) se zvukovými soubory, tak i funkcemi složitějšími, mezi které se řadí např. vyhledávání samohlásek v plynulé řeči. Systém je rozdělen na dvě části. První program analyzuje právě zvukové soubory, vytváří nový zvukový soubor s hledanou samohláskou a soubory s potřebnými parametry pro další zpracování. Druhý program analyzuje získaná data, která následně statisticky vyhodnocuje. Výsledný systém může být užitečný pro identifikaci mluvčího, jeho emočního stavu atd.

Vydal: FEKT VUT Brno Autor: Miroslav Staněk

Strana 35 z 79

Vámi hledaný text obsahuje tato stránku dokumentu který není autorem určen k veřejnému šíření.

Jak získat tento dokument?






Poznámky redaktora
Formanty českých samohlásek [12]. možné ji charakterizovat jako souvislý, časově proměnný proces, nesoucí zakódovanou informaci mechanickým, akustickým, vlnění řečníka příjemci. Dýchání dvě fáze (nádech výdech). Obvyklé hodnoty formantů českých samohlásek jsou uvedeny tabulce Dále řeč ovlivněna činností rtů (ovlivnění rezonance ústní dutiny) jazyka (především výslovnost). Při řeči dochází k markantnímu zkrácení vdechu, naopak výraznému prodloužení výdechu.24 5. Tato poslední část nejvíce ovlivňuje výsledný charakter řeči. Funkce vytvořeného softwarového systému byly vždy konzultovány vedoucím práce tak, aby bylo možné program užívat dalších užitečných aplikacích. Následující text věnován samotné realizaci funkcím vyprodukovaného softwarového systému. 5. tomto ústrojí se vzduch uvádí poprvé pohybu, tedy splněna první podmínka produkce řeči. V hlasovém ústrojí, nacházejícím hrtanu, prostupuje vzduch plic přes hlasivky, které buď smršťují, nebo roztahují. Nejvíce vzduchu plic vlastní tvorbě spotřebují hlásky /a/, /e/, /h/, /f/, /s/, nejméně pak samohlásky /u/ /i/.1 Řečový signál Řeč lidským projevem, sloužící především komunikaci. neznělé úseky řeči [11]. Obecně vnímá posluchač řečový signál jako sled hlásek. Poslední oblastí mluvního ústrojí modifikující část. Tato činnost charakterizuje základní tón každého hlasu znělé resp. Většina produkovaných hlásek interpretována fázi výdechu. Spotřeba vzduchu řečníka také mění s hlasitostí jeho projevu. Zde produkovaný základní tón prochází přes různé dutiny orgány. Krčmová uvádí [11], je také možné vyslovit některé výrazy při nádechu. Spotřeba vydechovaného vzduchu závisí na produkované hlásce. Softwarový systém Druhou částí diplomové práce byla realizace softwarového systému, vhodného k zpracování jednorozměrných diskrétních signálů. Samohláska [Hz] [Hz] [Hz] I 300 500 2000 2800 2600 3500 E 480 700 1560 2100 2500 3000 A 700 1100 1100 1500 2500 3000 O 500 700 850 1200 2500 3000 U 300 500 600 1000 2400 2900 . Při mluvené řeči dýchací frekvence poměr mezi nádechem výdechem odlišný fyziologického dýchání. Tyto výrazy jsou především citoslovečného charakteru, např. Dýchací ústrojí zároveň slouží základní životní funkci- dýchání. Pomocí rezonancí dutině hrdelní, ústní nosní vznikají spektru řečového signálu lokální maxima -formanty F1, F3. „au“. Řeč zde získává svou barvu základě fyziologických proporcí dutin mluvčího, kde základní tón rezonuje. Tab