Multimediální zpracování signálů

| Kategorie: Diplomové, bakalářské práce  | Tento dokument chci!

Diplomová práce se zabývá vytvořením vhodných multimediálních podkladů z oblasti signálů a soustav se spojitým časem. Pochopení této problematiky je velmi důležité, neboť povinný předmět Signály a soustavy, resp. BSIS, je vyučován na bakalářském stupni oboru EST. Porozumění vyučované látky je nezbytnou prerekvizitou v dalších předmětech k úspěšnému zvládnutí navazující látky. Další část diplomové práce je zaměřena na jednorozměrné diskrétní signály. Konkrétně si klade za cíl realizaci softwarového systému. Navržený systém disponuje jak základními operacemi (energie signálu, počet průchodů nulou atd.) se zvukovými soubory, tak i funkcemi složitějšími, mezi které se řadí např. vyhledávání samohlásek v plynulé řeči. Systém je rozdělen na dvě části. První program analyzuje právě zvukové soubory, vytváří nový zvukový soubor s hledanou samohláskou a soubory s potřebnými parametry pro další zpracování. Druhý program analyzuje získaná data, která následně statisticky vyhodnocuje. Výsledný systém může být užitečný pro identifikaci mluvčího, jeho emočního stavu atd.

Vydal: FEKT VUT Brno Autor: Miroslav Staněk

Strana 35 z 79

Vámi hledaný text obsahuje tato stránku dokumentu který není autorem určen k veřejnému šíření.

Jak získat tento dokument?






Poznámky redaktora
Spotřeba vydechovaného vzduchu závisí na produkované hlásce. Krčmová uvádí [11], je také možné vyslovit některé výrazy při nádechu. Tab. Spotřeba vzduchu řečníka také mění s hlasitostí jeho projevu. možné ji charakterizovat jako souvislý, časově proměnný proces, nesoucí zakódovanou informaci mechanickým, akustickým, vlnění řečníka příjemci. Následující text věnován samotné realizaci funkcím vyprodukovaného softwarového systému. Poslední oblastí mluvního ústrojí modifikující část. Funkce vytvořeného softwarového systému byly vždy konzultovány vedoucím práce tak, aby bylo možné program užívat dalších užitečných aplikacích.24 5. 5. Obecně vnímá posluchač řečový signál jako sled hlásek. Formanty českých samohlásek [12].1 Řečový signál Řeč lidským projevem, sloužící především komunikaci. Nejvíce vzduchu plic vlastní tvorbě spotřebují hlásky /a/, /e/, /h/, /f/, /s/, nejméně pak samohlásky /u/ /i/. Zde produkovaný základní tón prochází přes různé dutiny orgány. Tyto výrazy jsou především citoslovečného charakteru, např. Dýchání dvě fáze (nádech výdech). Pomocí rezonancí dutině hrdelní, ústní nosní vznikají spektru řečového signálu lokální maxima -formanty F1, F3. Tato činnost charakterizuje základní tón každého hlasu znělé resp. Většina produkovaných hlásek interpretována fázi výdechu. „au“. Tato poslední část nejvíce ovlivňuje výsledný charakter řeči. tomto ústrojí se vzduch uvádí poprvé pohybu, tedy splněna první podmínka produkce řeči. Dýchací ústrojí zároveň slouží základní životní funkci- dýchání. V hlasovém ústrojí, nacházejícím hrtanu, prostupuje vzduch plic přes hlasivky, které buď smršťují, nebo roztahují. Při mluvené řeči dýchací frekvence poměr mezi nádechem výdechem odlišný fyziologického dýchání. Řeč zde získává svou barvu základě fyziologických proporcí dutin mluvčího, kde základní tón rezonuje. Softwarový systém Druhou částí diplomové práce byla realizace softwarového systému, vhodného k zpracování jednorozměrných diskrétních signálů. neznělé úseky řeči [11]. Samohláska [Hz] [Hz] [Hz] I 300 500 2000 2800 2600 3500 E 480 700 1560 2100 2500 3000 A 700 1100 1100 1500 2500 3000 O 500 700 850 1200 2500 3000 U 300 500 600 1000 2400 2900 . Obvyklé hodnoty formantů českých samohlásek jsou uvedeny tabulce Dále řeč ovlivněna činností rtů (ovlivnění rezonance ústní dutiny) jazyka (především výslovnost). Při řeči dochází k markantnímu zkrácení vdechu, naopak výraznému prodloužení výdechu