Multimediální zpracování signálů

| Kategorie: Diplomové, bakalářské práce  | Tento dokument chci!

Diplomová práce se zabývá vytvořením vhodných multimediálních podkladů z oblasti signálů a soustav se spojitým časem. Pochopení této problematiky je velmi důležité, neboť povinný předmět Signály a soustavy, resp. BSIS, je vyučován na bakalářském stupni oboru EST. Porozumění vyučované látky je nezbytnou prerekvizitou v dalších předmětech k úspěšnému zvládnutí navazující látky. Další část diplomové práce je zaměřena na jednorozměrné diskrétní signály. Konkrétně si klade za cíl realizaci softwarového systému. Navržený systém disponuje jak základními operacemi (energie signálu, počet průchodů nulou atd.) se zvukovými soubory, tak i funkcemi složitějšími, mezi které se řadí např. vyhledávání samohlásek v plynulé řeči. Systém je rozdělen na dvě části. První program analyzuje právě zvukové soubory, vytváří nový zvukový soubor s hledanou samohláskou a soubory s potřebnými parametry pro další zpracování. Druhý program analyzuje získaná data, která následně statisticky vyhodnocuje. Výsledný systém může být užitečný pro identifikaci mluvčího, jeho emočního stavu atd.

Vydal: FEKT VUT Brno Autor: Miroslav Staněk

Strana 35 z 79

Vámi hledaný text obsahuje tato stránku dokumentu který není autorem určen k veřejnému šíření.

Jak získat tento dokument?






Poznámky redaktora
1 Řečový signál Řeč lidským projevem, sloužící především komunikaci. Tato činnost charakterizuje základní tón každého hlasu znělé resp. Při řeči dochází k markantnímu zkrácení vdechu, naopak výraznému prodloužení výdechu. neznělé úseky řeči [11]. Obecně vnímá posluchač řečový signál jako sled hlásek. Většina produkovaných hlásek interpretována fázi výdechu. Tyto výrazy jsou především citoslovečného charakteru, např. Funkce vytvořeného softwarového systému byly vždy konzultovány vedoucím práce tak, aby bylo možné program užívat dalších užitečných aplikacích. Nejvíce vzduchu plic vlastní tvorbě spotřebují hlásky /a/, /e/, /h/, /f/, /s/, nejméně pak samohlásky /u/ /i/. Obvyklé hodnoty formantů českých samohlásek jsou uvedeny tabulce Dále řeč ovlivněna činností rtů (ovlivnění rezonance ústní dutiny) jazyka (především výslovnost). Zde produkovaný základní tón prochází přes různé dutiny orgány. tomto ústrojí se vzduch uvádí poprvé pohybu, tedy splněna první podmínka produkce řeči. Pomocí rezonancí dutině hrdelní, ústní nosní vznikají spektru řečového signálu lokální maxima -formanty F1, F3. Dýchací ústrojí zároveň slouží základní životní funkci- dýchání. Spotřeba vzduchu řečníka také mění s hlasitostí jeho projevu. Krčmová uvádí [11], je také možné vyslovit některé výrazy při nádechu. Následující text věnován samotné realizaci funkcím vyprodukovaného softwarového systému. Při mluvené řeči dýchací frekvence poměr mezi nádechem výdechem odlišný fyziologického dýchání. 5.24 5. Tato poslední část nejvíce ovlivňuje výsledný charakter řeči. Spotřeba vydechovaného vzduchu závisí na produkované hlásce. „au“. V hlasovém ústrojí, nacházejícím hrtanu, prostupuje vzduch plic přes hlasivky, které buď smršťují, nebo roztahují. Dýchání dvě fáze (nádech výdech). Formanty českých samohlásek [12]. Tab. Softwarový systém Druhou částí diplomové práce byla realizace softwarového systému, vhodného k zpracování jednorozměrných diskrétních signálů. Samohláska [Hz] [Hz] [Hz] I 300 500 2000 2800 2600 3500 E 480 700 1560 2100 2500 3000 A 700 1100 1100 1500 2500 3000 O 500 700 850 1200 2500 3000 U 300 500 600 1000 2400 2900 . možné ji charakterizovat jako souvislý, časově proměnný proces, nesoucí zakódovanou informaci mechanickým, akustickým, vlnění řečníka příjemci. Řeč zde získává svou barvu základě fyziologických proporcí dutin mluvčího, kde základní tón rezonuje. Poslední oblastí mluvního ústrojí modifikující část