Multimediální zpracování signálů

| Kategorie: Diplomové, bakalářské práce  | Tento dokument chci!

Diplomová práce se zabývá vytvořením vhodných multimediálních podkladů z oblasti signálů a soustav se spojitým časem. Pochopení této problematiky je velmi důležité, neboť povinný předmět Signály a soustavy, resp. BSIS, je vyučován na bakalářském stupni oboru EST. Porozumění vyučované látky je nezbytnou prerekvizitou v dalších předmětech k úspěšnému zvládnutí navazující látky. Další část diplomové práce je zaměřena na jednorozměrné diskrétní signály. Konkrétně si klade za cíl realizaci softwarového systému. Navržený systém disponuje jak základními operacemi (energie signálu, počet průchodů nulou atd.) se zvukovými soubory, tak i funkcemi složitějšími, mezi které se řadí např. vyhledávání samohlásek v plynulé řeči. Systém je rozdělen na dvě části. První program analyzuje právě zvukové soubory, vytváří nový zvukový soubor s hledanou samohláskou a soubory s potřebnými parametry pro další zpracování. Druhý program analyzuje získaná data, která následně statisticky vyhodnocuje. Výsledný systém může být užitečný pro identifikaci mluvčího, jeho emočního stavu atd.

Vydal: FEKT VUT Brno Autor: Miroslav Staněk

Strana 45 z 79

Vámi hledaný text obsahuje tato stránku dokumentu který není autorem určen k veřejnému šíření.

Jak získat tento dokument?






Poznámky redaktora
1.2 Vyhledávání samohlásek Úseky vyslovených samohlásek lze určit několika způsoby.34 6. Vždy pro jeden úsek alokován jeden sloupek matice. Podmínkou pro stanovení analyzovaného úseku užitečným výskyt prvních dvou formantů. Pořadí sloupku matice odpovídá i pořadí užitečného úseku. výsledném datovém souboru jsou uloženy jak matice hodnot pro jednotlivé metody, tak objemnější matice, obsahující doposud všechny obdržené výsledky. [15]. Zbylé parametry řečového signálu jsou umístěny vhodné pozice matice. Ani průběh zvukového signálu není zapomenut. Při ukládání finálního zvukového souboru mezi každých 160 vzorků užitečného zvukového signálu vloženo vzorků nul. První formant vzniká pomocí rezonance dutiny ústní. V této práci jsou však samohlásky vyhledávány základě polohy formantů LPC spektru. Pojmenování vytvořených souborů obsahuje název hledané samohlásky, zadaný název souboru, místní datum čas. Příslušná data analyzovaném užitečném segmentu jsou uložena paměti, kde jsou při posledním ukládacím kroku zpracována zvukový soubor. Rezonancí základního tónu dutině hrdelní vzniká formant F2. Nejčastějším způsobem určení samohlásky využití jejich téměř periodického průběhu času. Vložení této mezery mezi jednotlivé segmenty slouží lepší orientaci pro případné další zpracování vytvořeného souboru. Je-li analyzovaném úseku zaznamenán výskyt prvních dvou formantů, které nacházejí svých obvyklých frekvenčních pásmech pro danou samohlásku, klasifikován zkoumaný úsek jako užitečný. Kvůli rychlejšímu přehlednějšímu přístupu datům jsou získané parametry matice duplikovány. Pro užitečný úsek dochází dodatečnému vypočítání LSP koeficientů pomocí LPC koeficientů. mat='matice'; datetime=datestr(now); datetime=strrep(datetime,':','_');%nahrazeni dvojtecky podrtzitkem datetime=strrep(datetime,'-','_');%stejne tak pomlcky datetime=strrep(datetime,' ','_');%a mezery voweldatetime= strcat(vowel,'_',name,'_',datetime); matf= strcat(mat,voweldatetime); save(voweldatetime,'descF','maticeF','descAf','maticeAf','descIfd', 'maticeIfd','descIfh','maticeIfh','maticeLSP','maticeLPC','maticeB' ); save(matf, 'maticeSamples'); wavwrite(maticeSound,Fs,bit,voweldatetime); [rdk slp]=size(maticeF); %zjisteni kolik vzorku bylo nalezeno . Vytěžená data užitečného úseku jsou uložena příslušná místa maticích. tomuto účelu se využívá kritérium AMDF (Average Magnitude DifferenceFunction), které slouží k odhadu periody základního tónu řeči. Vytvoření nových souborů dat příslušnými názvy zajišťuje následující část zdrojového kódu. Důkladněji tato metoda popsána literatuře, např