Multimediální zpracování signálů

| Kategorie: Diplomové, bakalářské práce  | Tento dokument chci!

Diplomová práce se zabývá vytvořením vhodných multimediálních podkladů z oblasti signálů a soustav se spojitým časem. Pochopení této problematiky je velmi důležité, neboť povinný předmět Signály a soustavy, resp. BSIS, je vyučován na bakalářském stupni oboru EST. Porozumění vyučované látky je nezbytnou prerekvizitou v dalších předmětech k úspěšnému zvládnutí navazující látky. Další část diplomové práce je zaměřena na jednorozměrné diskrétní signály. Konkrétně si klade za cíl realizaci softwarového systému. Navržený systém disponuje jak základními operacemi (energie signálu, počet průchodů nulou atd.) se zvukovými soubory, tak i funkcemi složitějšími, mezi které se řadí např. vyhledávání samohlásek v plynulé řeči. Systém je rozdělen na dvě části. První program analyzuje právě zvukové soubory, vytváří nový zvukový soubor s hledanou samohláskou a soubory s potřebnými parametry pro další zpracování. Druhý program analyzuje získaná data, která následně statisticky vyhodnocuje. Výsledný systém může být užitečný pro identifikaci mluvčího, jeho emočního stavu atd.

Vydal: FEKT VUT Brno Autor: Miroslav Staněk

Strana 45 z 79

Vámi hledaný text obsahuje tato stránku dokumentu který není autorem určen k veřejnému šíření.

Jak získat tento dokument?






Poznámky redaktora
První formant vzniká pomocí rezonance dutiny ústní. Důkladněji tato metoda popsána literatuře, např. Nejčastějším způsobem určení samohlásky využití jejich téměř periodického průběhu času. Pojmenování vytvořených souborů obsahuje název hledané samohlásky, zadaný název souboru, místní datum čas. Příslušná data analyzovaném užitečném segmentu jsou uložena paměti, kde jsou při posledním ukládacím kroku zpracována zvukový soubor. Podmínkou pro stanovení analyzovaného úseku užitečným výskyt prvních dvou formantů. Ani průběh zvukového signálu není zapomenut.34 6. tomuto účelu se využívá kritérium AMDF (Average Magnitude DifferenceFunction), které slouží k odhadu periody základního tónu řeči. V této práci jsou však samohlásky vyhledávány základě polohy formantů LPC spektru. mat='matice'; datetime=datestr(now); datetime=strrep(datetime,':','_');%nahrazeni dvojtecky podrtzitkem datetime=strrep(datetime,'-','_');%stejne tak pomlcky datetime=strrep(datetime,' ','_');%a mezery voweldatetime= strcat(vowel,'_',name,'_',datetime); matf= strcat(mat,voweldatetime); save(voweldatetime,'descF','maticeF','descAf','maticeAf','descIfd', 'maticeIfd','descIfh','maticeIfh','maticeLSP','maticeLPC','maticeB' ); save(matf, 'maticeSamples'); wavwrite(maticeSound,Fs,bit,voweldatetime); [rdk slp]=size(maticeF); %zjisteni kolik vzorku bylo nalezeno . Pro užitečný úsek dochází dodatečnému vypočítání LSP koeficientů pomocí LPC koeficientů. Vytvoření nových souborů dat příslušnými názvy zajišťuje následující část zdrojového kódu. Pořadí sloupku matice odpovídá i pořadí užitečného úseku. Vždy pro jeden úsek alokován jeden sloupek matice.2 Vyhledávání samohlásek Úseky vyslovených samohlásek lze určit několika způsoby. Vložení této mezery mezi jednotlivé segmenty slouží lepší orientaci pro případné další zpracování vytvořeného souboru.1. Rezonancí základního tónu dutině hrdelní vzniká formant F2. Je-li analyzovaném úseku zaznamenán výskyt prvních dvou formantů, které nacházejí svých obvyklých frekvenčních pásmech pro danou samohlásku, klasifikován zkoumaný úsek jako užitečný. Vytěžená data užitečného úseku jsou uložena příslušná místa maticích. [15]. výsledném datovém souboru jsou uloženy jak matice hodnot pro jednotlivé metody, tak objemnější matice, obsahující doposud všechny obdržené výsledky. Zbylé parametry řečového signálu jsou umístěny vhodné pozice matice. Při ukládání finálního zvukového souboru mezi každých 160 vzorků užitečného zvukového signálu vloženo vzorků nul. Kvůli rychlejšímu přehlednějšímu přístupu datům jsou získané parametry matice duplikovány