Multimediální zpracování signálů

| Kategorie: Diplomové, bakalářské práce  | Tento dokument chci!

Diplomová práce se zabývá vytvořením vhodných multimediálních podkladů z oblasti signálů a soustav se spojitým časem. Pochopení této problematiky je velmi důležité, neboť povinný předmět Signály a soustavy, resp. BSIS, je vyučován na bakalářském stupni oboru EST. Porozumění vyučované látky je nezbytnou prerekvizitou v dalších předmětech k úspěšnému zvládnutí navazující látky. Další část diplomové práce je zaměřena na jednorozměrné diskrétní signály. Konkrétně si klade za cíl realizaci softwarového systému. Navržený systém disponuje jak základními operacemi (energie signálu, počet průchodů nulou atd.) se zvukovými soubory, tak i funkcemi složitějšími, mezi které se řadí např. vyhledávání samohlásek v plynulé řeči. Systém je rozdělen na dvě části. První program analyzuje právě zvukové soubory, vytváří nový zvukový soubor s hledanou samohláskou a soubory s potřebnými parametry pro další zpracování. Druhý program analyzuje získaná data, která následně statisticky vyhodnocuje. Výsledný systém může být užitečný pro identifikaci mluvčího, jeho emočního stavu atd.

Vydal: FEKT VUT Brno Autor: Miroslav Staněk

Strana 45 z 79

Vámi hledaný text obsahuje tato stránku dokumentu který není autorem určen k veřejnému šíření.

Jak získat tento dokument?






Poznámky redaktora
Ani průběh zvukového signálu není zapomenut. výsledném datovém souboru jsou uloženy jak matice hodnot pro jednotlivé metody, tak objemnější matice, obsahující doposud všechny obdržené výsledky. Příslušná data analyzovaném užitečném segmentu jsou uložena paměti, kde jsou při posledním ukládacím kroku zpracována zvukový soubor. mat='matice'; datetime=datestr(now); datetime=strrep(datetime,':','_');%nahrazeni dvojtecky podrtzitkem datetime=strrep(datetime,'-','_');%stejne tak pomlcky datetime=strrep(datetime,' ','_');%a mezery voweldatetime= strcat(vowel,'_',name,'_',datetime); matf= strcat(mat,voweldatetime); save(voweldatetime,'descF','maticeF','descAf','maticeAf','descIfd', 'maticeIfd','descIfh','maticeIfh','maticeLSP','maticeLPC','maticeB' ); save(matf, 'maticeSamples'); wavwrite(maticeSound,Fs,bit,voweldatetime); [rdk slp]=size(maticeF); %zjisteni kolik vzorku bylo nalezeno . Pořadí sloupku matice odpovídá i pořadí užitečného úseku. Vložení této mezery mezi jednotlivé segmenty slouží lepší orientaci pro případné další zpracování vytvořeného souboru. Pojmenování vytvořených souborů obsahuje název hledané samohlásky, zadaný název souboru, místní datum čas. Kvůli rychlejšímu přehlednějšímu přístupu datům jsou získané parametry matice duplikovány.34 6. První formant vzniká pomocí rezonance dutiny ústní. Zbylé parametry řečového signálu jsou umístěny vhodné pozice matice. [15]. Vytvoření nových souborů dat příslušnými názvy zajišťuje následující část zdrojového kódu. Pro užitečný úsek dochází dodatečnému vypočítání LSP koeficientů pomocí LPC koeficientů. V této práci jsou však samohlásky vyhledávány základě polohy formantů LPC spektru. Vytěžená data užitečného úseku jsou uložena příslušná místa maticích. Rezonancí základního tónu dutině hrdelní vzniká formant F2. Při ukládání finálního zvukového souboru mezi každých 160 vzorků užitečného zvukového signálu vloženo vzorků nul. Vždy pro jeden úsek alokován jeden sloupek matice.2 Vyhledávání samohlásek Úseky vyslovených samohlásek lze určit několika způsoby. Nejčastějším způsobem určení samohlásky využití jejich téměř periodického průběhu času. Podmínkou pro stanovení analyzovaného úseku užitečným výskyt prvních dvou formantů. Důkladněji tato metoda popsána literatuře, např.1. tomuto účelu se využívá kritérium AMDF (Average Magnitude DifferenceFunction), které slouží k odhadu periody základního tónu řeči. Je-li analyzovaném úseku zaznamenán výskyt prvních dvou formantů, které nacházejí svých obvyklých frekvenčních pásmech pro danou samohlásku, klasifikován zkoumaný úsek jako užitečný