|
Kategorie: Diplomové, bakalářské práce |
Tento dokument chci!
Diplomová práce se zabývá vytvořením vhodných multimediálních podkladů z oblasti signálů a soustav se spojitým časem. Pochopení této problematiky je velmi důležité, neboť povinný předmět Signály a soustavy, resp. BSIS, je vyučován na bakalářském stupni oboru EST. Porozumění vyučované látky je nezbytnou prerekvizitou v dalších předmětech k úspěšnému zvládnutí navazující látky. Další část diplomové práce je zaměřena na jednorozměrné diskrétní signály. Konkrétně si klade za cíl realizaci softwarového systému. Navržený systém disponuje jak základními operacemi (energie signálu, počet průchodů nulou atd.) se zvukovými soubory, tak i funkcemi složitějšími, mezi které se řadí např. vyhledávání samohlásek v plynulé řeči. Systém je rozdělen na dvě části. První program analyzuje právě zvukové soubory, vytváří nový zvukový soubor s hledanou samohláskou a soubory s potřebnými parametry pro další zpracování. Druhý program analyzuje získaná data, která následně statisticky vyhodnocuje. Výsledný systém může být užitečný pro identifikaci mluvčího, jeho emočního stavu atd.
Vytěžená data užitečného úseku jsou uložena příslušná místa maticích. Pořadí sloupku matice odpovídá
i pořadí užitečného úseku. Příslušná data analyzovaném
užitečném segmentu jsou uložena paměti, kde jsou při posledním ukládacím kroku
zpracována zvukový soubor. Pro užitečný úsek dochází dodatečnému vypočítání LSP koeficientů pomocí
LPC koeficientů. Nejčastějším způsobem
určení samohlásky využití jejich téměř periodického průběhu času. Důkladněji tato metoda popsána literatuře,
např. Zbylé parametry řečového signálu jsou umístěny vhodné
pozice matice.
V této práci jsou však samohlásky vyhledávány základě polohy formantů LPC
spektru.
Vždy pro jeden úsek alokován jeden sloupek matice.
Pojmenování vytvořených souborů obsahuje název hledané samohlásky, zadaný
název souboru, místní datum čas.
Ani průběh zvukového signálu není zapomenut. Kvůli rychlejšímu přehlednějšímu přístupu datům jsou získané
parametry matice duplikovány. Při ukládání finálního zvukového souboru mezi
každých 160 vzorků užitečného zvukového signálu vloženo vzorků nul. výsledném datovém souboru jsou uloženy jak matice
hodnot pro jednotlivé metody, tak objemnější matice, obsahující doposud všechny
obdržené výsledky.
mat='matice';
datetime=datestr(now);
datetime=strrep(datetime,':','_');%nahrazeni dvojtecky podrtzitkem
datetime=strrep(datetime,'-','_');%stejne tak pomlcky
datetime=strrep(datetime,' ','_');%a mezery
voweldatetime= strcat(vowel,'_',name,'_',datetime);
matf= strcat(mat,voweldatetime);
save(voweldatetime,'descF','maticeF','descAf','maticeAf','descIfd',
'maticeIfd','descIfh','maticeIfh','maticeLSP','maticeLPC','maticeB'
);
save(matf, 'maticeSamples');
wavwrite(maticeSound,Fs,bit,voweldatetime);
[rdk slp]=size(maticeF); %zjisteni kolik vzorku bylo nalezeno
.1. Vložení této
mezery mezi jednotlivé segmenty slouží lepší orientaci pro případné další zpracování
vytvořeného souboru.34
6. Je-li analyzovaném úseku
zaznamenán výskyt prvních dvou formantů, které nacházejí svých obvyklých
frekvenčních pásmech pro danou samohlásku, klasifikován zkoumaný úsek jako
užitečný. Podmínkou pro stanovení analyzovaného úseku užitečným výskyt prvních
dvou formantů. První formant vzniká pomocí rezonance dutiny ústní. [15]. Vytvoření nových souborů dat příslušnými názvy
zajišťuje následující část zdrojového kódu.2 Vyhledávání samohlásek
Úseky vyslovených samohlásek lze určit několika způsoby. tomuto účelu
se využívá kritérium AMDF (Average Magnitude DifferenceFunction), které slouží
k odhadu periody základního tónu řeči. Rezonancí
základního tónu dutině hrdelní vzniká formant F2