|
Kategorie: Diplomové, bakalářské práce |
Tento dokument chci!
Diplomová práce se zabývá vytvořením vhodných multimediálních podkladů z oblasti signálů a soustav se spojitým časem. Pochopení této problematiky je velmi důležité, neboť povinný předmět Signály a soustavy, resp. BSIS, je vyučován na bakalářském stupni oboru EST. Porozumění vyučované látky je nezbytnou prerekvizitou v dalších předmětech k úspěšnému zvládnutí navazující látky. Další část diplomové práce je zaměřena na jednorozměrné diskrétní signály. Konkrétně si klade za cíl realizaci softwarového systému. Navržený systém disponuje jak základními operacemi (energie signálu, počet průchodů nulou atd.) se zvukovými soubory, tak i funkcemi složitějšími, mezi které se řadí např. vyhledávání samohlásek v plynulé řeči. Systém je rozdělen na dvě části. První program analyzuje právě zvukové soubory, vytváří nový zvukový soubor s hledanou samohláskou a soubory s potřebnými parametry pro další zpracování. Druhý program analyzuje získaná data, která následně statisticky vyhodnocuje. Výsledný systém může být užitečný pro identifikaci mluvčího, jeho emočního stavu atd.
29
Při převedení horizontální osy mely patrné, filtry jsou lineárně rozmístěny,
viz. relativní cestu. Druhým způsobem
.
Na počátku tvorby softwarového systému bylo Mel koeficienty počítáno pracováno,
ale plynoucím časem byla tato metoda výsledném programu nevyužita. obr. Realizace systému
Kapitola věnuje vytvořenému softwarového systému.
Výpočet MFCC velmi účinnou metodou pro zpracování řečových signálů. Výsledný softwarový systém
se skládá dvou programů.
6. Prvním způsobem zadání pouhého názvu souboru.1 Program analyzující zvukový soubor
Vyhotovený soubor obsahující první program pojmenován detekce. Například byl vytvořen doplňující program
sloužící porovnání vhodnosti různých metod identifikaci mluvčího základě
unikátnosti řečových parametrů.
Obr.
Výsledné programy byly napsány programovacím prostředí MATLAB mají
formu klasické konzolové aplikace bez grafického prostředí (GUI). tomto případě
se jedná tzv.m, slouží
k analýze zvukových souborů.
6. Vstupem pro tento rozšiřující doplněk byla užitečná
data získaná právě prvním programem softwarového systému, který předmětem této
diplomové práce. První program stará analyzování zvukových souborů
a sběr dat. Jedinou podmínkou tomto případě je, musí kýžený
zvukový soubor nacházet adresáři spuštěným programem. Lokaci zvukového souboru lze zapsat
dvěma způsoby.
V průběhu realizace tohoto softwarového systému byly paralelně vypracovány
další rozšíření úpravy stávajícího systému. Užitečná data jsou poté vstupem druhého programu, který slouží
k jejich statistickému zpracování grafické interpretaci výsledků. 27. Prvním krokem správnému spuštění programu
je zadání názvu zvukového souboru skriptu. Subjektivně
si ale myslím, dobré vědět, jakém principu metoda MFCC funguje, jaký je
rozdíl mezi jednotlivými používanými metodami. 27: Rozložení filtrů frekvenční osu melech [14]