|
Kategorie: Diplomové, bakalářské práce |
Tento dokument chci!
Diplomová práce se zabývá vytvořením vhodných multimediálních podkladů z oblasti signálů a soustav se spojitým časem. Pochopení této problematiky je velmi důležité, neboť povinný předmět Signály a soustavy, resp. BSIS, je vyučován na bakalářském stupni oboru EST. Porozumění vyučované látky je nezbytnou prerekvizitou v dalších předmětech k úspěšnému zvládnutí navazující látky. Další část diplomové práce je zaměřena na jednorozměrné diskrétní signály. Konkrétně si klade za cíl realizaci softwarového systému. Navržený systém disponuje jak základními operacemi (energie signálu, počet průchodů nulou atd.) se zvukovými soubory, tak i funkcemi složitějšími, mezi které se řadí např. vyhledávání samohlásek v plynulé řeči. Systém je rozdělen na dvě části. První program analyzuje právě zvukové soubory, vytváří nový zvukový soubor s hledanou samohláskou a soubory s potřebnými parametry pro další zpracování. Druhý program analyzuje získaná data, která následně statisticky vyhodnocuje. Výsledný systém může být užitečný pro identifikaci mluvčího, jeho emočního stavu atd.
Vstupem pro tento rozšiřující doplněk byla užitečná
data získaná právě prvním programem softwarového systému, který předmětem této
diplomové práce. Užitečná data jsou poté vstupem druhého programu, který slouží
k jejich statistickému zpracování grafické interpretaci výsledků. obr. Realizace systému
Kapitola věnuje vytvořenému softwarového systému. Například byl vytvořen doplňující program
sloužící porovnání vhodnosti různých metod identifikaci mluvčího základě
unikátnosti řečových parametrů.
V průběhu realizace tohoto softwarového systému byly paralelně vypracovány
další rozšíření úpravy stávajícího systému.
6.
Výsledné programy byly napsány programovacím prostředí MATLAB mají
formu klasické konzolové aplikace bez grafického prostředí (GUI). Prvním krokem správnému spuštění programu
je zadání názvu zvukového souboru skriptu. relativní cestu. tomto případě
se jedná tzv.
Výpočet MFCC velmi účinnou metodou pro zpracování řečových signálů. Jedinou podmínkou tomto případě je, musí kýžený
zvukový soubor nacházet adresáři spuštěným programem.
Obr. Prvním způsobem zadání pouhého názvu souboru. První program stará analyzování zvukových souborů
a sběr dat.
6.m, slouží
k analýze zvukových souborů. Lokaci zvukového souboru lze zapsat
dvěma způsoby. Druhým způsobem
. 27. Výsledný softwarový systém
se skládá dvou programů. 27: Rozložení filtrů frekvenční osu melech [14].29
Při převedení horizontální osy mely patrné, filtry jsou lineárně rozmístěny,
viz.
Na počátku tvorby softwarového systému bylo Mel koeficienty počítáno pracováno,
ale plynoucím časem byla tato metoda výsledném programu nevyužita. Subjektivně
si ale myslím, dobré vědět, jakém principu metoda MFCC funguje, jaký je
rozdíl mezi jednotlivými používanými metodami.1 Program analyzující zvukový soubor
Vyhotovený soubor obsahující první program pojmenován detekce