Multimediální zpracování signálů

| Kategorie: Diplomové, bakalářské práce  | Tento dokument chci!

Diplomová práce se zabývá vytvořením vhodných multimediálních podkladů z oblasti signálů a soustav se spojitým časem. Pochopení této problematiky je velmi důležité, neboť povinný předmět Signály a soustavy, resp. BSIS, je vyučován na bakalářském stupni oboru EST. Porozumění vyučované látky je nezbytnou prerekvizitou v dalších předmětech k úspěšnému zvládnutí navazující látky. Další část diplomové práce je zaměřena na jednorozměrné diskrétní signály. Konkrétně si klade za cíl realizaci softwarového systému. Navržený systém disponuje jak základními operacemi (energie signálu, počet průchodů nulou atd.) se zvukovými soubory, tak i funkcemi složitějšími, mezi které se řadí např. vyhledávání samohlásek v plynulé řeči. Systém je rozdělen na dvě části. První program analyzuje právě zvukové soubory, vytváří nový zvukový soubor s hledanou samohláskou a soubory s potřebnými parametry pro další zpracování. Druhý program analyzuje získaná data, která následně statisticky vyhodnocuje. Výsledný systém může být užitečný pro identifikaci mluvčího, jeho emočního stavu atd.

Vydal: FEKT VUT Brno Autor: Miroslav Staněk

Strana 40 z 79

Vámi hledaný text obsahuje tato stránku dokumentu který není autorem určen k veřejnému šíření.

Jak získat tento dokument?






Poznámky redaktora
Vstupem pro tento rozšiřující doplněk byla užitečná data získaná právě prvním programem softwarového systému, který předmětem této diplomové práce. Užitečná data jsou poté vstupem druhého programu, který slouží k jejich statistickému zpracování grafické interpretaci výsledků. obr. Realizace systému Kapitola věnuje vytvořenému softwarového systému. Například byl vytvořen doplňující program sloužící porovnání vhodnosti různých metod identifikaci mluvčího základě unikátnosti řečových parametrů. V průběhu realizace tohoto softwarového systému byly paralelně vypracovány další rozšíření úpravy stávajícího systému. 6. Výsledné programy byly napsány programovacím prostředí MATLAB mají formu klasické konzolové aplikace bez grafického prostředí (GUI). Prvním krokem správnému spuštění programu je zadání názvu zvukového souboru skriptu. relativní cestu. tomto případě se jedná tzv. Výpočet MFCC velmi účinnou metodou pro zpracování řečových signálů. Jedinou podmínkou tomto případě je, musí kýžený zvukový soubor nacházet adresáři spuštěným programem. Obr. Prvním způsobem zadání pouhého názvu souboru. První program stará analyzování zvukových souborů a sběr dat. 6.m, slouží k analýze zvukových souborů. Lokaci zvukového souboru lze zapsat dvěma způsoby. Druhým způsobem . 27. Výsledný softwarový systém se skládá dvou programů. 27: Rozložení filtrů frekvenční osu melech [14].29 Při převedení horizontální osy mely patrné, filtry jsou lineárně rozmístěny, viz. Na počátku tvorby softwarového systému bylo Mel koeficienty počítáno pracováno, ale plynoucím časem byla tato metoda výsledném programu nevyužita. Subjektivně si ale myslím, dobré vědět, jakém principu metoda MFCC funguje, jaký je rozdíl mezi jednotlivými používanými metodami.1 Program analyzující zvukový soubor Vyhotovený soubor obsahující první program pojmenován detekce