Multimediální zpracování signálů

| Kategorie: Diplomové, bakalářské práce  | Tento dokument chci!

Diplomová práce se zabývá vytvořením vhodných multimediálních podkladů z oblasti signálů a soustav se spojitým časem. Pochopení této problematiky je velmi důležité, neboť povinný předmět Signály a soustavy, resp. BSIS, je vyučován na bakalářském stupni oboru EST. Porozumění vyučované látky je nezbytnou prerekvizitou v dalších předmětech k úspěšnému zvládnutí navazující látky. Další část diplomové práce je zaměřena na jednorozměrné diskrétní signály. Konkrétně si klade za cíl realizaci softwarového systému. Navržený systém disponuje jak základními operacemi (energie signálu, počet průchodů nulou atd.) se zvukovými soubory, tak i funkcemi složitějšími, mezi které se řadí např. vyhledávání samohlásek v plynulé řeči. Systém je rozdělen na dvě části. První program analyzuje právě zvukové soubory, vytváří nový zvukový soubor s hledanou samohláskou a soubory s potřebnými parametry pro další zpracování. Druhý program analyzuje získaná data, která následně statisticky vyhodnocuje. Výsledný systém může být užitečný pro identifikaci mluvčího, jeho emočního stavu atd.

Vydal: FEKT VUT Brno Autor: Miroslav Staněk

Strana 40 z 79

Vámi hledaný text obsahuje tato stránku dokumentu který není autorem určen k veřejnému šíření.

Jak získat tento dokument?






Poznámky redaktora
Například byl vytvořen doplňující program sloužící porovnání vhodnosti různých metod identifikaci mluvčího základě unikátnosti řečových parametrů. Výpočet MFCC velmi účinnou metodou pro zpracování řečových signálů. tomto případě se jedná tzv.m, slouží k analýze zvukových souborů. 27. Vstupem pro tento rozšiřující doplněk byla užitečná data získaná právě prvním programem softwarového systému, který předmětem této diplomové práce. Realizace systému Kapitola věnuje vytvořenému softwarového systému. Na počátku tvorby softwarového systému bylo Mel koeficienty počítáno pracováno, ale plynoucím časem byla tato metoda výsledném programu nevyužita. Obr. Výsledný softwarový systém se skládá dvou programů. Užitečná data jsou poté vstupem druhého programu, který slouží k jejich statistickému zpracování grafické interpretaci výsledků.29 Při převedení horizontální osy mely patrné, filtry jsou lineárně rozmístěny, viz. Druhým způsobem . Jedinou podmínkou tomto případě je, musí kýžený zvukový soubor nacházet adresáři spuštěným programem.1 Program analyzující zvukový soubor Vyhotovený soubor obsahující první program pojmenován detekce. Prvním způsobem zadání pouhého názvu souboru. Lokaci zvukového souboru lze zapsat dvěma způsoby. 6. 27: Rozložení filtrů frekvenční osu melech [14]. 6. V průběhu realizace tohoto softwarového systému byly paralelně vypracovány další rozšíření úpravy stávajícího systému. Výsledné programy byly napsány programovacím prostředí MATLAB mají formu klasické konzolové aplikace bez grafického prostředí (GUI). Subjektivně si ale myslím, dobré vědět, jakém principu metoda MFCC funguje, jaký je rozdíl mezi jednotlivými používanými metodami. Prvním krokem správnému spuštění programu je zadání názvu zvukového souboru skriptu. obr. První program stará analyzování zvukových souborů a sběr dat. relativní cestu