Multimediální zpracování signálů

| Kategorie: Diplomové, bakalářské práce  | Tento dokument chci!

Diplomová práce se zabývá vytvořením vhodných multimediálních podkladů z oblasti signálů a soustav se spojitým časem. Pochopení této problematiky je velmi důležité, neboť povinný předmět Signály a soustavy, resp. BSIS, je vyučován na bakalářském stupni oboru EST. Porozumění vyučované látky je nezbytnou prerekvizitou v dalších předmětech k úspěšnému zvládnutí navazující látky. Další část diplomové práce je zaměřena na jednorozměrné diskrétní signály. Konkrétně si klade za cíl realizaci softwarového systému. Navržený systém disponuje jak základními operacemi (energie signálu, počet průchodů nulou atd.) se zvukovými soubory, tak i funkcemi složitějšími, mezi které se řadí např. vyhledávání samohlásek v plynulé řeči. Systém je rozdělen na dvě části. První program analyzuje právě zvukové soubory, vytváří nový zvukový soubor s hledanou samohláskou a soubory s potřebnými parametry pro další zpracování. Druhý program analyzuje získaná data, která následně statisticky vyhodnocuje. Výsledný systém může být užitečný pro identifikaci mluvčího, jeho emočního stavu atd.

Vydal: FEKT VUT Brno Autor: Miroslav Staněk

Strana 58 z 79

Vámi hledaný text obsahuje tato stránku dokumentu který není autorem určen k veřejnému šíření.

Jak získat tento dokument?






Poznámky redaktora
. Vytvořený softwarový systém tedy užitečný nástroj analýze zvukových souborů, resp. Pomocí těchto souborů program analyzuje relativní polohu významných bodů frekvenčního úrovňového hlediska pro tři intervaly LPC spektra. Pro zadaný úsek jsou vykresleny průběhy signálu váhovány různými okny, příslušná LPC FFT spektra, jsou vypočteny LSP koeficienty zobrazeny čárové spektrální páry. řečových signálů, který nalezne uplatnění dalších aplikacích než těch, které byly uvedeny této práci. zkreslení mikrofonu, kvalita zvukové karty atd. Obdržené histogramy byly pouze zkoumány vizuálního hlediska. Opět jedná konzolovou aplikaci, která byla vytvořena v programovacím prostředí MATLAB. Nad rámec této práce bylo také analyzováno, pomocí vytvořeného systému, několik emočních stavů mluvčího, pro které byly vytvořeny histogramy. Po provedení všech procedur uživatel vyzván tomu, aby zadal požadovanou dvojici formantů, pro kterou chce zobrazit základní statistické údaje. Uživatel vyzván zadání názvů souborů s daty pro jednotlivé samohlásky. Konkrétně byly srovnávány tvary histogramů pro simulované stavy mluvčího. Relativní polohu významných bodů poté zobrazuje formě histogramů. Správnost detekce může zejména negativně ovlivnit příliš vysoká citlivost mikrofonu, která způsobuje silné zkreslení řečového signálu při krátké distanci mezi řečníkem mikrofonem. Pro správnou detekci úseků vyhledávané samohlásky nutné analyzovat kvalitní zvukový záznam. Díky již vyzkoušeným aplikacím může být zrealizovaný systém využit pro případnou budoucí výzkumnou činnost oblasti analýzy řečových signálů. Dalšími faktory, které mohou negativně ovlivnit detekci, jsou např. Nad rámec diplomové práce bylo také provedeno porovnání vhodnosti použití různých metod identifikaci mluvčího pomocí vytvořeného softwarového systému. Také zobrazena příslušná autokorelace, vypočten počet průchodů signálu nulou krátkodobá energie signálu. případě absence některé požadované funkce možné program rozšířit, tak dopracovat dalších kýžených výsledků. Druhý program stará interpretaci vytěžených dat prvním programem pomocí statistických výsledků.47 chce zobrazit