Multimediální zpracování signálů

| Kategorie: Diplomové, bakalářské práce  | Tento dokument chci!

Diplomová práce se zabývá vytvořením vhodných multimediálních podkladů z oblasti signálů a soustav se spojitým časem. Pochopení této problematiky je velmi důležité, neboť povinný předmět Signály a soustavy, resp. BSIS, je vyučován na bakalářském stupni oboru EST. Porozumění vyučované látky je nezbytnou prerekvizitou v dalších předmětech k úspěšnému zvládnutí navazující látky. Další část diplomové práce je zaměřena na jednorozměrné diskrétní signály. Konkrétně si klade za cíl realizaci softwarového systému. Navržený systém disponuje jak základními operacemi (energie signálu, počet průchodů nulou atd.) se zvukovými soubory, tak i funkcemi složitějšími, mezi které se řadí např. vyhledávání samohlásek v plynulé řeči. Systém je rozdělen na dvě části. První program analyzuje právě zvukové soubory, vytváří nový zvukový soubor s hledanou samohláskou a soubory s potřebnými parametry pro další zpracování. Druhý program analyzuje získaná data, která následně statisticky vyhodnocuje. Výsledný systém může být užitečný pro identifikaci mluvčího, jeho emočního stavu atd.

Vydal: FEKT VUT Brno Autor: Miroslav Staněk

Strana 57 z 79

Vámi hledaný text obsahuje tato stránku dokumentu který není autorem určen k veřejnému šíření.

Jak získat tento dokument?






Poznámky redaktora
MySQL, aby vznikl plnohodnotný e-learningový systém. Pokud došlo české lokalizaci podkladů, mohla aplikace sloužit jako výukový kurz předmětu BSIS studentům dálkového studia. Výstupem dokončené analýzy zadaného zvukového souboru nový zvukový soubor s úseky hledané samohlásky datové soubory vytěženými parametry řečového signálu. Obsahovou formou doplňující formu vizuální tvoří vypracované materiály především programovacím prostředí MATLAB implementované webových stránek. Vytvořený softwarový systém skládá dvou dílčích programů.46 Závěr Vytvořenou diplomovou prací podařilo první části zrealizovat anglické multimediální podklady výuce signálů, které obsahují několik interaktivních studijních pomůcek sloužící jako doprovodné programy samotné výuky předmětu BSIS. Aby první část stala plnohodnotným e-learnigovým kurzem, bude nutné stávající podklady rozšířit problematiku diskrétních signálů, více řešených příkladů doprovodné texty. Případnou budoucí prací vytvořených podkladech mohlo také být rozšířením stávajících multimediálních podkladů o databázový systém, např. Každý úsek vypočteno LPC spektrum. Pro každý užitečný úsek následně uchován společně vytěženými parametry. Pomocí derivací tohoto spektra jsou nalezeny frekvence formantů. Uživatel provedení analýzy zvukového souboru zadává segmenty, které . Všechna vzniklá rozšíření internetové aplikace jsou napsána jazykem HTML PHP. Dále internetové stránky disponují animovanými ukázkami konvoluce jejich produktů, zvukovými ukázkami řešeným příkladem. vytvořené aplikaci dispozici rozmanitý obsah probírané látky. První program slouží k vyhledávání samohlásek plynulé řeči základě umístění lokálních maxim (formantů) LPC spektra. Pokud zaznamenán výskyt prvních dvou formantů v obvyklém frekvenčním pásmu pro danou samohlásku, úsek vyhodnocen jako užitečný. Po řádném promyšlení všech výhod jednotlivých způsobů prezentace těchto multimediálních materiálů bylo docíleno závěru, nejlepší formou prezentace vytvořeného obsahu jsou webové stránky. Program využívá segmentaci vstupního zvukového signálu krátké úseky délce 20 ms. Druhou částí diplomové práce byl zrealizován softwarový systém. Jedná konzolovou aplikaci vytvořenou programovacím prostředí MATLAB, které zadá uživatel název analyzovaného souboru a požadovanou samohlásku, kterou chce vyhledat. Vypracováním první části diplomové práce podařilo vytvořit pevný základ pro případné její rozšíření. Multimediální podklady disponují také částí, simulující průchod zvoleného signálu systémem. Jsou zde nalezení testy oblasti periodicity signálu, Dirichletových podmínek, linearity systému základě podobnosti časových průběhů signálů jejich spekter. První program také slouží demonstraci dalším operací zvukovým souborem. Vytvořené internetové stránky jsou upravenou open source šablonou. Pro užitečné úseky jsou nadále vypočteny další spektrální parametry řečového signálu