Multimediální zpracování signálů

| Kategorie: Diplomové, bakalářské práce  | Tento dokument chci!

Diplomová práce se zabývá vytvořením vhodných multimediálních podkladů z oblasti signálů a soustav se spojitým časem. Pochopení této problematiky je velmi důležité, neboť povinný předmět Signály a soustavy, resp. BSIS, je vyučován na bakalářském stupni oboru EST. Porozumění vyučované látky je nezbytnou prerekvizitou v dalších předmětech k úspěšnému zvládnutí navazující látky. Další část diplomové práce je zaměřena na jednorozměrné diskrétní signály. Konkrétně si klade za cíl realizaci softwarového systému. Navržený systém disponuje jak základními operacemi (energie signálu, počet průchodů nulou atd.) se zvukovými soubory, tak i funkcemi složitějšími, mezi které se řadí např. vyhledávání samohlásek v plynulé řeči. Systém je rozdělen na dvě části. První program analyzuje právě zvukové soubory, vytváří nový zvukový soubor s hledanou samohláskou a soubory s potřebnými parametry pro další zpracování. Druhý program analyzuje získaná data, která následně statisticky vyhodnocuje. Výsledný systém může být užitečný pro identifikaci mluvčího, jeho emočního stavu atd.

Vydal: FEKT VUT Brno Autor: Miroslav Staněk

Strana 56 z 79

Vámi hledaný text obsahuje tato stránku dokumentu který není autorem určen k veřejnému šíření.

Jak získat tento dokument?






Poznámky redaktora
Tento fakt dán největší pravděpodobností tím, nedochází při této náladě potřebné rezonanci některých dutin, tak mnoha případech nedojde vůbec vzniku formantu F3. Vzhledem již vyzkoušeným aplikacím, mohl vytvořený systém sloužit k několika dalším účelům. Jedná tedy, dle mého názoru, užitečný nástroj, který může být dodatečným rozšířením nápomocen dalších oblastech analýzy řečových signálů. . Pro relevantnost směrodatnost budoucích výsledků také bylo zapotřebí pořídit co nejobjemnější soubor užitečných segmentů pro největší počet mluvčích. většině případů tomu právě naopak. Nad rámec diplomové práce byla také zkoumána vhodnost použití jednotlivých metod identifikaci mluvčího právě pomocí vytvořeného softwarového systému. těchto dvou stavů převažuje normální rozložení jednotlivých histogramů nad rozložením gamma. Dále možné všimnout, jednotlivé histogramy pro simulovanou opilost radost jsou velmi podobné. určování emočních stavů mluvčího. Detailnější analýzou získaných histogramů pro různé stavy mluvčího všechny samohlásky mohla vést cesta např. Obrázkem patrné, rozložení polohy antiformantu AF2 při vzteklém rozpoložení řečníka typu gamma, kdežto u normálního stavu mluvčího jedná Gaussovo rozložení. Následně bylo nutné vytvořené histogramy podrobně analyzovat.45 dochází výraznému snížení výskytu AF2. Získané výsledky jsou shrnuty práci [17]. tomto případě bylo nutné pořídit několik záznamů řeči při různých reálných stavech mluvčího