Multimediální zpracování signálů

| Kategorie: Diplomové, bakalářské práce | Tento dokument chci!

Diplomová práce se zabývá vytvořením vhodných multimediálních podkladů z oblasti signálů a soustav se spojitým časem. Pochopení této problematiky je velmi důležité, neboť povinný předmět Signály a soustavy, resp. BSIS, je vyučován na bakalářském stupni oboru EST. Porozumění vyučované látky je nezbytnou prerekvizitou v dalších předmětech k úspěšnému zvládnutí navazující látky. Další část diplomové práce je zaměřena na jednorozměrné diskrétní signály. Konkrétně si klade za cíl realizaci softwarového systému. Navržený systém disponuje jak základními operacemi (energie signálu, počet průchodů nulou atd.) se zvukovými soubory, tak i funkcemi složitějšími, mezi které se řadí např. vyhledávání samohlásek v plynulé řeči. Systém je rozdělen na dvě části. První program analyzuje právě zvukové soubory, vytváří nový zvukový soubor s hledanou samohláskou a soubory s potřebnými parametry pro další zpracování. Druhý program analyzuje získaná data, která následně statisticky vyhodnocuje. Výsledný systém může být užitečný pro identifikaci mluvčího, jeho emočního stavu atd.

Vydal: FEKT VUT Brno Autor: Miroslav Staněk

Strana 36 z 79

Vámi hledaný text obsahuje tato stránku dokumentu který není autorem určen k veřejnému šíření.

Více info o tomto dokumentu zde!

Jak získat tento dokument?

Poznámky redaktora

23: LPC spektrum samohlásky A. 5. Počátky užívání lineární predikce řečovému kódování datují roku 1971. /p/, /t/, /f/, zatímco absenci formantových pruhů spektru nazýváme nevokálností.25 Ne všechny české hlásky disponují základním tónem F0. Tato metoda umožňuje výpočet spektra analyzovaného signálu pomocí LPC koeficientů. Hlásky, nichž se vyskytuje absence základního tónu nazýváme neznělými, např. Krčmové Filozofické fakulty Masarykovy univerzity. Pokud byla jakákoliv metoda aplikována celý požadovaný signál bez předchozích úprav, bylo určení jednotlivých parametrů zcela bezvýznamné. Z předchozího obrázku patrné, mezi základním tónem prvním formantem F1 vzniká nultý antiformant AF0, který není našem případě tak důležitý pro analýzu řečových signálů jak následující antiformanty, neboť např. Kompromisem mezi rychlostí kvalitou výsledků délka jednotlivých úseků ms. Její princip spočívá oddělení rezonančních kmitočtů hlasu pomocí inverzní filtrace a následného zanalyzování zbylého hlasového úseku.3 Lineární predikce (LPC) LPC (Linear Prediction Coding) jeden nejefektivnějších způsobů analýzy zpětné rekonstrukce hlasového signálu, který nejmasivněji využíván systému GSM. GSM nejnižší přenášená frekvence lidského hlasu 300 Hz. Krčmová [11] uvádí, rozdíl mezi znělými neznělými hláskami pro češtinu základním korelačním rysem. praxi využívána segmentace úseky překrytím sobě jdoucích segmentů, bez překrytí. své podstatě tedy lineární . Artikulačně je vokálnost založena otevřenosti nadhrtanových prostor, zatímco znělost (sonorita) záleží generování základního tónu hlasivkami. Na obrázku vyobrazeno hladké spektrum samohlásky /a/ vytvořené pomocí lineární predikce (LPC), kterém jsou zeleně označeny formanty červeně lokální minima- antiformanty. Pro relevantnost získaných dat případné zpětné rekonstrukci signálu je tedy nutné zvukový soubor rozdělit krátké úseky. 5. Analýza překrývajících úseků vede sice lepšímu rozpoznání řeči, ale je výpočetně časově náročnější než metoda bez vzájemného překrytí segmentů. Obr. Pro důkladnější seznámení problematikou oblasti fonetiky fonologie doporučuji nahlédnout online kurzu prof.2 Segmentace řečového signálu Parametrizace řečového signálu úkol vyjádřit jeho průběh pomocí omezeného množství hodnot