Monday, June 23, 2008

a) Křivky současné slyšitelnosti při maskování jednotlivých kmitočtů
úzkopásmovým šumem s šířkou pásma 160 Hz, konstantní hladinou a třemi
středními kmitočty
b) Závislost maskování jednotlivých kmitočtů na amplitudě maskujícího
úzkopásmového šumu [13]
24 Rádiové a mobilní komunikace
zvuku T sinusového průběhu o určité akustické hladině T L maskována silnějším
úzkopásmovým šumem určité hladiny Š L , se nazývají prahy současné slyšitelnosti. Průběhy
prahů slyšitelnosti závisí na kmitočtu, hladině akustického tlaku a spektrálním složení zvuku,
jak ukazují obr. 2.6.b,c (maskování v kmitočtové oblasti - simultánní maskování). Maskovací
jev však nastává i v případě, kdy maskovaný krátkodobý signál určité hladiny přichází až po
ukončení maskujícího signálu vyšší hladiny, v době do 10 ms. Při delším intervalu než 10 ms
maskování slábne a při intervalu 200 ms již zcela zaniká. Maskován může být rovněž krátký
zvukový impuls, následuje-li po něm nejdéle do 5 ms maskující signál (maskování v časové
oblasti – nesimultánní maskování).
Při zdrojovém kódování
akustických signálů se využívá
opačného jevu, při němž určitý
sinusový signál daného kmitočtu a
hladiny maskuje všechny ostatní
signály včetně šumu a rušení, jejichž
kmitočet a úroveň leží pod

Thursday, June 19, 2008

Zdrojové kódování akustických signálů
Používá se při kódování kvalitních akustických signálů v kmitočtovém rozsahu cca 10
Hz až 20 kHz. Využívá maskovacího jevu lidského sluchu, při kterém je užitečným
signálem maskován kvantizační šum.
Člověk vnímá zvuky pouze v kmitočtovém pásmu od cca 16 Hz do cca 16 kHz. Za
práh slyšitelnosti je považovaná kmitočtová závislost akustického tlaku P při níž lidský
sluch přestává vnímat sinusový akustický signál (křivky na obr. 2.6.a,b vycházející z bodů
dB L 70 ≅ ). Horní hranici akustického tlaku určuje práh bolesti (nevnímáme zvuk, ale jen
bolest). Úroveň (hladina) tlaku je dána vztahem
[ ] dB
P
P L log 20
0
= , (2.2)
kde Pa P µ 20 0 = . Při současném vnímání několika různých zvukových signálů delších než
200 ms může jeden signál potlačovat slyšitelnost jiného signálu, i když jejich kmitočty jsou
různé. Říkáme, že jej při své určité úrovni akustického tlaku maskuje (např. tikot hodin je
maskován zvukem TVP). Křivky udávající hladinu akustického tlaku, od které je slyšitelnost
a) b)

Sunday, June 15, 2008

Multiimpulzní buzení MPE (Multi Pulse Excitation) - vzájemná poloha i velikosti
budících impulzů se určují po jednom. Dosahovaná přenosová rychlost je v rozmezí 8 až
16 kbit/s.
Rádiové a mobilní komunikace 23
Regulární buzení RPE (Regular Pulse Excitation) - vzájemná poloha impulzů je přesně
stanovena. Určuje se tedy pouze poloha prvního impulzu a velikosti všech impulzů.
Dosahovaná přenosová rychlost je v rozmezí 8 až 16 kbit/s.
Kódové buzení CELP (Code Excited Linear Prediction) - jednotlivé posloupnosti
budících impulsů jsou uloženy v paměti (kódové knize). Na přijímací stranu se přenáší
pouze adresa příslušné posloupnosti. Dosahuje se přenosové rychlosti s kbit / 4 a menší,
avšak vokodéry jsou složité, [10], [12].
Poznámka: Těsně po standardizaci hovorových kodérů, dosahujících přenosových rychlostí
cca s kbit / 8 , se podařilo vyrobit rychlejší signálové procesory, jejichž použití
znamenalo snížení přenosové rychlosti kodérů na polovinu. Od té doby se
původní kodéry označují jako kodéry s plnou rychlostí FR (Full Rate) a
kodéry s novými procesory se označují jako kodéry s poloviční rychlostí HR

Monday, June 9, 2008

Hybridní zdrojové kódování

Spojují přednosti obou předchozích způsobů kódování. Výstupní hovorový signál se
opět vytváří jako odezva filtru s vhodně nastavenými parametry na budící signál, který je však
generován složitějším způsobem. Již se nerozlišují znělé a neznělé hlásky, a proto se ani
nepoužívá dvou budících (excitačních) signálů. Využívá se multiimpulzní excitace, při které
je v krátkém časovém intervalu generováno několik úzkých impulzů (např. 4 impulzy za 5
ms), jejichž velikosti a vzájemné polohy jsou určeny tak, aby rozdíl mezi signálem původním
a syntetizovaným byl minimální.
Součástí zdrojového kodéru je i dekodér (stejný jako na přijímací straně), který již na
vysílací straně vytváří syntetizovaný signál, jež se odečítá od signálu vstupního a vzniklá
chyba se minimalizuje na základě smyslového (perceptuálního) vnímání. Minimalizovaný
chybový signál se přenáší komunikačním kanálem k syntezátoru a současně se pomocí něj
nastavuje excitační generátor syntezátoru ve vysílací části. Za generátorem jsou zařazeny
v kaskádě dva filtry. U prvního, tzv. krátkodobého korelačního filtru, jsou parametry
vypočítány pouze z několika (8 až 16) předchozích predikovaných vzorků. Následující, tzv.
dlouhodobý korelační filtr, realizuje dlouhodobou predikci LTP (Long Term Prediction),
která zjemňuje hovorové spektrum. Podle způsobu buzení (minimalizace chyby) se rozlišují
následující systémy.

Sunday, June 8, 2008

Parametry jednotlivých bloků hovorového syntezátoru jsou určeny na základě analýzy
hovorového signálu mluvící osoby, která se provádí ve vysílací části vokodéru. Do přijímací
části vokodéru se tedy
komunikačním kanálem
nepřenáší hovorový
signál, ale pouze
nejdůležitější parametry
získané na základě jeho
analýzy.
Zdrojové
kódování hovorového
signálu se provádí ve
vysílací části vokodéru.
Hovorový analogový
signál je v analogověčíslicovém
převodníku
převeden na signál
digitální, přičemž jednotlivé vzorky mohou být pro potřeby následné analýzy vyjádřeny až 13 bity. Následuje
segmentování signálu, tj. jeho rozdělení na časové úseky o délce 10 až 30 ms. Po tuto dobu
lze považovat vlastnosti hlasového traktu za konstantní. Následuje proces analýzy signálu
jehož výsledkem je stanovení znělosti resp. neznělosti hlásky Z-N, periody základního tónu
hlasu 0 T , velikosti úrovně signálu G a především určení několika parametrů filtru PF
(deskriptorů) modelujícího hlasový trakt. Získané signály jsou multiplexovány a přenášeny
komunikačním kanálem k syntezátoru.