Thursday, May 22, 2008

Parametrické zdrojové kódování

Vokodéry používané pro parametrické zdrojové kódování jsou konstruovány na
základě poznatků o lidském hlasu a hlasového traktu.Srovnáním
detailních výseků časových průběhů pro samohlásku „I“ a souhlásku „S“ je vidět, že charakter
těchto signálů je zcela odlišný. Zatímco časový průběh signálu odpovídající souhlásce „S“ má
náhodný charakter a podobá se šumovému signálu, v časovém průběhu signálu u samohlásky
„I“ je vidět jistá periodicita a deterministický charakter. Lidská řeč se skládá ze znělých
hlásek (kvaziperiodický charakter signálu), neznělých hlásek (pseudonáhodný charakter
signálu) a mezer.
Jednoduchý fyziologický model hlasového traktu ,kde jsou
vyznačeny všechny lidské orgány a části lidského těla, které se podílí na tvorbě hlasu.
Základním parametrem lidského hlasu je tzv. perioda základního tónu hlasu 0 T . Její
převrácená hodnota se nazývá kmitočet základního tónu nebo také základní hlasový kmitočet
(pitch) a pohybuje se v rozmezí 50 až 400 Hz. Každý člověk má jiný základní hlasový
kmitočet jehož hodnota se může měnit i v průběhu hovoru.
Rádiové a mobilní komunikace 21
Na základě
fyziologického modelu byl
sestaven elektrický model
pro syntézu řeči, který je
základem i pro obvodové
řešení vokodérů
s lineárním prediktivním
kódováním LPC (Linear
Predictive Coding), u nichž
se zpracování signálů
provádí v časové oblasti.
Jeho jednoduché blokové
schéma je nakresleno na
Hovorový signál
se vytváří v přijímací části
vokodéru (hovorovém
syntezátoru), která se
skládá z šumového a
impulzového generátoru,
filtru, zesilovače a
reproduktoru. Na výstupu
impulzového generátoru je
impulzový signál
s opakovací periodou 0 T ,
která je typická pro mluvící
osobu. Přepínač výstupních
signálů generátorů je
nastavován podle toho, zda
je vytvářena znělá nebo
neznělá hláska. Budící (excitační) signál přichází do filtru, který v závislosti na nastavení
svých parametrů modeluje vlastnosti hlasového traktu mluvící osoby. Výstupní signál je
zesílen v zesilovači a přiveden do reproduktoru.

Monday, May 19, 2008

Nevýhodu zkreslení přetížením strmosti potlačuje modulace Delta s proměnným
kvantizačním krokem, označovaná rovněž jako adaptivní modulace Delta ADM. Pokud má
vstupní signál velkou strmost, kvantizační krok se zvětší, při malé strmosti se naopak zmenší.
Změna velikosti kvantizačních kroků se řídí podle různých algoritmů. Například u známého
Winklerova algoritmu se při výskytu dvou po sobě jdoucích stejných symbolů zvětší
Adaptace
kvantování
Adaptace
predikce
Kódování Vzorkování
Predikce
Kvantování +
+
+
-
Vstup
kodéru
Výstup
ADPCM
Σ
Σ
: Zdrojový kodér ADPCM
20 Rádiové a mobilní komunikace
kvantizační krok dvojnásobně. Rekonstruovaný signál tak lépe aproximuje vstupní signál než
v případě LDM.
Výrazného zlepšení kvality rekonstruovaného signálu lze dosáhnout použitím adaptivní
diferenciální impulzové kódované modulace ADPCM (Adaptive Differential Pulse Code
Modulation), která již respektuje řadu zvláštností hovorového signálu. Od DPCM se liší
v tom, že místo lineárního kvantování a lineární predikce používá adaptivní kvantování AQ a
adaptivní predikci AP. Používané adaptivní algoritmy jsou jednoduché neboť časové změny
parametrů hovorových signálů jsou relativně pomalé. Při adaptivním kvantování je velikost
kvantovacích kroků funkcí okamžiků vzorkování a tedy funkcí času. Na rozdíl od ADM, kdy
se kvantizační krok mění podle strmosti vstupního analogového signálu, se u ADPCM mění
kvantizační krok za účelem redukce dynamického rozsahu kvantizačního šumu. U adaptivní
predikce se pro stanovení koeficientů predikce využívá nekvantovaných nebo kvantovaných
vzorků signálu. Výsledný efekt adaptivních procesů spočívá ve zlepšení poměru signálkvantizační
šum o hodnotu 8 až 12 dB vůči PCM. Blokové schéma kodéru ADPCM je
nakresleno na obr. 2.2. Bloky Adaptace kvantování a Adaptace predikce vytváří řídící signály
pro adaptivní kvantování a predikci buď z parametrů výstupního nebo vstupního (již
vzorkovaného) signálu.
Kodeky (KOdér a DEKodér) ADPCM jsou standardizovány doporučením ITU (G.721,
G.726) a používají se hlavně u systémů bezšňůrových telefonů CT2 a DECT. Přenosová
rychlost signálu na výstupu kodéru je s kbit / 32 a rekonstruovaný hovorový signál má
srovnatelnou kvalitu jako signál PCM s přenosovou rychlostí s kbit / 64 .

Thursday, May 15, 2008

Zdrojové kódování a dekódování DPCM
Další možností redukce bitového toku je použití modulace Delta DM, u které je rozdíl
kvantovaného vzorku a vzorku předchozího kvantován pouze do dvou kvantovacích úrovní,
které jsou kódovány pouze jediným bitem. Lze ji tedy považovat za jednoduchou variantu
modulace DPCM, kde predikovaná hodnota každého vzorku je rovna hodnotě vzorku
předchozího.
Nevýhodou tohoto
způsobu kódování je
především „zkreslení
přetížením strmosti“,
které se projevuje tím,
že rekonstruovaný
signál nesleduje
prudké změny
velikosti vstupního
signálu, např. strmé
skokové změny. Další
nevýhodou je
zkreslení nazývané
„granulační šum“,
který má charakter
kvantizačního šumu a
projevuje se nejvíce při kódování signálu s konstantní úrovní. Rekonstruovaný signál střídavě
mění v každé vzorkovací periodě svoji hodnotu o velikost kvantizačního kroku kolem
skutečného průběhu. Jestliže je pro libovolnou úroveň vstupního signálu kvantizační krok
konstantní, označuje se modulace Delta jako lineární - LDM.

Friday, May 2, 2008

Zdrojové kódování tvaru vlny
K nejjednodušším způsobům tohoto kódování patří známá impulzová kódovaná
modulace PCM (Pulse Code Modulation), realizující převod analogového signálu na
digitální ve třech krocích – vzorkování, kvantování a kódování. Pro hovorový analogový
signál v telefonní kvalitě, tedy s kmitočtovým rozsahem 300 až 3400 Hz, se s ohledem na
vzorkovací teorém volí vzorkovací kmitočet 8 kHz, tj. za každou sekundu se vytváří 8000
vzorků signálu. Počet kvantovacích hladin je dán dynamikou vstupního signálu a určuje
kvantizační šum obsažený v digitálním signálu. Velikost každého vzorku je přiřazena
(zaokrouhlena) k nejbližší úrovni jedné z 256 kvantovacích hladin. Úroveň každé kvantovací
hladiny je vyjádřena osmibitovým číslem. Přenosová rychlost výstupního digitálního signálu
je tedy s kbit s bit / 64 / 64000 8 . 8000 = = . Tuto hodnotu lze považovat za výchozí pro
srovnání dalších způsobů zdrojového kódování hovorových signálů.
Rádiové a mobilní komunikace 19
Redukci bitového toku lze dosáhnout použitím diferenční impulzové kódované
modulace DPCM (Differential Pulse Code Modulation). Na rozdíl od kódování PCM, kdy je
přenášena informace o velikosti celého vzorku, se u kódování DPCM přenáší informace
pouze o rozdílu kvantovaného vzorku a jeho predikované (předpokládané) hodnoty, odvozené
obvykle z jednoho případně několika předchozích vzorků. Rozdílový signál je ve srovnání
s predikovanou hodnotou vzorku daleko menší, takže jeho velikost lze vyjádřit menším
počtem bitů. Predikovaná hodnota vzorku představuje redundantní informaci signálu a
nepřenáší se. Blokové schéma kodéru i dekodéru DPCM je nakresleno na obr. 2.1.
Predikovaný signál se vytváří pomocí pamětí nebo zpožďovacích obvodů.
+