Wednesday, July 30, 2008

MPEG 1 – úroveň 1 (Audio Layer 1) je nejjednodušší avšak pro nejkvalitnější signál
poskytuje jen malou redukci přenosové rychlosti, např. ze s kbit / 768 na s kbit / 448 .
MPEG 1 – úroveň 2 (Audio Layer 2) vychází ze systému MUSICAM (Masking pattern
MPEG 1 – úroveň 3 (Audio Layer 3) Používá modifikovanou diskrétní kosinovou
transformaci MDCT. Dále snižuje bitovou rychlost, ale dekodér je složitý.
MPEG 2 – úrovně 1, 2 a 3. Používá se v systému DVB (Digital Video Broadcasting)
pro přenos několika kanálů zvukového doprovodu (pěti až šesti kanálový Dolby
Surround Sound). Používá poloviční vzorkovací frekvence než MPEG1. Při nízkých
přenosových rychlostech je jakost zvuku lepší než u MPEG1.
Nejjednodušší zdrojové kódování umožňuje systém MPEG 1 – úroveň 1. Blokové
schéma kodéru je nakresleno na obr. 2.9. Analogový akustický signál se nejdříve pomocí
modulace PCM převádí na signál digitální. Výsledná přenosová rychlost pro monofonní
signál, vzorkovací kmitočet 48 kHz a kvantování do 65536 úrovní, tedy pomocí 16 bitových
slov, je s kbit / 768 . V kodéru je signál rozdělen do skupin po 384 vzorcích (již v digitální
formě), tedy po 6144 16 . 384 = bitech. Každá skupina má dobu trvání ( ) 8 10 . 48 1 . 384 3 = ms
a nazývá se rámec dat, zkráceně rámec. Každý rámec je transformován z časové do
kmitočtové oblasti a vzniklé spektrum je rozděleno na 32 stejně širokých kmitočtových úseků
- subpásem. Šířka každého subpásma je 750 Hz. Kmitočtové spektrum se vzorkuje kmitočtem
jehož hodnota je rovna 32 1 původního vzorkovacího kmitočtu u PCM, tj.
kHz 5 , 1 32 10 . 48 3 = . Tento proces se nazývá „podvzorkování“ spektra. Ve 32 subpásmech je
26 Rádiové a mobilní komunikace
celkem 384 32 . 12 = vzorků. Po dobu 8 ms je tedy v každém subpásmu 12 kmitočtových
vzorků různé velikosti, z nichž se vybere jeden, který má největší velikost a podle něj kodér
určí tzv. měřítko (scale factor). Tím se za dobu 8 ms získá pro celý rámec 32 měřítek (činitelů
měřítka), které mají rozhodující význam pro stanovení maskovacích prahů v každém dílčím
pásmu jednoho rámce.
Součástí kodéru je tzv. psychoakustický model, pomocí kterého je modelováno lidské
sluchové vnímání. V tomto modelu se porovnávají činitelé měřítka s hodnotami stanovenými
statisticky (metodami z mnoha praktických pokusů) a stanoví se v něm hladina ještě
maskovaného kvantizačního šumu. Podle přípustné hladiny kvantizačního šumu je přidělen
každému subpásmu určitý počet bitů pro postupné kvantování všech jeho vzorků. Počet
přidělených bitů je pro všech 12 vzorků jednoho subpásma stejný, pro různá subpásma však
může být různý. Pohybuje s v rozmezí od 2 do 15 (oproti původní hodnotě 16) a výrazně
přispívá ke snížení přenosové rychlosti signálu. Ze všech 32 subpásem s kvantovanými
kmitočtovými koeficienty se ve výstupním bloku vytváří komprimovaný digitální signál
s volitelnou přenosovou rychlostí v rozmezí od s kbit / 448 (pro nejjakostnější signály) do
s kbit / 32 (nejmenší kvalita),

Tuesday, July 8, 2008

maskovacím prahem,
Takové signály proto není třeba
uvažovat a tedy ani přenášet, neboť
na přijímací straně by stejně nebyly
posluchačem vnímány. Průběhy
křivek maskovacích prahů byly
získány na základě výsledků testů
prováděných na velkém počtu
posluchačů (psychologická
akustika). Maskovací práh se také
nazývá práh právě pozorovatelného zkreslení JND (Just Noticeable Distortion). Odstup
maskovacího signálu od úrovně jím vytvořeného maskovacího prahu na určitém kmitočtu se
označuje jako poměr signál – maskování SMR (Signal to Mask Ratio).
Poněvadž průběhy maskovacích prahů jsou závislé na kmitočtu, je výhodné
zpracovávat akustický signál odděleně v dílčích kmitočtových pásmech neboli subpásmech –
subpásmové kódování SBC (SubBand Coding), obvykle stejné šířky pásma,
Podle nejsilnějších složek zvukového signálu a jím odpovídajícím
průběhům maskovacích prahů, lze stanovit pro každé subpásmo maximální úroveň
kvantizačního šumu (obecně maskovaného signálu), který bude užitečným (obecně
maskujícím) signálem maskován a z ní určit počet bitů potřebných pro kvantování signálu.
Tím se dosáhne výrazné redukce přenosové rychlosti signálu, aniž by se na přijímací straně
zhoršila subjektivně vnímaná kvalita reprodukovaného zvuku. Při přenosu reálného signálu,
který své spektrum s časem mění, je třeba v krátkých časových intervalech signál neustále
analyzovat a inovovat úrovně kvantizačního šumu v každém subpásmu. To má za následek
změnu počtu bitů pro kvantování signálu v každém subpásmu a tím i změnu výsledné
přenosové rychlosti signálu. Časové intervaly jsou voleny tak, aby se využilo i maskovacího
efektu lidského sluchu v časové oblasti. Uvedené jevy a principy se využívají v následujících
systémech zdrojového kódování akustických signálů.