MALÝ VIDEOKURZ
|
|
|
2. kapitola Základy TV technologie, základní pojmy, formáty obrazu, komprese
V této části si řekneme hlavní rozdíly v parametrech třech druhů tv signálu - analogového signálu, digitálního tv signálu v SD (Standard Definition) rozlišení a digitálního signálu v HD (High Definition) rozlišení. Prozradíme také, co to jsou ztrátové a bezeztrátové komprese a různé formáty záznamu, základní parametry obrazu (jak ho sleduje divák doma na své tv) a některé další praktické souvislosti.
1. Začneme samým základem - parametry TV obrazu
Nejprve musím upozornit, že je nutné mít na paměti, že při postupné tvorbě TV systémů se vždy uplatňovala zásada zpětné kompatibility. Žádný TV systém (kromě toho prvního) nevyrůstal tedy "na zelené louce". Vždy už byl v používání nějaký systém předchozí, který vytvářel reálné požadavky, především na propojitelnost starých systémů s těmi novými (což významně předurčovalo a dokonce omezovalo tvorbu nových systémů). Z tohoto důvodu se také někdy říká, že "digitální systémy rostou z analogových, jako digitální větve z analogového stromu". Jsou s předchozími formáty pevně provázané a jejich praktická a každodenní "propojitelnost" je pro tv společnosti zcela zásadní otázkou (kvůli množství archivů, používaných při tvorbě nových pořadů, i z důvodů nemožnosti okamžitě vždy provést kompletní výměnu všech používaných TV technologií - kamer, mnoha různých speciálních pracovišť, výrobních řetězců a přenosových vozů, především z finančních důvodů). To je důvod, proč každý následující systém MUSÍ být propojitelný s tím předešlým, na což berou zkušení vývojoví pracovníci ohled a upravují parametry nových systémů tak, aby tento požadavek splnily. Jaké jsou tedy základní formáty obrazu, tak jak je vidí divák na své TV: 1.1 SD rozlišení Analogový TV obraz má formát 4:3, rozlišení 768 x 576 bodů (při šířce pásma 6MHz). Tyto body vytváří na stínítku obrazovky elektronový paprsek, který postupně rozsvěcí luminofory (jednotlivé světlo vydávající body TV CRT obrazovky). Z důvodu menší potřebné šířky pásma jsou jednotlivé řádky složené ze dvou půlsnímků (namísto 0 - 12MHz tak stačí přenést či zaznamenat pouze pásmo 0 - 6MHz). Celistvý vjem obrazu vzniká dík setrvačnosti lidského oka a setrvačnosti luminoforů, které (ač jsou rozsvěcovány elektronovým paprskem postupně jeden po druhém) dovolí dík setrvačnosti vnímat obraz celistvě. Prokládaní pak umožní snížit rušivé blikání TV obrazu (podobně jako rotační clona u filmu, viz předchozí kapitola), a také pohyb (dík setrvačnosti lidského oka) je vnímán plynuleji. Snímková rychlost je odvozena od kmitočtu sítě (v Evropě 50Hz, v USA 60Hz). TV tedy přenáší v Evropě 25 snímků za vteřinu, což je 50 prokládaných půlsnímků, v USA 30snímků, což je 60půlsnímků. Jednu TV řádku viditelné části obrazu formátu 4:3 proběhne elektronový paprsek za 52µs, celá tv řádka i s doprovodnými signály (bez kterých nelze obraz analogové TV správně zobrazit) trvá 64µs. Nakonec byl u analogových televizorů přidán i poměr stran obrazu 16:9, ale u nás bylo TV vysílání v analogu prakticky pouze v poměru stran 4:3 (16:9 se vysílalo s černými pruhy nad a pod obrázkem, jako tzv. 4:3 letterbox). Plány na zásadní vylepšení analogového TV systému změnil blížící se nástup digitální technologie TV vysílání (malé vylepšení přineslo dočasně vysílání v soustavě PAL plus, která umožnila přijímat majitelům 16:9 televizorů s tímto dekodérem vyšší rozlišení obrazu, dík kombinaci analogové přenosové soustavy při využití digitálních technologií v TV přijímači). Totéž platilo pro v Evropě připravované analogové HDTV vysílání, blížící se "digitál" vývoj v tomto směru ukončil (analogové HDTV stihlo zavést např. Japonsko, v Evropě ale došli odborníci k názoru, že bude lepší vyčkat nástupu digitální televizní přenosové soustavy).
Digitální TV obraz má formát obrazu - 4:3 o rozměrech 768x576 bodů (rozlišení 702x576) - 16:9 o rozměrech 1024x576 bodů (rozlišení 702x576). Pro uložení obrazu je vyžita multiformátová norma ITU R 601 720x576, společná i pro NTSC (pro zobrazení se obraz roztahuje "z vnořených" 702), okraje obrazu se nevyužívají a na dobře seřízené TV nejsou vidět. Jak toto vzniklo, zavrtí asi leckdo hlavou? Jak bylo napsáno v úvodu, zcela zásadně to ovlivnil požadavek zpětné propojitelnosti "analogu s digitálem" a pak taky požadavek na jednoduchou konstrukci A/D převodníků, které měly mít jeden společný kmitočet, jak pro oblast USA (60Hz) tak pro oblast Evropy (50Hz). Tyto dvě věci to měly na svědomí. - digitální obraz NTSC má pro formát obrazu 4:3 rozměr 640x480 bodů (rozlišení 710x480), obraz se při přehrávání na TV horizontálně zmáčkne (ukládá se s pomocnými přesahy po stranách pro převod do analogu, jako 720x480). - evropský digitální PAL má rozměry 768x576 (rozlišení 702x576), pro sledování na tv se obraz horizontálně natáhne (ukládá se s pomocnými přesahy pro převod do analogu, jako 720x576)
Pomocné přesahy obrazu analogu (zatemňováky) a digitálu (nutné přesahy pro převody obrazu do analogu) se do výpočtu poměru stran obrazu nezahrnují. Poměr stran obrazu se počítá pouze z viditelné části obrazu a nic na tom nemění ani fakt, že proti analogu je u digitálu pomocný přesah vyplněný obrazovou informací, stále jde pouze o pomocný přesah obrazu, viz odkaz zde (klikněte pro zvětšení).
Jak se tedy vývojáři poprali se vznikem této digitální TV normy? Víme, že v analogovém systému se z důvodu zpětné kompatibility se staršími ČB TV obraz přenášel pomocí složek YUV, z kterých se zpětně rekonstruovala třetí složka barvy. V digitální podobě je princip stejný, pro odlišení se ale nepoužívá značení YUV ale Y, Cr, Cb (princip tří informací o barvě a jedné o jasu i zpětné kompatibility pro starší TV byly zachovány). Lidské oko vidí hůř barevně, proto se tyto barevné složky vzorkují s nižším (polovičním) rozlišením. Samplování je vzorkování spojitého analogového signálu do digitální podoby Každý bod digitálního obrazu má určitou svou hodnotu jasu "Y," od černé až po bílou; totéž se týká dvou rozdílových signálů přenášející informaci o barvě, které mají poloviční rozlišení. Při převodu "analogu do digitálu" a opačně je tedy třeba vzít spojité analogové hodnoty jednoho TV řádku (zde "černobílého" Y) a ty pravidelně navzorkovat na jednotlivé body tv řádku digitálního, na určitou digitální hodnotu 0- 255 (8bitová škála). Tuto četnost (T) vzorkování určuje právě kmitočet A/D převodníku. Barevné složkové signály Cr a Cb se vzorkují samostatně, naprosto podobně jako signál Y, ale jen s polovičním rozlišením (proto je samplovací kmitočet také poloviční, tedy 6,75MHz, a mluvíme o chroma subsampling - podvzorkování barev, viz velmi názorný odkaz zde)
vzorkování spojitého analogového signálu (vlevo) jednoho tv řádku kmitočtem převodníku, svislá osa je 8bitová škála 0 - 255 Víme-li, že jedna TV řádka viditelné části analogového tv obrazu má v PAL 52µs a zvolíme-li šikovně kmitočet převodníku, pak nám vyjde potřebný počet bodů (702) na jedné tv řádce digitálního obrazu. Tento výpočet provedli vývojáři jak pro NTSC (čas jedné tv řádky NTSC je 52,6555µs) tak i pro PAL (52µs) a hledali první společný kmitočet pro obě normy, do kterého by se "vešli" (s jistými nutnými přesahy). Nakonec přišli na kmitočet 13.5MHz, z toho vyplynul počet horizontálních 720 bodů této tv normy. - podrobnosti naleznete zde, v odstavci 2.1
Doporučení EBU R-95 2008 k action safe zone a title safe zone pro digitální obraz dle ITU R 601 (klikněte pro zvětšení).
Úkol byl tedy splněn kmitočet převodníků byl společný pro USA i Evropu a všechny tv společnosti mohly snadno a rychle převádět analog a digitál mezi sebou, byť ve dvou modifikacích dle počtu řádků (jelikož má NTSC více snímků za sec, tedy 30fps, celkem logicky má menší počet řádků než PAL s 25fps). Natáčení a zpracování v tv společnostech tak bylo kombinované (digitální i analogové) a postupně docházelo k obměně kamer, záznamových strojů, TV režií, střižen, přenosových vozů, postprodukčních řetězců, atd. Divák to vše sledoval zatím na své analogové TV, signál k němu putoval totiž také kombinovaně - nejprve digitální přenosovou (pozemní optickou) ATM sítí, koncové vysílače ale byly pořád analogové. Zde se tak obraz 720x576 (v něm vnořený 702x576) bodů převedl na 768x576 bodů analogu o šířce pásma 6MHz. Putoval takto k divákovi (modulovaný na nějaký vysokofrekvenční kmitočet vzduchem šířeného TV kanálu, celková šířka přenášeného pásma jednotlivého tv kanálu byla širší, protože nad 6MHz byl ještě nosný kmitočet zvuku). Po digitalizaci vysílačů už je trasa celá digitální (takže se přenáší už pouze "digi" 720x576 a ne analog 768x576), ale na TV obrazovce se objeví jen 702x576 bodů (roztažených na normovaný screen 768x576). Dík vyšší kvalitě vstupního TV signálu a pokroku technologií snímání i zpracování je obraz i přes nižší rozlišení kvalitnější (než dřívější "plně analogový", tedy obraz analogově snímaný, zpracovávaný i distribuovaný). Také záznamové digitální stroje pracují v Evropě i USA jednotně (se vzorkovacím kmitočtem 13,5MHz a 6,75MHz pro rozdílové složky barev), proto také zaznamenávají vždy plných 720x576 / 720x480, (a nikoliv 702x576 a 710x480), zjednodušuje to jejich výrobu. Liší se tak pouze počtem tv řádků (NTSC má 480, PAL 576), distribuce i zpracování SD signálu probíhá u nás vždy v 720x576. Závěrem jen připomeňme praktické efekty této znalosti. - projekty pro zpracování digitálního videa v SD rozlišení je třeba zakládat v rozměru 720x576 (720 widescreen pro 16:9) - nahrajete-li do takového projektu nějaké video, původně analogové, objeví se po stranách úzké černé proužky (to není ničemu na škodu, jsou to právě ty přesahy "přes" 702). - všechny A/D a D/A převodníky samy správně převedou analogový i digitální signál tak, že 702 bodů (z uložených 720) vyplní přesně rozměr 768 bodů analogu (dobu 52µs, tedy dobu přeběhu elektronového paprsku přes jednu tv řádku viditelné části obrazu 4:3) a naopak. Zbytek přesahu se "zobrazí" u správně nastavené TV mimo obrazovku. - jediné, na co si musíme dávat pozor, je vkládání fotografií a grafiky do videa (viz odkaz zde). Pro přesné vložení do projektu 720x576 nepoužívejte ve foto a grafických editorech šablonu 768x576 (ta platí pro vložení do 702, taková volba importu ale v střihových programech není), ale rozměr 788x576 (4:3) a 1050x576 (pro 16:9). Krajní 10pixelů vlevo a vpravo nevyužívejte ( u 16:9 je to krajních 13pix po obou stranách), nezobrazí se, slouží jen k dodržení správného poměru stran (klidně je vyplňte barvou, ale nepočítejte s jejich zobrazením na správně seřízené TV). Čísla 788 a 1050 vyplynula z poměru 768 ku 702 (788 ke 720) a z poměru 1024 ku 702 (1050 ku 720). - některé trikové šablony a přechody ve střihových program nevykryjí přesně obrys natočený přesně kruhových objektů, např. natočeného obrysu DVD kotouče, kruhového talíře, atd. (pokud jsou snímány přesně kolmo k ose optiky kamery). Například kruhová stíračka (wipe) často nevykryje přesně natočený kruhový obrys. Jde o chybu výrobců programu (těchto šablon, zanedbání rozdílu mezi horizontálním 702 a 720 rozměrem), nezbude vám, než použít verzi víc konfigurovatelného přechodu, kde lze rozměr kruhu šablony upravit (pomocí osy x,y rozměru). - při tvorbě disku "DVD video" vám mpeg2 norma dovolí vytvořit DVD v rozměru 720x576 nebo v rozměru 704x576. Ten druhý rozměr je 702 plus po každé straně "jeden rezervní pixel drobné časové chyby" (tedy malého horizontálního posunu obrazu, například vzniklého při převodu z analogového zdroje, jako je např. váš archiv na VHS kazetě). Prakticky jde ale především o fakt, že rozměr 704 je dělitelný číslem 16 (což je rozměr "makrobloku" - malé části obrazu - komprese mpeg2, takový signál se lépe komprimuje). Oba rozměry 720 i 704 můžete použít, na správně seřízené TV bude zobrazení v obou případech správné (osobně vytvářím DVD video jako 720x576, protože můj zdroj signálu je převážně digitální a mám tak rezervní "přesah obrazu po obou stranách 702", který případně TV se špatnou geometrií obrazu mohou částečně zobrazit).
1. 2. HD rozlišení Tady byla situace značně jednodušší. Analogová přenosová HDTV soustava v Evropě nevznikla, vývojáři již "počkali" na blížící se digitální provedení. Nikdo tak nepotřebuje převádět HDTV do HDTV analogu a zpět (žádné analogové HDTV systémy v Evropě nejsou). Proto byly stanoveny jednotné normy rozlišení pro USA i Evropu, navíc obraz má jen jeden poměr stran 16:9. Evropa a USA se liší pouze snímkovou rychlostí, 50Hz mód v Evropě a 60Hz mód v USA. Obraz HDTV je vždy v poměru stran 16:9, má v Evropě i USA jen dva možné rozměry: 1. neprokládaný HD1 aneb 1280 x 720 bodů/ 50p = celých snímků za vteřinu (v USA je to 60p) 2. neprokládaný HD2 aneb 1920 x 1080 bodů/ 50p = celých snímků za vteřinu (v USA je to 60p) Rozlišení HDTV obrazu ale komplikuje prokládání a snímkové rychlosti, protože prokládané systémy mají nižší vertikální rozlišení (asi o 1/3 odhadem) a u HD2 je možná i nižší snímková rychlost 25p. Proto platí, že HDTV obraz má dva rozměry, ale čtyři různá rozlišení - kvality. Obraz HDTV má tak celkem čtyři různé kvality (rozlišení), ovlivňuje ho prokládání a FPS, ta další dvě jsou: 3. prokládaný HD2 aneb 1920 x 1080/ 50i = má asi o třetinu nižší vertikální rozlišení, než 1920x1080/50p. Je tak v efektivním rozlišení velmi blízko sytému HD1 (1280x720/50p), který se navíc daleko lépe komprimuje (v USA je to 1920x1080/60i) 4. HD2 s nižší neprokládanou FPS 1920 x 1080/ 25p = jen 25 celých neprokládaných snímků za vteřinu, zde může být pohyb méně plynulý, což subjektivně také snižuje kvalitu pozorovaného pohyblivého obrazu (v USA je to 30p). Tyto základní druhy HDTV obrazu (s čtyřmi druhy "rozlišení", řekněme lehce nepřesně) značí Evropská vysílací unie (EBU) jako S1 - S4, postupně přibyla ještě další možnost distribuce HD2, s nižším H rozlišením jako 1440x1080/50i, jistě se tv normy budou vyvíjet i dál (tak, jak praxe naznačí). V realitě dnešního života potkáme ale pouze dva HDTV systémy, ani jeden není "full HD": 1. 1280 x 720 / 50p (má plné vertikální rozlišení, efektivně se komprimuje) 2. 1920 x 1080 / 50i (má dle obsahu obrazu velmi podobné efektivní rozlišení, jako 1280x720/50p) Oba tyto systémy mají skutečně velmi podobné efektivní rozlišení obrazu, byť ten druhý je nepatrně prokreslenější (zvlášť u scén bez pohybu), záleží na obsahu obrazu (pohybu v něm, množství detailů). Výrobci a distributoři preferují ten první, neboť se lépe komprimuje, například Česká televize ale preferuje 1080/50i (je to z toho důvodu, že ČT disponuje kvalitními HD kamerami, díky čemuž je v situacích, kdy je v obrazu méně pohybu, ve výsledku v obraze vyšší rozlišení; nízkonákladové TV používají levnější kamery, s režimem 720/50p). Faktem je, že pro zpracování 720/50p nebo 1080/50i stačí současné technologie, pro zavedení 1080/50p je nutná jejich kompletní výměna, což způsobuje jisté zpoždění v zavádění tohoto full HD TV systému. Formát 1920x1080/50p tak teprve začíná nastupovat (například nové profesionální kamery XDCAM s čipy 2/3 palce a záznamem 1920x1080 ve formátu XDCAM50 HD422 tento režim také nepodporují, přes cenu kolem 1mil Kč). Výrobci tak zjevně ( i vzhledem k teprve postupně rostoucí poptávce) zatím s uváděním potřebných technologií na trh příliš nespěchají, nástup full HDTV 1920x1080/50p tak bude velmi pozvolný.
2. Co jsou to ty komprese?
Komprese je způsob, jak zmenšit objem digitálních dat (víme, že u analogu se potřebné úspory docilovalo menší šířkou pásma zaznamenávaného signálu, viz minulá kapitola). Má dvě základní skupiny, komprese jsou buď ztrátové nebo bezeztrátové. Použijme jednoduchý příměr - pokud si koupíte židli v obchodě, můžete ji pro úsporu místa (pro uložení během přepravy) rozmontovat na jednotlivé části, židle pak zabere méně místa (to je bezeztrátová komprese). Pokud ale nějakou část ztratíte nebo zahodíte, protože se vám už do auta nevejde, je to komprese ztrátová. Zatímco "u židle" hned vidíte, že jedna noha například chybí, u videa je mnoho částí obrazu, kde si nevšimnete, že "něco chybí" (typicky jsou to všechny tmavé části, malé detaily v plochách, drobná zaokrouhlení jasových nebo barevných rozdílů). Typický příklad jednoduché bezeztrátové komprese je i následující tvar - mám li zaznamenat digitální signál 0011111111, pak mohu také "napsat" 2x nula, 8x jedna. To je laický příklad jednoduché bezeztrátové komprimace digitálních dat.
K čemu to je u videokamer dobré? Zatímco analogové kamery šetřily místo na magnetické pásce (jak už jsme si řekli) snížením zaznamenávané šířky pásma z 0 - 6MHz na asi 0 - 3MHz, pak digitální kamery (nejen pro domácí použití) používají pro úsporu objemu dat kompresi digitálních dat. To umožní nahrávat déle, uložit na pevný disk počítače více videa, případně si u některých druhů kompresí můžete kvalitu nastavit v různých stupních (z čehož plyne delší nahrávací doba videokamery, ale při nižší kvalitě výsledku). Příliš ztrátové komprese ale nejsou pro kamery vhodné, pokud chcete vidět kvalitní obraz na své TV, proto pozor na nastavení nejúspornějších režimů.
Nejdříve si ale něco řekněme 2.1. K rozdílům uložení dat na magnetické pásce Digitální pásek využívá sice také magnetického záznamu jako analogový, ale dík digitální interpretaci dat zaznamenává vlastně jen dva stavy frekvencí (odpovídající nule a jedničce), narozdíl od analogového magnetického záznamu, který musel obsáhnout celé spojité spektrum frekvencí. Díky pokroku v technologiích je magnetizace digitální pásky mnohonásobně tvrdší, materiál pásky je "magneticky" mnohem hustší a dík tomu má digitální pás mnohonásobně větší HUSTOTU digitálních dat, než pás analogový (a také delší životnost, dík tvrdší magnetizaci). Umožňuje také namísto kopírování jakési "digitální klonování" dat, dokud totiž záznamové hlavy rozeznají "nulu od jedničky", je kopírování z pásky na pásek vlastně bezeztrátové, i při změně úrovní signálu, podobně jako při kopírování souborů v PC. Podtrhněme i fakt, že dík množství dat a menší pásce je pro uložení jednoho framu videa u systému mini DV třeba 12 záznamových šikmých stop (dvojice záznamových hlav ukládá 2x6 stop, při 180° opásání bubínku páskou). Dalším rozdílem ukládání "digitálu" na magnetické pásy je, že profesionální záznamové formáty (např. analogový Betacam SP nebo digitální DigitalBetacam) ukládaly zvlášť informaci o jasu "Y" a zvlášť informaci o barvách (složky UV v analogu nebo Cr Cb v digitálu). Tím při složkovém přepisu (YUV u Betacam SP) dokázaly i analogové systémy uchovat významně vyšší kvalitu kopie. U digitálních systémů domácího videa byl tento princip (dříve vyhrazený pouze profesionálním analogovým a digitálním strojům) také přijat, čímž opět významně vzrostla kvalita záznamu (především barev). Informace o jasu je u miniDV ukládaná samostatně (jako jedna složka digitálních dat), dvě informace o barvě pak také samostatně (jako dvě rozdílové složky s polovičním rozlišením proti jasu). U záznamového formátu miniDV ale musíme dodat, že subsampling barev není 4:2:2, ale pouze 4:2:0 (složky barev jsou u miniDV ukládány pouze s čtvrtinovým rozlišením, proti Y, což například znesnadňuje klíčování na barvu - chroma key). Díky pokroku v uložení a zpracování zmizely u miniDV i známé vady analogových domácích systémů, tedy vlnění svislých linií i časové zpoždění barevných složek (viz předchozí kapitola), které se přiblížilo z průměrných 60ns u analogových systémů VHS na 2-3ns u miniDV, což jsou hodnoty srovnatelné s profes. systémy záznamu videa). Další okolností záznamu digitálních dat na magnetický pás v kazetě bylo významné zvýšení relativní rychlosti hlav a pásu (viz první kapitola - záznam videa na magnetický pás pomocí šikmých stop), kde základním parametrem SPOLEHLIVOSTI záznamových formátů je šířka výsledné magnetické stopy (je závislá na rychlosti posuvu pásu, rychlosti rotace bubínku s hlavami a šířce štěrbiny záznamové hlavy). Zatímco analogové systémy měly otáčky bubínku poměrně nízké, u systému DV vzrostly otáčky na (neuvěřitelných) 9000ot/min. Šířka stopy byla pro domácí systém DV snížena na 10µm (což je na samé hranici fyzikálních možností), relativní rychlost hlav vůči pásu je pak kolem 10m za vteřinu !! Domácí formát miniDV tak pracuje na samé hranici fyzikálních možností a spolehlivosti, což se může (a často také projevuje) sníženou kompatibilitou nahrávek mezi jednotlivými přístroji, či častějšími výpadky v signálu (mechanika kamery a kvalita magnetické vrstvy pásu a mechaniky kazety musí být naprosto perfektní, při sebemenší výrobní odchylce dochází k problémům). To je také důvod, proč se nedoporučuje používat u systému miniDV prodlouženou dobu nahrávání LP (long play), jelikož zde dál klesá šířka stopy, na asi 7,5µm (7,5milióntin metru), což už je značně za hranicí spolehlivosti, s vysokou možností častých výpadků (v závislosti na kvalitě provedení mechaniky kamery a v závislosti na kvalitě provedení magnetických pásů) i velmi sníženou kompatibilitou (přenositelností) nahrávek. Všechny tyto okolnosti se projevují snad ještě více u páskového formátu HDV, jelikož ten komprimuje několik snímků najednou (oproti miniDV). Každý výpadek tak zde znamená ztrátu nikoliv menší skupiny pixelů (či jedné z 12 záznamových stop jednoho FRAMU), ale bohužel většinou celé skupinky 12 - 15 FRAMŮ, tzv. skupinky snímků GOP (Group of Pictures), což často znamená výpadek až 1,5 vteřiny. Pro větší spolehlivost vznikla profesionální verze formátu DV, tedy formát DVCAM, který má zcela stejné parametry, pouze pásek se posouvá rychleji, čímž se šířka stopy zvětšila na 15µm (u profesionálních formátů obvyklých), což už je podstatně odolnější hodnota (také mechaniky DVCAM jsou konstruované robustněji a profesionální DVCAM pásky mají mechanicky i magneticky vysoce kvalitní pás, také kvalita uložení v kazetě je v plně profesionálním provedení). U formátu HDV už profesionální verze nevznikla, jelikož mezitím profesionálové začali používat jiná média pro uložení digitálního HDTV signálu (např. optické disky formátu XDCAM HD nebo záznamové paměťové karty, externí úložiště na bázi diskových polí, atd.). Počet možných přepisů u digitální pásky domácího systému miniDV vzrostl (oproti např. S-VHS analogové videokameře) z jednoho možného přepisu na 2000 možných přepisů (bez "viditelné změny" kvality), což je až neuvěřitelné. Proto se těmto přepisům často neříká kopírování, ale "digitální klonování" (dokud totiž záznamové hlavy rozeznají "frekvenci nuly od frekvence jedničky", je kopírování z pásky na pásek vlastně bezeztrátové, i při změně úrovní těchto signálů). Odlišná situace nastává pouze při zpracování, kdy digitální signál nějak modifikujeme, upravujeme (tam je počet přepisů u HD obrazu vhodné omezit na celkem čtyři přepisy, u sedmé úpravy už mohou být vidět změny*) *Toto měření provedla (jak objektivně tak subjektivně a na různých specielně vybraných materiálech) v precizním testu EBU (Evropská vysílací unie), pro nejpoužívanější druhy profesionálních zpracovávatelských kodeků (jako je AVID DNxHD, Panasonic AVC-I, Sony XDCAM SQ, HQ a HD422). Jejich závěrem bylo, že všechny tyto kodeky zvládnou 5 rekompresí bez viditelné degradace). Tento fakt (digitálního klonování), umožňující opakované a prakticky bezeztrátové přepisy, velmi zarmoutil ochránce autorských práv, proto výrobci dlouho váhali s uvedením digitální nahrávací technologie na trh (například spotřebitelský DVD rekordér formátu "DVD-video", využívající optická média namísto magnetického záznamu, byl uměle pozdržen a nastoupil až kolem přelomu tisíciletí, kolem roku 2000). Dodnes jsou také videokamery, které mají nahrávací funkci DV-IN, zatíženy při dovozu větším clem (proti běžnému clu 4pct je clo na videokamery s funkcí DV-IN např. v Evropě 10pct). Zajímavou okolností také je, že 9 z 10 výrobců miniDV kamer sídlí v Japonsku .-) .
2.2. Zpět ke kompresi digitálních dat Vyšší hustota dat na digitálním magnetickém pásce není samoúčelná. Vezmeme-li si, že musíme zaznamenat obraz 720x576, 25x za vteřinu (celé snímky), to celé v 8bit škále (0 - 255 hodnot) jak pro Y (jasová složka) tak pro dvě složky Cr Cb (rozdílové složky barev), tak to je pořádný "nášup". Informace o barvě se vzorkuje v nižším rozlišení (chroma subsampling - viz odkaz), používá se samplovací vzorec 4:2:2 (klidně by to mohlo být 1:0,5:0,5, ale druhý způsob psaní vzorce je přehlednější). Ten udává, že na čtyři informace u jasu (čtyři pixely obrazu) připadají dvě informace o červené a dvě informace o modré barvě (zelená informace se dopočítává z Y, prostým odečtením). U miniDV či HDV či AVCHD je to 4:2:0, tedy na čtyři informace o jasu je uložena jen jedna informace o barvě "R" a jedna o "B" (informace o barvě jsou společné pro 4 pixely). Pokud do této oblasti padne nějaké rozhraní barev, tak čím "jednobarevnější" plochy to budou, tím "viditelnější" bude zkreslení barev na jejich společném okraji. Vzorec 4:1:1 platí pro NTSC, v podstatě je to to samé jako 4:2:0, jen v jiném prostorovém uložení (barevných vzorků v ploše obrazu, NTSC je při uložení 720x480 podélnější, PAL obraz je při 720x576 "čtvercovější", tomu odpovídá jiné rozložení vzorků obraze, jejich počet je ale stejný). Datový tok NEKOMPRIMOVANÉHO digit. signálu 720x576 (vč. zvuku) je asi 270Mbps (422 barvy). To je důvod, proč se data prostě musí zkomprimovat, protože pro uložení tohoto signálu potřebujete velmi výkonný záznamový stroj, s minimálně půlpalcovou páskou poměrně velkých rozměrů, a to by se nám nelíbilo, taková videokamera (záznamová formát, který dokáže uložit nekomprimované digitální video, používala dlouhá léta např. ČT Brno, je to formát Panasonic D3 Digital, pokud se ale měl někam přemístit, bylo třeba spolupráce dvou statných chlapů, jeden člověk stroj neunese).
Panasonic D3 Digital, záznamový formát digi 720x576 nekomprimovaně.
Důležitý dotaz - co to vlastně jsou, ty záznamové formáty? Narozdíl od formátů obrazu jsou záznamové formáty určeny k uložení obrazu a zvuku (nikoliv k jeho prezentaci, jako TV přijímače a monitory). "Formáty" jsou to proto, jelikož je jejich ovládání a parametry standardizované, takže se různé stroje dokáží domluvit - s TV střihátkem či TV režií (viz minulá kapitola) či přímo mezi sebou (při jednoduchém přepisu). Obraz v nich zaznamenaný má určité parametry kvality (dle technické specifikace daného formátu, kde jsou určené formáty kazet či jiných médií, rychlosti posuvu pásky, způsob a počet uložených stop, vzorkování jasu a barev, vzorkování a způsob uložení zvuku atd). Zatímco formáty obrazu (jak je sleduje divák) máme jen čtyři (pro SD i HD rozlišení): - 768x576, 1024x576, 1280x720 a 1920x1080 (tedy jeden 4:3 a tři v poměru stran 16:9) tak formátů záznamu (kvalit obrazu a zvuku, jak jsou ukládány), analogových i digitálních, je velmi mnoho: - např. Digital Betacam, Betacam SP, DV, DVCAM, VHS, S-VHS, Hi8, VHS-C, U-matic, U-matic HB, D3 Digital, HDCAM, HDCAM SR, HDV, AVCHD, XDCAM HD, XDCAM EX, atd. Hlavní specifikací je vždy použitý druh záznamového média, použitý typ komprese (DCT, mpeg2, mpeg4 AVC, atd.), bezeztrátová nebo ztrátová komprese, použitý datový tok, "jemnost škály" hodnot aneb 8bit (0-255) nebo 10bit (0-1023 ,to má vliv na zobrazení jemných přechodů, například mlžných oparů, celkovou věrnost obrazu včetně barev), způsob samplování barev (422 vs. 420, tento parametr je například důležitý při klíčování na barvu, tzv. chroma key). Pojďme se podívat na typické tři formáty záznamu videokamer pro rodinné natáčení: 1. DV 2. HDV1 a HDV2 3. AVCHD Všechny tři (čtyři, pokud započítáme i druhou modifikaci HDV) mají společné, že používají ztrátovou komprimaci (nejméně ztrátové je DV, cca 5:1).
Formát DV používá dvě různé velikosti kazet (DV a miniDV). - uložený obraz má rozměry včetně přesahů 720x576 (multiformátová norma ITU R 601, vnořen 702x576) - datový tok je 25Mbps, každý snímek je komprimovaný samostatně, obraz je prokládaný. - barvy jsou ukládány pro každý čtvrtý pixel (tzv. samplování 420, tedy na 4pix 1vzorek modré a 1vzorek červené) - používá kompresi DCT s pevným datovým tokem
Formát HDV2 používá jednu velikost kazet (miniDV) - uložený obraz má rozměry 1440x1080 (ztrátově uložený formát obrazu 1920x1080) - obraz je prokládaný (snížené vertikální rozlišení), datový tok je 25Mbps - barvy jsou ukládány pro každý čtvrtý pixel (samplování 420, tedy na 4pix 1vzorek modré a 1vzorek červené) - používá pro obraz kompresi mpeg2 s long GOP (skupinky framů jsou komprimovány společně)
Formát HDV1 používá jednu velikost kazet (miniDV) - uložený obraz má rozměry 1280x720 - obraz není prokládaný (plné vertikální rozlišení), datový tok je 25Mbps - barvy jsou ukládány pro každý čtvrtý pixel (samplování 420, tedy na 4pix 1vzorek modré a 1vzorek červené) - používá pro obraz kompresi mpeg2 s long GOP (skupinky framů jsou komprimovány společně)
Formát AVCHD používá různá záznamová média (datové karty, pevné disky, atd) - uložený obraz má rozměr buď 1920x1080 nebo 1440x1080, 1280x720 nebo 720x576 - datový tok je nastavitelný, obvykle v rozmezí 12 - 17Mbps (24Mbps) pro HD, 6 - 12Mbps pro SD - obraz v režimu HD2 bývá prokládaný (nižší vertikální rozlišení) - obraz v režimu HD1 bývá neprokládaný (plné vertikální rozlišení) - obraz v režimu 720x576 bývá prokládaný (nižší vertikální rozlišení) - barvy jsou ukládány pro každý čtvrtý pixel (samplování 420, tedy na 4pix 1vzorek modré a 1vzorek červené) - používá pro obraz kompresi "mpeg4 avc"/H264 s GOP (skupinky framů jsou komprimovány společně, zvlášť složitým výpočtem, což je náročné především na straně kódování; dekódování je méně náročné)
Zajímavé porovnání kvality různých kompresí, zde v souvislosti s kamerou Sony XDCAM PDW700 (cena 1mil Kč) a jejím 8bit záznamovým formátem na bázi mpeg2 "HD422" (popis zcela vpravo). Intra-Frame znamená komprimaci každého snímku zvlášť, Inter - GOP znamená komprimaci skupin snímků. Nejkvalitnější je formát HDCAM SR, HDCAM, XDCAM HD422, AVC Intra100 422, DVCPRO HD, AVC Intra50 420, někde níže pod nimi bude formát HDV 25 420 a AVCHD 25 420 (formáty běžných rodinných videokamer).
Z výpisu je zřejmé, že nejvíc se jednotlivé formáty záznamu (potažmo druhy komprese) liší tím, že DV jako jediné komprimuje každý snímek zvlášť, což významně usnadňuje zpracování (vyžaduje podstatně nižší výkon počítače). HDV a AVCHD se liší u 1080/50i horizontálním rozměrem - HDV2 ukládá 1440 pixelů s menší komprimací, AVCHD ukládá 1920pixelů s větší komprimací. Otázku ztrátovosti (rozdílu) u těchto dvou různých kompresí jsem nemohl nijak hodnověrně ověřit, ale z mé praxe lze říct, že oba formáty vyhoví s vysokou rezervou požadavkům kvality domácího videa. Velký rozdíl ale je v nárocích na zpracování, zatímco HDV2 je jen o málo náročnější než DV (to dík komprimaci skupinek framů), pak AVCHD je výpočetně asi 5x náročnější typ komprese, než HDV2. Při zpracování skupin snímků tak musí probíhat výpočetně náročná dekomprimace, která vyžaduje (pro plynulý náhled úprav) vysoký výkon počítače i grafické karty. Také optimalizace střihového sw je nutná, aby výkon počítače i grafickou akceleraci dokázal sw dobře využít. Takže závěrem musím říct, že u druhů komprese je nejen důležité, jak mnoho dokáže data "zmáčknout", ale možná ještě víc je důležitý fakt, jestli se později s těmito daty dá rozumně pracovat (z našeho pohledu jde o střih videa, tedy nejen "ostrý" střih bez dalších úprav, ale střih včetně prolínaček, přechodů, úprav trikových, barevných či dalších úprav pomocí speciálních efektů). Právě tento požadavek odlišuje takzvané zpracovávatelské komprese od kompresí distribučních, kde díky už dokončenému zpracování mohou být použity větší komprimace v jednotlivých druzích distribučních kompresí, které jsou pro tuto vysokou komprimaci (už během vývoje) optimalizované. Takže tady je jeden velký poznatek praxe, komprese pro videokamery musí být nejen účinná, ale také dobře zpracovávatelná, na běžném domácím počítači. Příliš komprimovaný signál může při zpracování činit obtíže. Kodek Kodek je nástroj, kterým nekomprimovaný digitální signál komprimuje (kódujeme) a při přehrávání dekomprimujeme (dekódujeme), dohromady je to tedy kodér a dekodér. Jeho kvalita se projeví při opakovaných úpravách, při pouhém kopírování dat kodek signál nijak neupravuje (samotné kopírování tedy nemá vliv na kvalitu digitálních dat).
Závěrem Nové digitální videokamery, určené pro domácí použití, používají k uložení dat buď pásková záznamová média (kazety formátu miniDV, které používají formát HDV1 a HDV2), nebo čím dál častěji pevné disky, optická média a především záznamové paměťové karty (s vysokou rychlostí zápisu a čtení). Tato média umožňují dále zmenšovat rozměry videokamer pro domácí použití, což může někdy působit nové problémy s kvalitou obrazu, především z hlediska jeho klidného pozorování (dík malé velikosti je obtížnější udržet videokameru při snímání v dostatečném klidu). U těchto médií je také větší problém s bezpečnou a dlouhodobou archivací digitálních dat (o tom si ale řekneme více v kapitolách o zpracování a distribuci digitálního videa), která je pro běžné videoamatéry naprosto klíčovou vlastností záznamového formátu (respektive i důležitou cenovou okolností). Datový tok je obvykle již dostatečný, kolem 25Mbps, což reprezentuje asi 13GB uložených dat pro jednu hodinu záznamu (obrazu a zvuku) v kompresi DV-PAL (záznamový formát miniDV). Páskové HD formáty HDV1 a HDV2 a nepáskový AVCHD vystačí s velmi podobným datovým tokem (u AVCHD o něco nižším, v rozmezí 17 - 24Mbps), neboť používají mnohem větší komprimaci dat (pomocí skupinek snímků, GOP), HD obraz má mnohem víc bodů než SD rozlišení. Tento vyšší datový tok je nutnou rezervou kvality pro zpracování, při distribuci již zpracovaných záznamů může být snížený (podle druhu komprese) na asi 6Mbps pro SD rozlišení a na asi 10 - 12Mbps pro HD rozlišení (v závislosti na kvalitě zdroje a kodéru a typu použité komprese). AVCHD je pak i proti formátům HDV1 a HDV2 vysoce komprimované, což někdy může činit problémy při zpracování videa (je zapotřebí vysoce výkonný počítač, což je pro příležitostné zpracování domácího videa někdy finančně nevýhodné, navíc výpočetní technika značně rychle zastarává a je tak i velmi špatnou investicí). Závěrem lze jednoznačně říct, že všechny tři záznamové formáty DV, HDV a AVCHD používané při záznamu rodinného videa (vycházející z kompresí DCT, mpeg2 a mpeg4 AVC) kvalitativně plně postačují domácímu použití. Pouze formát AVCHD má (zatím) vysoké nároky na výkon PC při zpracování. Páskové formáty obecně (jak už bylo řečeno) mají svou výhodu při dlouhodobé bezpečné archivaci, zálohování nepáskových médií je finančně náročnější. V části o zpracování videa se pak dotkneme zpracovávatelských kompresí, v části o distribuci pak distribučních kompresí (ty jsou více ztrátové, jsou optimalizované pro lidské oko; zpracovávatelské komprese jsou optimalizované pro zpracování na PC, jednoduše řečeno .-) ).
SHRNUTÍ - všechny nové TV systémy musí brát ohled na požadavky z praxe, na propojitelnost se staršími systémy - formáty obrazu jsou určené k prezentaci TV obrazu divákovi - formáty obrazu v SD rozlišení jsou v Evropě dva, 4:3 (768x576) a 16:9 (1024x576) - formáty obrazu v HD rozlišení jsou také dva, 16:9 (1920x1080) a 16:9 (1280x720)
- tv norma ITU R 601 (720x576 v Evropě a 720x480 v Americe) je multiformátová - obraz NTSC je v ITU R 601 jako 710x480 pixelů, zmáčkne se na výsledných 640x480 (4:3) - obraz PAL je v ITU R 601 "vnořen" jako 702x576 pixelů, roztáhne se na výsledných 768x576 (4:3)
formáty HD obrazu mají (díky prokládání a různé FPS) čtyři různá reálná rozlišení (kvalitu): - formáty HD obrazu 1920x1080/50p a 1280x720/50p mají plné vertikální i horizontální rozlišení, vč. FPS - formát HD obrazu 1920x1080/50i má dík prokládání nižší vertikální rozlišení (závisí to na obsahu obrazu) - formát HD obrazu 1920x1080/25p má dík malé FPS nižší kvalitu (rozlišení) pohyblivých scén - postupně se doplňují další možnosti distribuce, například 1440x1080/50i
- formáty záznamu jsou určené pro uložení obrazu a zvuku se standardizovanou kvalitou a propojitelností - formáty záznamu jsou především určeny typem použité komprese (např. mpeg2, mpeg4 avc, atd.) - komprese mohou být bezeztrátové a ztrátové (nebo také velmi ztrátové .-) ) - média jednoho záznamového formátu (kazety, optické disky, paměťové karty) jsou kompatibilní (přenositelná).
- komprese je způsob, jak ztrátově nebo bezeztrátově zmenšit obsah digitálních dat - pro videokamery je důležité, aby komprese umožnila také efektivní zpracování na přiměřeně výkonném PC - komprese DV ukládá (komprimuje) každý snímek videa samostatně, což usnadňuje zpracování - komprese mpeg2 a mpeg4 avc (formáty HDV a AVCHD) komprimují snímky po skupinkách GOP - formát AVCHD je vysoce komprimovaný, víc než mpeg2, což (zatím) znesnadňuje jeho zpracování - prohlížení (dekódování) formátu AVCHD je mnohem méně náročnější, než jeho kódování (tzv. asymetrická komprese)
|