10 de fevereiro de 2011

Formatos de vídeo HD

Quando se fala em formatos de vídeo, podem gerar dúvidas e confusões, por isso é melhor deixar claro que o tema abordado aqui é o formato de arquivo, que trata de vídeos capturados pelas filmadoras digitais de alta definição, com as respectivas codificações do conteúdo e formato recipiente (container format). O formato de vídeo mais comum nas filmadoras analógicas domésticas era o VHS, e hoje, nas filmadoras digitais de alta definição é o AVCHD.

Durante a filmagem, a imagem e o som são digitalizados e depois compactados através de algum codec (áudio LPCM é sem compressão), para reduzir o tamanho do arquivo digitalizado. O vídeo, o áudio e eventualmente alguns dados, como metadados, são processados e multiplexados, formando único bitstream (fluxo de bits em série), que serão gravados como arquivo em alguma mídia (HDD, cartão de memória flash, disco óptico, fita magnética, etc.).


Um formato de vídeo contém, informações de vídeo, áudio e eventualmente alguns dados, podendo suportar mais de um tipo de codec ou vários perfis de um padrão, conforme a sua especificação (muitas vezes são atualizadas, gerando novas versões). Pode ocorrer confusão, achando que um formato de codec é o mesmo que um formato recipiente, pois um padrão como o da MPEG (Moving Picture Experts Group), especifica os codecs de áudio e vídeo com vários perfis e até o formato recipiente (sistema). MPEG-2 TS (Transport Stream) é o formato recipiente para transporte de dados, mais utilizado por diversos formatos de vídeo, inclusive na transmissão de TV Digital.

A vantagem e aplicação de um formato de vídeo ou outro, numa filmadora, depende muito de características desejadas como, qualidade da imagem e som, quantidade de dados (bit rate), quantidades de quadros (frame rate), velocidade de processamento, complexidade de codecs, menor perda de dados, facilidade na edição, etc.

Amostragem da digitalização

Para obter uma boa qualidade de áudio e vídeo, é preciso considerar como sendo o primeiro passo, a frequência de amostragem (sampling rate) da digitalização, pois, quanto maior a frequência e quantidade de bits, melhor a qualidade. No caso do sinal de vídeo, temos ainda a subamostragem, onde numa filmadora padrão temos 4:2:0, e nas profissionais temos ainda a opção de 4:2:2 ou até 4:4:4. Se deseja ter mais detalhes, veja em Digitalização de imagem e som e Pixel e imagem digital.

Codec

Existem vários padrões de codec (compressão e descompressão), e os mais utilizados são da MPEG (MPEG-1, MPEG-2 e MPEG-4), que tem vários perfis (profile) e níveis (level), conforme a qualidade desejada. MPEG-4 Parte 2 é compatível com H.263 (DivX, Nero Digital, etc.) e MPEG-4 Parte 10 é referido como H.264 ou AVC. Muitos codecs de um formato de vídeo, utilizam parte de um padrão MPEG. Um codec pode ser lossless (sem perda) ou lossy (com perda). Veja mais detalhes em Compactação ou compressão de áudio e vídeo, ou no site da MPEG.

Bit Rate

Bit Rate é o número de bits que são transportados ou processados num determinado tempo (segundo). A sua unidade é mais conhecida como bps (bit por segundo), mas a abreviação formal é de bit/s para não ser confundido com Bps (Byte por segundo), pois 1 Byte é composto de 8 bits (1 Byte = 8 bits). Poderá notar que, em geral, quanto maior a qualidade, maior será a taxa gerada. Por exemplo, a qualidade de imagem Full HD que tem uma taxa de 35Mbps, tem uma qualidade muito superior do que uma que tem somente 15Mbps (alguma coisa precisou ser sacrificada para reduzir de volume). Note bem que um bit rate pode ser do codec (áudio ou vídeo) ou do sistema (já multiplexado). A seguir, um dos fatores que influenciam na taxa, durante a compressão.

VBR (Variable Bit Rate): A quantidade de dados gerados depende da complexidade da imagem. Nos segmentos mais complexos e de movimentos rápidos, são gerados em maior taxa e nos segmentos menos complexos, em menor taxa. A grande maioria das filmadoras utilizam este processo, pois consegue obter boa qualidade de imagem com menor taxa, apesar de ter processamento mais demorado.

CBR (Constant Bit Rate): Como a taxa de saída é constante e definida, muitas vezes não consegue manter a qualidade da imagem nos segmentos mais complexos (para manter a qualidade, é necessário ter uma taxa bem alta), e nos segmentos menos complexos, há desperdício com dados inúteis. Por gerar alta taxa, para obter alta qualidade na imagem, é mais utilizado nos formatos de filmadoras profissionais. Várias filmadoras disponibilizam opção de gravação em CBR, mas na resolução menor.

Frame Rate

Frame Rate é a frequência em que um dispositivo de imagem, produz consecutivas imagens (frame - quadro) num determinado tempo (segundo), que é normalmente expresso em fps (frame per second - quadro por segundo). Esta sequência de imagem estática (quadro) é que dá a ilusão de movimento. No cinema é utilizado 24 fps, mas em geral no vídeo, é de 30 fps ou 60 fps (na Europa é de 25 fps ou 50 fps - PAL e SECAM), que podem ser ainda entrelaçados (i ou interlace) ou progressivos (p ou progressive), por isso no vídeo entrelaçado, fps é referido como sendo field per second (campo por segundo). Em geral, 60 fps refere-se a 60 campos entrelaçados, que equivale a 30 fps (frame per second), ou seja 60i = 30p, por isso observe bem nas características, se a filmagem é em entrelaçada ou progressiva (i ou p). Em NTSC, os valores exatos são: 23.976 (24), 29.97 (30) e 59.94 (60). Se deseja mais detalhes, veja em Refresh rate, Filmadora e 1080i 1080p 1080/24p.

Compressão Inter-frame e Intra-frame

Quando uma imagem é "varrida" para amostragem, os segmentos que se repetem sem alterações, são chamados de redundância, e onde há variações, de entropia. A redundância ou entropia dentro do mesmo frame é considerado espacial, e entre uma sequência de frames, de temporal. Por exemplo, num vídeo somente de rosto, de uma pessoa falando (sem movimentar e sem piscar os olhos), a entropia temporal ocorre na região da boca (está movimentando para falar), e o resto é redundância temporal (não há variação).

Inter-frame: Uma compressão realizada utilizando redundância/entropia espacial e temporal, é conhecida como inter-frame, ou seja, um grupo de imagens consecutivas são correlacionadas para fazer a compressão. Conhecido também como Long GOP (Group of Pictures), que em geral, é composto de 15 imagens. Apesar de ter grande processamento (mais demorado), perder um grupo de imagens se ocorrer um erro e ainda ser mais difícil na edição, a maioria dos formatos utilizam esta compressão, porque consegue ser mais eficiente (quase o dobro do intra-frame), fazendo boa compressão, mantendo boa qualidade na imagem.

Intra-frame: É a compressão realizada usando redundância/entropia espacial, ou seja, a compressão de cada frame é totalmente independente de outros frames. Conhecido também como Short GOP.  Por ser somente dentro do próprio frame, o processamento é rápido, perda é pequena (só ele) e por isso é bem mais fácil na edição (não depende de outras imagens), mas o problema é que gera grande volume de dados, ou seja, alta taxa de transferência, consequentemente necessita de espaço de armazenamento muito maior do que inter-frame. É utilizada nas filmadoras profissionais de alta qualidade (principalmente Broadcast) e nas imagens do cinema digital (DCI - Digital Cinema Initiatives).

Formatos de vídeo HD

A seguir, alguns formatos mais utilizados em filmadoras de alta definição e outros mais específicos. Veja as principais especificações de alguns formatos na tabela abaixo.


HDV: High Definition Video. Criado em 2003 pelas empresas JVC, Sony, Canon e Sharp, originariamente para resoluções de 720p (HDV 1) e 1080i (HDV 2). Por utilizar a fita magnética do tipo DV (DV/miniDV), é um formato linear. Devido à restrição da fita magnética, apesar de capturar imagens em 1920x1080 pixels, a gravação é feita fazendo uma compressão na horizontal para 1440 (1440x1080). Atende a mercado profissional e doméstico, mas cada vez mais está sendo substituído por outros formatos não lineares. Detalhes no site da HDV.

AVCHD: Advanced Video Codec High Definition. Formato criado em 2006 pela Sony e Panasonic, inicialmente para filmadoras domésticas de alta definição, de armazenamento não linear (HDD, DVD, memória flash, etc.), mas devido a sua qualidade, hoje é utilizado também em algumas filmadoras profissionais. A grande vantagem deste formato é que, se gravado, por exemplo, num cartão de memória flash, poder ser reproduzido diretamente em alguns Players ou HDTVs que aceitem este formato e mídia. Surgiram os formatos complementares como AVCHD Lite para vídeo de até 720p30, e os profissionais AVCCAM pela Panasonic e NXCAM pela Sony. Detalhes no site da AVCHD.


TOD: A JVC criou um formato intermediário entre HDV e AVCHD utilizado na primeira filmadora que gravava em Full HD (HDV grava em 1440x1080), modelo GZ-HD7 lançada em janeiro de 2007 e em outros modelos posteriores (já com opção de TOD ou AVCHD). Este formato era praticamente um HDV (mesmos codecs e sistema) gravando na resolução de 1920x1080, utilizando mídia não linear (HDD e cartão de memória SD), com bit rate de até 30Mbps (média de 26.6Mbps). O áudio era, MPEG-1 audio layer 2, 48KHz/16bit, 384Kbps. Um formato que não recebeu um nome oficial e ficou conhecido pela sua extensão .tod, como o MOD.

XDCAM: Formato para mídia não linear, Professional Disc (disco óptico do tipo Blu-ray em cartucho), criado pela Sony em 2003, para resolução padrão (XDCAM SD), depois para alta definição (1440x1080) em 2006 (XDCAM HD). Em 2007 anunciou o XDCAM EX para gravar em cartão de memória SxS, onde a JVC licenciou este formato, mas para gravar em cartão de memória do tipo SD. Em 2008 apresentou o formato XDCAM MPEG HD422 para filmadoras profissionais de alta qualidade. Veja mais detalhes em XDCAM e XDCAM EX no site da Sony.


CANON XF: É um formato da Canon para filmadora profissional, baseado em codec MPEG-2 4:2:2 Full HD, Long GOP de 50Mbps (CBR) ou em subamostragem 4:2:0 em até 35Mbps (VBR). É compatível com MXF (Material eXchange Format), que é um formato aberto, definido pelo padrão SMPTE, por isso é aceito na maioria dos softwares de edição profissional. Contém áudio, vídeo e metadados (metadata), que são dados que descrevem o material contido como, tipo de arquivo e outros atributos específicos relacionados ao arquivo (informação da câmera, data, hora, etc.). O vídeo é armazenado em cartão de memória CF (Compact Flash) e fotos e outros dados em cartões do tipo SD. O áudio é normalmente LPCM de 48KHz/16bit estéreo. Veja mais detalhes no site da Canon.

AVC-Intra: É o formato da Panasonic, apresentado em 2007, baseado em H.264/MPEG-4 AVC, para armazenar em cartão de memória P2, na compressão intra-frame, para filmadoras profissionais de alta qualidade. Tem três classes que são: AVC-Intra 50 de 50Mbps, AVC-Intra 100 de 100Mbps (CAVLC - Context Adaptive Variable Length Coding, tipo lossless) e AVC-Ultra que suporta  imagens 3D e que pode ter uma imagem de 1920x1080/24p e 2048x1080/24p 4:4:4 a 12 bit, bit rate de até 200Mbps. Veja mais detalhes no site da Panasonic.

Câmeras compactas: As câmeras digitais/filmadoras compactas de alta definição, utilizam normalmente formatos de vídeo com qualidade inferior, de menor taxa, mesmo sendo Full HD. Veja alguns formatos em Filmadora Full HD compacta.

Atualizações

10/fev/2013: A ITU (International Telecommunication Union) anunciou em 25/01/2013, um novo padrão de compressão de vídeo H.265, conhecido como HEVC (High Efficiency Video Coding). É o padrão de compressão sucessor de H.264/MPEG-4 AVC. Consegue o dobro de compressão do antecessor e pode suportar o vídeo UHD (Ultra High Definition) de até 8K (8.192x4.320). Mais detalhes, veja o press release da ITU.


Veja também:
Cartão de memória flash
Filmadora de alta definição
Câmera fotográfica
Câmera digital de lente intercambiável sem espelho
Imagem de alta definição
Imagem RAW
Transferência de imagem e som HD