Áudio e Vídeo analógico
RESUMO
Trabalho com intuito de mostrar as noções básicas de vídeo e áudio analógicos e sua conversão para o digital.
EXEMPLO
SUMMARY
I work with the intention of showing how analogical video and audio basics and their conversion to digital.
EXAMPLE
1 INTRODUÇÃO
Sinal analógico é o nome popularmente dado, na língua portuguesa, a sinais analógicos provenientes de dispositivos que os contêm. Estes são sinais contínuos cuja variação em relação ao tempo é a representação proporcional de outra variável temporal. Um velocímetro analógico de ponteiro, um termômetro analógico de mercúrio e uma balança analógica de mola são exemplos de dispositivos que contêm sinais analógicos.
Popularmente, dispositivos que utilizam a tecnologia de sinais análogos são classificados no português como dispositivos analógicos. É provável que a confusão entre os termos ocorra por serem parônimos. A possível incorreta tradução do termo inglês "analog", encontrado em especificações de dispositivos que fazem uso de sinais análogos, também pode ter facilitado a difusão do termo e falaciosamente embasado sua falsa validade semântica.
Apesar de o termo utilizado ter adquirido um novo significado prático, o adjetivo alterado herda uma inconsistência semântica com as definições preexistentes na língua portuguesa; a definição do termo "análogo" é "o que condiz às qualidades atribuídas". No entanto, a inconsistência semântica não torna o uso de "sinal analógico" inválido se considerada a pragmática.
Através da atribuição da expressão "dispositivo analógico" para dispositivos que contêm sinais análogos, fica em falta um termo técnico para se apontar unicamente a dispositivos "literalmente" analógicos (cuja função é definida por analogia relativa).
2 Questão 01- Explique de forma detalhada como ocorre o processo de digitalização tanto de áudio quanto de vídeo analógicos, dando, inclusive, exemplos.
2.1 Respostas
Áudio: um microfone converte as ondas de pressão do som em mudanças de tensão em um fio: a alta pressão se transforma em tensão positiva, e a baixa pressão se transforma em tensão negativa. Quando essas mudanças de tensão percorrem um fio de microfone, elas podem ser gravadas em fita como mudanças na intensidade magnética ou em discos de vinil como mudanças no tamanho das ranhuras. Um alto-falante funciona como um microfone ao contrário, obtendo os sinais de tensão de uma gravação de áudio e vibrando para recriar a onda de pressão.
Ex: som que sai do microfone.
Vídeo: as placas de captura de vídeo digitalizam o sinal analógico de vídeo através da conversão de cada frame numa imagem bitmap. Processam uma linha de cada vez, sendo estas divididas em pixeis. Por exemplo: para o PAL as linhas são divididas em 768 Pixeis. Para cada pixel é calculado o valor de cada componente RGB. Digitalização de Vídeo Analógico O valor 768 resulta do aspect-ratio do PAL que é 4:3. Como o PAL tem 625 linhas, onde 50 são usadas para tele texto não tento visibilidade na imagem, apenas 575 linhas são verdadeiramente usadas. Para obter a proporção 4:3: 575×4∕3=766,7. Como estamos a tratar de tecnologia digital têm de ser considerados valores inteiros. Assume-se que o número de linhas é 576. Para calcular o número de pixeis em cada linha basta fazer o seguinte cálculo: 576×4∕3=768 Generalizando: O número de pixeis por linha é calculado da seguinte forma: nº de linhas×aspect ratio Após a digitalização cada frame será uma imagem bitmap com a resolução de 768×576. • Cada um desses pixeis necessita de 3 Bytes para representar as cores: 8 bits para o R, 8 bits para o G e 8 bits para o B. Total = 24 bits. Desta forma pode dizer-se que para representar um frame são necessários: 768×576×24 = 1,327 MBytes Quantos Bytes seriam necessários para a representação de 1 segundo de vídeo PAL ? • O PAL usa 25fps, então: 1,327×25 = 33,175 MBytes E se fosse 1 hora de vídeo ? Digitalização de Vídeo Analógico 1 hora de vídeo: 33,17 MB × 60 segundos × 60 minutos = 119430 MBytes / 1024 ≈ 116 GBytes A maior parte das placas de aquisição de vídeo usa o modelo YUV onde apenas são usados 16 bits na representação de cada pixel. Neste caso para 1 segundo seria necessário: 768 ×576×16×25=22 MBytes. Nos EUA e no Japão a corrente eléctrica é distribuída a 60Hz e por isso a norma NTSC usa essa frequência de varrimento. Como o NTSC usa 525 linhas, onde apenas são usadas 480. 480×4/3= 640. A resolução 640×480 é exactamente a resolução VGA (Video Graphic Adapter) usada inicialmente pelos PC. Será coincidência? Digitalização de Vídeo Analógico • Não é coincidência. Os primeiros PCs foram pensados para poderem ser ligados a TVs. O PAL integral usa a resolução de 768×576 para sinais com qualidade de difusão. • A edição de vídeo analógico necessita de sinais com este nível de qualidade. Porém, a a captura de vídeo destinada a aplicações multimédia não é necessário usar o PAL integral. Normalmente usam-se apenas metade das linhas, 288 linhas de cada campo par e 288 linhas de cada campo impar. Para se obtiver as proporções de 4:3 cada linha terá de ser dividido em 384 pixeis, o que origina frames com 384×288 (ou 320×240 para o NTSC).
3 Questão 02- O que é amostragem áudio? O que é codificação de áudio?
3.1 Respostas
A taxa de amostragem exibe o número de instantâneos digitais obtidos de um sinal de áudio a cada segundo. Essa taxa determina a faixa de frequência de um arquivo de áudio. Quanto mais alta for a taxa de amostragem, mais semelhante será a aparência da forma de onda digital da aparência da forma de onda analógica original. Taxas de amostragem baixas limitam a faixa de frequências que pode ser gravada, o que pode resultar em uma gravação que representa insatisfatoriamente o som original.
Duas taxas de amostragem
A. Baixa taxa de amostragem que distorce a onda de som original.
B. Alta taxa de amostragem que reproduz perfeitamente a onda de som original.
Para reproduzir uma frequência específica, a taxa de amostragem deve ter pelo menos duas vezes essa frequência. Por exemplo, CDs têm uma taxa de amostragem de 44.100 amostras por segundo e, portanto, podem reproduzir frequências de até 22.050 Hz, que estão além do limite da audição humana de 20.000 Hz.
4 Questão 3- O que é quantização de áudio? O que é quantização de vídeo? O que se entende por ruído de quantização?
4.1 Resposta
Quantização de áudio. Trata-se do processo de conversão das amostras contínuas ara valores discretos. O uso de oito bits por amostra é considerado satisfatório para áudio em diálogo comum, mas amostras de áudio de alta fidelidade são normalmente digitalizadas a 14 ou 16 bits por amostra, provendo uma granularidade maior.
Ruído de quantização. Quando a medição é digitalizada, o número de bits utilizados para representar o sinal de medição determina o máximo possível à relação de ruído. Isto é porque o nível de ruído mínimo possível é o erro causado pela quantização do sinal, por vezes, chamado de ruído de quantização.
A partir das amostras obtidas pelo processo de amostragem, podemos quantificar as amplitudes, que pertencem a um intervalo contínuo de valores, em um conjunto finito de valores possíveis, chamados níveis de quantização.
Cada amplitude é alocada ao nível de quantização mais próxima, ou seja, ao nível que leve ao menor erro absoluto. O conjunto de níveis possíveis é definido pelo numero de bits que serão usados para a codificação. Assim, por exemplo, se o numero de bits do sinal quantizado for, o sinal ter níveis. O numero de níveis é sempre obtido fazendo-se, Onde é o numero de bits utilizado, já que estamos considerando um código binário. Para minimizar o erro de quantização, dado pela diferença entre a entrada não quantizada e a saída quantizada, é necessário buscar o melhor método de quantização, o que
depende do sinal que está sendo considerado. O processo de quantização uniforme possui intervalos de amplitudes divididos de forma uniforme, ou seja, igualmente espaçados.
A quantização uniforme é bastante aplicada em sinais que não possuem um range dinâmico alto, ou seja, a diferença entre sua amplitude mínima e máxima é pequena. Em sinais que possuem um range dinâmico alto, a quantização uniforme pode resultar em erros de quantização muito altos, como mostraremos na seção IV deste artigo. Neste caso, é mais interessante utilizar métodos de quantização não uniformes. Assim os níveis de quantização podem acompanhar as variações do sinal, ficando mais próximos para descrever amplitudes menores e mais distantes para amplitudes maiores. Para a construção de um quantizador não uniforme, é necessário encontrar valores de quantização adequados para cada região do sinal, exigindo quantizadores diferentes para tipos de entradas diferentes. Este tipo de quantizador pode ser
difícil de ser criado. Uma solução eficiente é primeiramente comprimir o sinal de entrada, e em seguida, aplicá-lo a um quantizador uniforme. Assim obtém-se o mesmo efeito de um quantizador não uniforme.
5 Questão 04- Tabela 01- Frequência de Digitalização de Áudio
6- Questão 05- Em se tratando de vídeo temos pelo menos 03 padrões distintos: NTSC, PAL e SECAM. Explique a diferença entre cada um deles e mostre o padrão de resolução e qualidade adotado em cada caso, bem como as taxas de amostragem. Além de explicar essas características elabore uma tabela comparativa que contenha as principais delas.
6.1 Resposta
O PAL e o NTSC são diferentes sistemas de televisão analógicos utilizados por diferentes países. O NTSC é usado principalmente na América do Norte, partes da América do Sul (exceto Brasil, Argentina e Guiana Francesa), Coreia do Sul, Taiwan, Japão, etc., enquanto o PAL é adotado pela maioria dos países do mundo. Além do PAL e do NTSC, o SECAM é outro sistema usado principalmente na França, Leste Europeu e vários países da África ocidental.
As principais diferenças entre o vídeo PAL e NTSC são a resolução e a velocidade de fotogramas. O NTSC tem uma resolução de 720x480 e uma velocidade de fotogramas 23.97. NTSC (o formato padrão para DVDs norte-americano )
SECAM também escrito SÉCAM, é uma televisão em cores analógica sistema utilizado pela primeira vez em França. Era um dos três principais padrões de televisão em cores, sendo os outros o PAL europeu e o NTSC norte-americano.
BASICAMENTE: TODOS SÃO SISTEMAS DE TELEVISÃO, UTILIZADOS EM PAÍSES DIFERENTES. PAL NA MAIORIA DOS PAÍSES, NTSC NA AMÉRICA DO NORTE E PARTE DA AMÉRICA DO SUL, E SECAM NA EUROPA.
PADRÃO DE RESOLUÇÃO E QUALIDADE
NSTC: O sistema NTSC apresenta 525 linhas de resolução, das quais 480 são a imagem visível e as outras 45 são as VBI, que servem para estabelecer o tempo que o feixe de electrões necessita para se reposicionar, do final de um frame para o início do próximo frame.
(Este formato de vídeo transmite 60 meios-frames por segundo (mais exatamente 59,94), ou seja, apresenta 29,97 fps (ou quadros) por segundo.). A varredura é por isso, intercalada.
Este sistema padrão do NTSC, de 59,94 campos por segundo, é baseado no tipo de sistema eléctrico utilizado nos países que usam uma corrente alternada de 60 ciclos por segundo, ou 60 Hertz (Hz).
O NTSC tem uma relação de aspecto de 4:3. Com este sistema de vídeo, conseguem-se obter até 16 milhões de cores diferentes.
É incompatível com a maioria das placas de vídeo de computador, que usam sinais de vídeo RGB (red, green, blue – vermelho, verde e azul). Contudo, consegue-se, por meio de adaptadores de vídeo, converter sinais NTSC em sinais para placas de vídeo para computador e vice-versa.
PAL: Tem uma melhor qualidade de imagem, já que dispõe de um maior número de linhas de varrimento. O sistema PAL apresenta mais 100 linhas de resolução, comparativamente ao sistema NTSC, ou seja, 625 linhas de resolução. Em contrapartida, e para fazer face ao tipo de corrente alternada que é usada na Europa, de 50hz (50 ciclos por segundo), tem um varrimento de 50 meios-frames por segundo, ou mais exatamente, 25 frames por segundo, tornando a imagem por vezes um pouco “tremida”, apesar da sua qualidade muito acima do sistema Americano NTSC.
SECAM: Tal como no sistema PAL, também o sistema SECAM transmite 625 linhas de resolução, das quais 576 são visíveis. Também usa a mesma frequência de varrimento do sistema PAL, de 50 varrimentos por segundo, 50 Hz. Difere do sistema PAL na medida em que a transmissão da cor é feita de maneira diferente, de uma forma sequencial: vermelhos e amarelos numa linha e azuis e amarelos na próxima linha.
Hoje em dia, muitos dos trabalhos são realizados em sistemas de vídeo que suportem 576 linhas de resolução (PAL e SECAM) ou de vídeo composto (PAL), sendo depois convertidos para SECAM para a transmissão.
CURIOSIDADES
NTSC: Algumas pessoas, apelidavam o Sistema NTSC como Never Twice the Same Color, ou nunca a mesma cor duas vezes, pondo em questão a qualidade e estabilidade do sistema, comparativamente ao sistema PAL, de maior qualidade e estabilidade.
PAL: O sistema PAL foi criado para resolver o problema da variação de cor do sistema NTSC. Muitos chamavam este sistema de Perfection at Last, já que a qualidade de imagem era muito superior ao sistema NTSC. Outros davam-lhe o nome de Pay A Lot, já que os circuitos usados eram muito complexos e caros.
SECAM: Sistema SECAM L – Usado na França e nas suas antigas colónias;
Sistema SECAM B/G – Usado no Médio Oriente. Foi também utilizado na Grécia e na antiga Alemanha Oriental;
Sistema SECAM D/K – Utilizado na antiga União Soviética e na Europa Oriental.
7- Questão 06- Em relação aos sistemas de cores, especifique qual deles cada padrão de vídeo (NTSC, PAL e SECAM) adota, além de como as cores são formadas.
7.1 Respostas
Estágios de Cor no NTSC
O sinal de crominância é injetado diretamente nos demoduladores (B-Y) e (R-Y). Para a demodulação basta o sincronismo com a portadora 3,58 MHz fornecida pelo oscilador, defasada 90º para (R-Y) e sem defasagem para (B-Y). A saída dos demoduladores é (B-Y) e (R-Y) na faixa de 0 a 0,5 MHz, sem qualquer problema de alternância. O separador de burst filtra o burst durante o apagamento horizontal, enviando-o para o AFPC (Automatic Frequency and Phase Control - Controle Automático de Frequência e Fase), sincronizando o oscilador a 3,58 MHz com o burst. Ainda no AFPC é gerada para o inibidor uma tensão indicativa da presença ou não de burst, para transmissão a cores ou preto e branco. De acordo com esta tensão o inibidor corta o amplificador de crominância (transmissão preto e branco), ou não (transmissão a cores). O CAG (Controle Automático de Ganho) recebe uma amostra do burst e de acordo com sua amplitude altera o ganho do amplificador de crominância, estabilizando o nível do sinal amplificado. Como a matiz das cores no NTSC é muito instável, sendo facilmente alterado por interferência na transmissão, os receptores deste sistema dispõem de um controle acessível ao telespectador (Controle de Cor) que corrige a fase do oscilador com 3,58 MHz.
O NTSC tem uma relação de aspecto de 4:3. Com este sistema de vídeo, conseguem-se obter até 16 milhões de cores diferentes.
Características do Sistema SECAM
Tal como no sistema PAL, também o sistema SECAM transmite 625 linhas de resolução, das quais 576 são visíveis. Também usa a mesma frequência de varrimento do sistema PAL, de 50 varrimentos por segundo, 50 Hz. Difere do sistema PAL na medida em que a transmissão da cor é feita de maneira diferente, de uma forma sequencial: vermelhos e amarelos numa linha e azuis e amarelos na próxima linha.
Características do Sistema PAL
Tem uma melhor qualidade de imagem, já que dispõe de um maior número de linhas de varrimento. O sistema PAL apresenta mais 100 linhas de resolução, comparativamente ao sistema NTSC, ou seja, 625 linhas de resolução. Em contra-partida, e para fazer face ao tipo de corrente alternada que é usada na Europa, de 50Hz (50 ciclos por segundo), tem um varrimento de 50 meios-frames por segundo, ou mais exactamente, 25 frames por segundo, tornando a imagem por vezes um pouco “tremida”, apesar da sua qualidade muito acima do sistema Americano NTSC.
8 Questão 07- Os vídeos digitais são produzidos em formatos de baixo débito (LDR) e formatos de alto débito (HDR). Diferencie cada um deles, mostrando quando são utilizados os objetivos de cada um e as características técnicas, bem como as variações de formatos existentes. Além disso, mostre a relação entre cada um desses com as taxas de compressão.
8.1 Resposta
Formatos de Alto Debito para Vídeo Digital.
Os formatos de alto débito (HDR) possuem um grau de compressão muito baixo ou mesmo inexistente, e beneficiam da qualidade de imagem e a facilidade do processamento.
Estes formatos são muito utilizados na pós-produção profissional.
Os formatos de alto débito para vídeo digital incluem os seguintes:
– O formato Digital Component Vídeo (ITU-R BT.601, conhecido por CCIR-601);
– O formato Digital Composite Vídeo
– Os formatos CIF (Common Intermediate Format) e QCIF (Quarter CIF);
– O formato Digital HDTV.
Formatos de Baixo Débito para Vídeo Digital
Os formatos de baixo débito para vídeo digital (LDR) permitem reduzir os elevados data rates associados aos formatos de alto débito, possibilitando a utilização de vídeo e aplicações multimédia.
Os formatos de baixo débito para vídeo digital mais comuns incluem:
– O formato DV (Digital Video) para equipamento destinado ao mercado de consumo e sem i - profissional;
– A família de formatos MPEG (Motion Pictures Expert Group) para equipamento profissional e DVD-Video;
– O formato AVI (Audio Video lnterleaved) utilizado no MS Windows;
– O formato QuickTime da Apple utilizado no MacOS;
– A recomendação H.261 para videoconferência.
9 Questão 08- Tabela 02- Formatos de Vídeo
10 REFERÊNCIAS
1 https://helpx.adobe.com/br/audition/using/digitizing-audio.html
2 http://marco.uminho.pt/disciplinas/TELEMEDIA/VideoDigital.pdf
3 https://helpx.adobe.com/br/audition/using/digitizing-audio.html
4 http://www.sony.com.br/electronics/alta-resolucao-audio
5 https://br.answers.yahoo.com/question/index?qid=20090713072159AAvrplS
6 http://www.digitizationguidelines.gov/term.php?term=samplingrateaudio
7 https://www.tecmundo.com.br/musica/2105-qualidade-de-audio.htm
8 https://pt.wikipedia.org/wiki/Lista_de_resolu%C3%A7%C3%B5es_de_v%C3%ADdeo
9 https://pt.wikipedia.org/wiki/Sinal_anal%C3%B3gico

Comentários
Postar um comentário