Olá!

Bem-vindo ao meu blog.


Aqui será postado o conteúdo de minhas aulas de interface homem-máquina.


Professor Samuka

visite:
Comunidade IHM




quarta-feira, 5 de agosto de 2009

Princípios de Áudio - parte II



DESCRIÇÃO SIMPLIFICADA DE UMA PLACA DE SOM


PLACA DE SOM

Quando for gravar no computador usando qualquer software como por exemplo o Sound Forge ou audacity, você precisa definir qual(is) entrada(s) você quer que ele grave. Dependendo da placa de som pode ser que só se possa selecionar uma entrada por vez.

No canto inferior direito do windows, possui uma figura como um alto-falante que serve para você definir os controle de volumes para Ouvir (Play Control) e para Gravar (Recording).


As placas de som normalmente possuem conectores do tipo:

Line In,

Mic,

Line Out,

Headphone e/ou Speaker.


Para acessar as configurações basicas de audio do seu pc clique duas vezes no icone na barra do menu iniciar, no windows xp este icone geralmente fica ao lado do relógio.


Através do menu opções, no item propriedades do painel de volume principal, você pode acessar o painel de propriedades para selecionar os dispositivos de reprodução e gravação de áudio, alem de configurar os controles deslizantes que estarão visíveis para ajustar o volume.


FORMATOS DE ÁUDIO

Tipos básicos de formatos de arquivo:

Os parâmetros de dados de áudio e codificação são feitos explicitamente em alguma forma de cabeçalho;

Os parâmetros de dados de áudio e codificação são fixos.

Não comprimidos

PCM - Padrão básico para conversão de sinais analógicos para armazenamento ou transmissão em dispositivos digitais. Esta codificação é feita sem uso de algoritmos de compressão. A maior parte dos formatos de arquivos não comprimidos é própria de sistemas operacionais específicos.









Waveform Audio

Formato de áudio digital do Windows.

Desenvolvido pela IBM para o Windows 95.

Os arquivos neste formato utilizam a extensão wav.

RIFF Waveform Format

Formato de som Wave da Microsoft Windows.

Usado para o sistema de som Windows.

Arquivos Waveform RIFF têm extensão WAV.

Audio Interchange File Format (AIFF)

Formato de áudio utilizado pela Apple.

A extensão destes arquivos pode ser aiff ou aif.

Formato de voz Creative

Formato de som da Sound Blaster.

Tem a extensão VOC.

Formato de Amostra de 8 bits crus (RAW)

O formato do som não contém codificação ou compressão.



REPRESENTAÇÃO HEXADECIMAL DE UM TRECHO DE UM ARQUIVO WAVE



REPRESENTAÇÕES DE ÁUDIO DIGITAL

O áudio digital é construído por um grande número de pedaços de informação designadas por amostras. Cada amostra contém informação sobre a amplitude (ou volume sonoro) de um som em um dado instante. Esta representação assemelha-se em tudo à representação das imagens bitmap em que cada pixel possui um determinado valor de brilho e uma localização espacial específica. No caso de áudio, cada amostra possui uma amplitude e uma localização temporal específica. No caso das imagens bitmap, os pixéis, quando combinados, constituem uma determinada imagem. No caso do áudio digital é a combinação das amostras que constitui um determinado som.

Os fatores mais importantes que determinam a qualidade de uma forma de onda de áudio digitalizada são os seguintes:

  • A taxa de amostragem.
  • A dimensão da amostra, isto é, o número de bits utilizados para codificar cada uma das amostras.
  • O número de canais (pistas).
  • O tipo de intercalação utilizado.
  • O método de codificação utilizado, podendo envolver a compressão do áudio.

Taxa de amostragem

A taxa de amostragem é o número de vezes por segundo que se retém uma amostra do áudio analógico. A utilização das taxas de amostragem mais elevadas permite produzir uma seqüência de áudio digital com mais qualidade, da mesma forma que as imagens com altas resoluções apresentam melhor qualidade. A taxa de amostragem a utilizar depende assim do tipo de som que se pretende produzir, bem como da quantidade de memória e de espaço de armazenamento disponível no sistema a que se destina. As taxas de amostragem mais elevadas consomem, como seria de esperar, um espaço de armazenamento maior. Por exemplo, um clip sonioro com uma qualidade CD (taxa de amostragem de 44,1 KHz) exige um espaço de armezenamento cinco vezes superior ao espaço exigido pelo mesmo clip quando é mostrado com qualidade telefônica (taxa de amostragem de 8 KHz).


Taxa de amostragem

Largura de banda utilizável

Comentário

44,1 KHz

20Hz – 20KHz

Equivale à largura de banda da audição humana

22,050 KHz

20Hz – 10KHz

Equivale à metade da largura de banda da audição humana

11,025 KHz

20Hz – 05KHz

Equivale à um quarto da largura de banda da audição humana

Formas de compressão de um arquivo de áudio:

  • Com perdas de informação;
  • Sem perdas de informação.

Formatos de compressão com perdas

Os mais populares provêm da família dos Motion Picture Experts Group (MPEG).

MPEG - refere-se a uma família de padrões para áudio e vídeo que inclui o MPEG-1, MPEG-2, MPEG-1 Layer 3 (MP3) e o MPEG-4.

Formatos:

MPEG-1 -> Padrão para vídeo e CD-ROM

MPEG-2 -> Padrão para DVD e TV digital

MPEG-1 – Layer 3 (MP3) -> Os arquivos apresentam tamanhos pequenos e com um som de qualidade. A sua característica principal é a sua universalidade.

MPEG – Layer 3 (MP3) -> Formato muito utilizado nas transmissões de música pela Internet. O seu processo de compactação funciona através da eliminação de frequências sonoras não audíveis pelo ouvido humano. Transforma arquivos com 40MB de tamanho em 4MB, mantendo uma qualidade razoável.

MPEG 4 Audio AAC -> O MPEG-4 é o padrão que permite introduzir áudio e vídeo na Internet, em dispositivos móveis, em jogos e em aparelhos sem fios, ...





COMPRESSÃO DE ÁUDIO

Diferente de imagens ou vídeo, existe pouca relação entre amostras vizinhas ou quadros consecutivos para o áudio. Os níveis de compressão práticos são limitados para muito menos de 10:1 (compressão de vídeo de 25:1 pode ser produzida).

Os algoritmos de compressão funcionam de forma similar à compressão de imagens. Arquivos comprimidos ocupam menos espaço que os arquivos iniciais e resultam da eliminação de informação redundante e outras informações de áudio com pouca influência na qualidade do mesmo

Métodos de compressão de áudio digital

Foram desenvolvidos vários métodos de compressão de dados de áudio com o intuito de reduzir o espaço de armazenamento e os custos associados à transmissão do áudio digital. Os métodos de compressão mais utilizados no âmbito da produção de áudio para aplicações multimídia incluem o PCM (Pulse Code Modulation), o ADPCM (Adaptive Delta Pulse Code Modulation) e o MP3 (MPEG – 1 Layer III).

O método PCM constrói um sinal digital a partir de uma série de impulsos. Os sinais PCM fazem uma boa utilização da largura de banda e são menos sensíveis a interferências quando comparados com outros métodos de codificação de dados digitais, tais como o PAM ( Pulse Amplitude Modulation). No contexto da codificação de áudio digital, um valor PCM é simplesmente uma seqüência de amostras descomprimidas, pelo que possui um débito binário muito elevado. No entanto, como não comprime o áudio digital, o método PCM funciona como formato de referência para outros métodos de compressão.

O método DPCM permite reproduzir o débito binário do PCM através da codificação das diferenças entre valores das amostras. Cada amostra é substituída por um único bit que indica o sinal da diferença entre ela própria e a amostra interior. Durante o processo de descodificação, as amostras são reconstituídas processando-se a diferença e adicionando essa diferença a ultima amostra decodificada . Esse último valor indexa uma tabela de fatores de escala que determina o valor real da diferença. Os fatores de escala dependem das amostras originais e são determinados durante a codificação.

O método ADPCM foi utilizado no sistema CD-i (Compact Disc-interactive), agora obsoleto, mas continua a ser utilizado na compressão de seqüências de áudio digital para aplicações multimídia e telefonia digital. Por exemplo, os formatos AIFF e WAVE do MS Windows representam áudio digital codificado no formato ADPCM. Para a telefonia digital, o ADPCM utiliza-se no formato G. 721. A compressão ADPCM fornece rácios de compressão que variam desde 2:1 a 4:1.

O método da compressão MP3 (MPEG-1 Layer III) é o terceiro esquema de codificação para a compressão de sinais de áudio especificado na norma MPEG-1. O layer III utiliza um método de compressão com perdas que se designa por codificação perspectiva. Esta codificação baseia-se na teoria psicoacústica e funciona de modo a eliminar do sinal sonoro original apenas a informação auditiva irrelevante, ou redundante, que o ouvido humano não consegue detectar. Para além disso, o layer III utiliza uma transformada que se designa por MDCT (Modified Discrete Cosine Transform). Em termos práticos, o MPEG-Layer III permite obter um rácio de compressão de 1:12 sem perda aparente de qualidade. Isto significa que, por exemplo, a compressão de um segundo de áudio com qualidades CD-DA, possuindo um débito binário de 1411,2 Kbit/s, resulta num débito de 112 a 128 Kbit/s, quando comprimido com o compressor MPEG-Layer III.




Editores de Áudio

AudaCity

Editor de áudio gratuito, para você gravar sons, tocar músicas, importar e exportar arquivos WAV, AIFF e MP3 e muito mais. Use-o para editar sons, corta-lo, copiar e colar pedaços de som, com undo infinito. Misture músicas ou aplique efeitos já contidos no programa.

Cool Edit Pro

Desenvolvido pela Sytreilium Software Corporation para plataforma Windows.

Possui uma elevada variedade de efeitos DSP, e suporte para um grande número de formatos de arquivos.

Sound Forge

Indicado para a criação e edição de som digital sob Windows.

Editor de áudio de uso fácil, apresenta diversos recursos úteis ao desenvolvimento de projetos em multimídia.


Nenhum comentário: