Olá!

Bem-vindo ao meu blog.


Aqui será postado o conteúdo de minhas aulas de interface homem-máquina.


Professor Samuka

visite:
Comunidade IHM




quarta-feira, 5 de agosto de 2009

Editores de áudio e Efeitos





Editores de áudio

Um editor de áudio digital é definido como uma aplicação informática para manipulação de áudio digital.

Um criador de multimídia, normalmente utiliza o editor áudio para gravar, editar a duração , misturar várias faixas de som, aplicar efeitos e efetuar a conversão entre diferentes formatos de arquivo de áudio.

Hoje, gravar e mixar, pura e simplesmente, sem realizar uma boa limpeza de ruídos ou corrigir certos “deslizes” na afinação da voz ou de instrumentos solistas, já é coisa do passado. A conversão de formatos de arquivo, a restauração de antigas gravações, a edição de sons para sampler ou a finalização dos arquivos musicais para masterização de CDs dependem dos editores de áudio. Combinado a um gravador multipista, a um sampler ou operando sozinho, o editor é uma ferramenta indispensável em todos os trabalhos do estúdio.

A gravação de áudio pode ser feita ao vivo através de um microfone ou mixer. Além disso, a digitalização de sons de fitas cassete, discos de vinil ou minidiscs (MDs) é um processo descomplicado através de softwares. Trabalhando em conjunto com algumas placas de som, podemos até capturar transmissões de rádio ou quaisquer outros sons reproduzidos no seu computador.

Existem inúmeros editores de áudio digital que podem ser utilizados, e felizmente existem muitos bons editores que são open source (softwares livres).

Atualmente os softwares comerciais mais utilizados são o Soundforge e o Adobe Audition, porem existem algumas alternativas gratuitas que vamos apresentar.


Audacity

Audacity é um software livre (open source) para gravação e edição sons. Permite gravar, reproduzir e importar/exportar sons nos formatos WAV, AIFF, MP3 e OGG. É possível editar músicas usando cortes, copiar e colar e usar recursos como funcionalidades de desfazer/refazer ilimitadas, mixar faixas ou aplicar efeitos na gravação.

O programa também possui um editor de envelope de amplitude, espectrograma e uma janela para análise de freqüências e áudio em geral. Alguns dos efeitos incluem bass boost (reforço nos graves), wah wah e remoção de ruído. O programa suporta plug-ins VST, os mais utilizados na área da edição de áudio.

O Audacity é versátil: você pode importar áudio, editá-lo e combiná-lo com outras novas gravações. Exporte suas músicas nos formatos mais populares como WAV, AIFF, AU e OGG Vorbis — sem falar no tradicional MP3 através da biblioteca de codificação LAME opcional. Se você planeja copiar suas gravações para CD, o software também cria os arquivos WAV ou AIFF.

Exportando em MP3:

Para exportar arquivos no formato MP3, é necessário fazer o download optativo de um arquivo .DLL, para informar-se sobre como conseguir o arquivo, basta abrir o Audacity, clicar no menu Arquivo e selecionar a opção Exportar para MP3. Salve um nome de arquivo qualquer e o Audacity informará o nome do arquivo e como consegui-lo.

Efeitos:

A variedade de efeitos é uma das marcas do programa. Divirta-se ou module passagens com efeitos como o pitch(afinação) sem alterar o tempo; remova ruídos de fundo, chiados e outros de maneira acessível.

Ajuste freqüências através da equalização, do filtro FFT e efeitos como o Bass Boost (este último é útil no destacamento de graves, especialmente na música eletrônica). Compressores de volume, amplificadores de freqüências e efeitos de normalização completam o pacote das funções mais tradicionais.

Para quem procura por maior diversidade, fazem-se presentes Eco, Phase, Wahwah, Inversão, entre outras preciosidades.

Qualidade do Som:

A gravação e a edição podem ser feitas em amostras de 16-bit, 24-bit e 32-bit (ponto flutuante) em até 96 KHz. As taxas de amostragem e os formatos são convertidos através de mecanismos de alta qualidade, em tempo real.

Plug-Ins:

Audacity, como todo software de produção sonora que se preze, possui suporte aos padrões de plug-ins mais conceituados. Entre eles estão LADSPA e VST; este é amplamamente conhecido e utilizado na área. Caso você precise de mais e entenda um pouquinho de programação, há uma linguagem chamada Nyquist que permite a confecção de novos efeitos para o Audacity.



Sound Forge

O Sound Forge é considerada uma das mais poderosas — senão a mais poderosa — ferramentas de edição de áudio do mercado. Utilizado em grande parte dos estúdios de gravação e edição de áudio, este software de poder de fogo incrível está presente também nas casas de editores amadores.

Efeitos:
Em uma das maiores gamas de efeitos especiais nativos, estão presentes tanto os efeitos mais simples como flange,pitch (afinação) e eco até os mais robustos como wave hammer.

Gravação de áudio e correção de defeitos:
Sound Forge também é capaz de capturar áudio do microfone e da entrada Audio In de sua placa de som. Além disso, o incômodo chiado das gravações de voz e de compilações de fitas cassete e discos de vinil pode ser anulado através de correções dignas de estúdios profissionais.

Além disso é
possível criar transições de volume de áudio em suas músicas. Todos esses recursos juntos permitem grandes ganhos de qualidade de áudio para usuários conhecedores de ferramentas de edição.


Steinberg WaveLab


O mais rápido dos programas profissionais de edição e masterização de áudio para Windows. Combinando editores estéreo fáceis de usar com uma rica coleção de recursos, o WaveLab oferece poderosas ferramentas de edição e uma linha de processadores de efeitos virtuais de alta qualidade. Tem recursos para queima de CDs, análise dos arquivos em tempo real e processadores de lote, que processam um conjunto de arquivos de uma vez, além de corretor de afinação e ferramentas para restauração de gravações antigas. A última versão suporta samples, ASIO, WDM, uma vasta coleção de formatos de áudio, assim como resoluções de até 32 bits e 192 kHz e o processador de dither Apogee UV22 HR. Com sua exclusiva janela












Reverb

O efeito Reverb é formado por um grande número de ecos distintos chamados reflexões. Antigamente o reverb era obtido com câmaras de reverberação naturais (recintos com propriedades acústicas específicas - especialistas em acústica projetavam essas salas (para concertos ou para gravação) para que produzissem determinada característica sonora e reverberação ambiente). Devido ao grande trabalho, nas décadas de 1950/60 inventaram dois métodos de se obter reverb artificialmente, eram os reverbs de mola e de placa. Com o desenvolvimento da tecnologia, surgiram os processadores digitais de reverb, que tenta oferecer uma simulação do fenômeno real da reverberação (e em alguns casos, uma reverberação surrealista), utilizando para isso algoritmos computacionais.

Reverb analógico - Em um ambiente natural a amplitude e o brilho de cada uma dessas reflexões decaem independentemente ao longo do tempo, sendo influenciados por algumas características das quais ressaltamos:

O timbre, com perdas de frequências principalmente agudas e isso não é ruim pois é o reverb natural;

Pelo tamanho e geometria do local;

Pelos materiais que o constituem. Diferentes materiais absorvem diferentes tipos de frequências e isso influencia muito no reverb;

e pelos objetos que nele se encontram.

Bom o reverb analógico é o natural, como se estivesse em um ambiente ... Os pedais de reverbs "analógicos", simulam essas "imperfeições" do reverb natural.

Reverb Digital - Funciona como o analógico, porém, ao decair as reflexões não perde nenhum tipo de frequência ... funciona como se os materiais/objetos presentes em um ambiente não absorvessem nenhum tipo de frequencia e as reflexões só vão se atenuando sem alterações timbristicas ...

Reverb de mola - Em termos de som, eu incluo o reverb de mola no grupo dos analógicos, pois eles tem alterações em seu timbre conforme as reflexões decaem, assim como no analógico. O termo reverb de mola tem esse nome porque o reverb é obtido exatamente de molas. O dispositivo onde fica essas molas se chama tanque de reverb .A mola funciona como uma espécie de transdutor mecânico. Há uma bobina envolta em um campo magnético, que funciona com os mesmos princípios do alto-falante. Mas, ao invés de um cone se movendo e produzindo som, há uma mola que vibra. Ela recebe o sinal numa ponta e transmite-o por vibração até a outra. Mas, como a mola é elástica, a vibração ao chegar na ponta da saída bate e volta em sentido contrário, e fica indo e voltando pela extensão da mola. Cada vez que essa vibração corre a mola e atinge a saída ela manda de novo o mesmo sinal elétrico. Resultado: vários sinais defasados — uma simulação de eco. O eco de mola é extremamente prático e simples. Algumas mesas de som ainda contam com sistemas de eco de mola embutido. As maiores desvantagens desse simulador são a impossibilidade de controle dos parâmetros do eco (que dependem só do tamanho e elasticidade da mola) e a alta sensibilidade da mola, que faz com que o aparelho na qual ela esteja também se torne sensível. Numa mesa com um eco de mola ligado, por exemplo, qualquer mínimo toque na mesa faz com que a mola em seu interior vibre e provoque ruído.

Existem os parâmetros room, hall, plate e outros se referem ao tamanho da sala que simula, ou seja quanto maior a sala, maior o reverb, logo é uma simulação do ambiente real onde estaria sendo executada a musica, por isso é possível a alteração timbrística.

Os tipos reverb mas comuns são:

- Plate: sala pequena com superfícies muito reflexivas.

- Room: sala de porte médio – tem a intenção de soar um ambiente caseiro comum.

- Hall ou Cathedral: sala de grande porte, ambientes amplos – som de Catedral.

- Chamber Hall: câmaras de concerto.

- Spring: reverb de mola dos amplificadores de guitarra.

- Small: Tanques pequenos de duas molas. Simula ambientações de pequenas salas. Muito utilizado em fraseados de Blues e Hard Rock.

- Médium: Tanques grandes de duas molas. Simula ambientações de salas de concerto. Possui uma sonoridade encorpada e sofisticada.

-Large: Tanques grandes de três molas. Simula ambientações encontradas em grandes

auditórios. Utilizado em peças clássicas ou solos com notas de grande sustain.

Parâmetros comuns encontrados em editores de audio:

- Size: Determina o tamanho da sala que está sendo simulada pelo efeito, usualmente dado em volume cúbico.

- Predelay : Regula um dos parâmetros mais importantes do reverb: o tempo que decorre entre o sinal original e as primeiras reflexões. Isso é muito importante para criar um ambiente natural, já que numa sala real as primeiras reflexões chegam depois do sinal original. O tempo de predelay (em geral, abaixo de 50ms) ajuda a determinar o tamanho da sala. quer dizer, um predelay curto dá impressão de um ambiente menor, e um predelay longo dá a impressão de um ambiente maior.

- Densidade: Trata da quantidade de reflexões e está ligada a quantidade de superfícies difusoras da sala. Quanto maior a irregularidade dessas superfícies, maior o número de reflexões e, portanto, maior a densidade da reverberação.

- Difusão: Usado em conjunto (e muitas vezes confundido) com o parâmetro densidade, a difusão trata do modo de decaimento das reflexões, estando ligada portanto às propriedades acústicas das superfícies da sala. Diz respeito aos tempos de reflexão: salas com grande difusão apresentam reflexões em intervalos muito irregulares, enquanto que em salas de baixa difusão os intervalos tendem a ser mais regulares.

Delay

A reverberação é uma combinação de reflexões e de absorção de ondas sonoras. Cada vez que o som é refletido uma parte do que é absorvido no ambiente natural causando o som para diminuir a cada reflexão. Este processo de reflexão e absorção continua até que o som diminui abaixo do limiar da nossa capacidade auditiva. Delay é semelhante a reverberação, mas as propriedades através da qual é controlada são completamente diferentes, resultando em um efeito diferente.

Em vez de um número decrescente de reflexões, o delay tem apenas um pequeno número de repetições muito distintas. Essas repetições terão o mesmo, ou muito proximo do mesmo volume do sinal original. Na maioria dos editores você pode alterar o tempo destas repetições de milissegundos a alguns segundos. A principal tarefa do efeito delay é armazenar uma cópia do sinal original e, em seguida, reproduzi-lo em intervalos predeterminados. O delay tem uma série de utilizações na música hoje e ao longo dos anos muitas tecnologias tem sido incorporadas para criar novas formas de processo de delay.

Geralmente gerado pelo armazenamento do sinal de áudio em um buffer eletronico por um certo periodo de tempo para depois ser reenviado para a saída de áudio. O efeito mais simples é conseguido pela soma do sinal original com o sinal atrasado. Delays múltiplos podem ser gerados pela reinserção repetida do sinal atrasado. Multitap delays são gerados a partir de um único e longo delay que é repetido em intervalos diferentes, gerando múltiplas repetições. Ping-pong delays são obtidos pelo direcionamento alternado de cada repetição para os canais esquerdo e direito da saída de áudio.

Parâmetros comuns encontrados em editores de audio:

- Delay time: controla quanto tempo o buffer vai atrasar o som, ou seja, quanto tempo vai decorrer entre o sinal original e as repetições.

- Feedback: controla a quantidade de sinal atrasado que vai ser reinjetada na entrada do efeito. Aumentar o feedback significa aumentar o número de repetições e a o tempo de decaimento do efeito.

- Filtro passa-baixa: Em ambientes acústicos reais, as frequências mais altas são atenuadas nos sons atrasados, e essa atenuação aumenta proporcionalmente ao número de repetições. Para simular esse efeito usa-se um filtro passa-baixa a cada repetição do sinal.

- Tap-tempo: alguns aparelhos oferecem um botão onde se pode "clicar" em um determinado andamento para programar o tempo de delay.

Aplicações:

- transformar um som mono em estéreo, tornando-o mais "cheio"

- looping

- "dobra" de vozes (20 a 40 ms)

- ecos

Phase

Os períodos das oscilações em ondas sonoras na faixa audível (20Hz - 20kHz) varia entre 50ms e 0,05ms. Portanto, defasagens nessa faixa de tempo irão interferir nas oscilações de frequências periódicas (cancelamento de fase). Esse atraso relacionado às frequências sonoras é a base para 3 tipos de efeito: phase, flange, chorus (a diferença entre eles está ligada ao tempo de delay).


O efeito de phase emprega atrasos muito curtos na faixa de 1 a 10 ms. Quando o sinal original é atrasado em relação ao sinal repetido ocorre um efeito conhecido por comb filter no qual as frequências cujos períodos estão diretamente relacionados ao tempo de atraso são atenuadas e reforçadas devido ao cancelamento de fase. Efeitos de phase utilizam um determinado número de filtros para gerar o efeito comb. Usando um modulador (LFO) para mover esse filtro dentro de uma determinada região do espectro causa um cancelamento de fases variável dependente das frequências usadas. Esse efeito é conhecido como phase.

Parâmetros:

-
Rate (ou speed ): determina a velocidade com o que o modulador irá varrer ciclicamente a faixa de espectro determinada.

-
Range: determina essa faixa do espectro a ser varrida pelo modulador.

-
Outros: filtros, feedback loop.

Flange

Podemos dizer que é um efeito que "adiciona dimensão sonora", ou seja, é como se a guitarra entrasse num "tubo de vento", e foi muito utilizado na década de 80.


Esse efeito é semelhante ao phase e foi usado pela primeira vez em uma gravação pelo inovador guitarrista Les Paul. O efeito era alcançado com dois gravadores magnéticos contendo o mesmo material sonoro fazendo com que um dos gravadores diminuisse ocasionalmente a rotação para gerar uma diferença de fase entre os sinais. Nos sistemas digitais, o flanger é obtido de modo semelhante ao pahser, com atrasos de 1 a 20ms e um modulador que varia o atraso (regular ou randomicamente).

A diferença entre phase e flange é que neste último a atenuação e o reforço das frequências ocorrem em intervalos regulares enquanto que no phase isso depende da disposição dos filtros. Além disso, no phase o espaçamento, a largura e a intensidade (depth) podem ser variáveis. Em geral, flange tem um efeito no campo das alturas mais pronunciado que o phase.

Parâmetros:

- Delay: Controla o tempo de delay

-
Feedback: Controla a quantidade de sinal processado que é reinjetada no efeito. Alguns permitem determinar se o feedback é positivo (em fase, acentua harmônicos pares, som mais metálico) ou negativo (fora de fase, acentua harmônicos ímpares, som mais "quente").

-
Rate: Controla a velocidade com que o modulador varia a o delay. Por exemplo, Rate= 0.1 Hz significa que o efeito fará uma varredura de um ciclo a cada 10 segundos.

-
Depth: Em geral expresso como uma razão, especifica a relação entre o delay mínimo e máximo. Por exemplo, 6:1 pode gerar uma varredura de 1 a 6 ms ou de 3 a 18ms.

-
Outros: tipo de onda moduladora

CHORUS

Poderiamos dizer que dá um "brilho", que adiciona uma dimensão sonora. Muito usado na década de 80 e em música pop. Tecnicamente, este tipo de efeito adiciona ao som original o mesmo som após um pequeno atraso, que varia no tempo. A diferença entre Flanger e Chorus é o alcance das velocidades de oscilação. Alguns amplificadores também possuem esse recurso.

O Chorus atua introduzindo pequenas variações de afinação no sinal através de um delay gerando o efeito de "dobra" dos sons. Geralmente são produzidos em estéreo, utilizando delays mais longos que o flanger (10 a 30ms) e muitas vezes sem feedback (o que introduz um carater artificial no som). Existem várias implementações de chorus. Geralmente, são empregados dois delays variáveis modulados pelo mesmo oscilador, mas a saída de um oscilador é invertida antes de ir para um dos delays o que elimina mudanças mais acentuadas de afinação.

Parâmetros comuns encontrados em editores de audio:

- Delay: Controla o tempo de cada repetição do efeito;

- Feedback: Controla a quantidade de sinal processado que é reinjetada no efeito. Alguns permitem determinar se o feedback é positivo (em fase, acentua harmônicos pares, som mais metálico) ou negativo (fora de fase, acentua harmônicos ímpares, som mais "quente").

- Rate: Controla a velocidade com que o modulador varia o delay. Por exemplo, Rate= 0.1 Hz significa que o efeito fará uma varredura de um ciclo a cada 10 segundos.

- Depth: Em geral expresso como uma razão, especifica a relação entre os delays mínimo e máximo. Por exemplo, 6:1 pode gerar uma varredura de 1 a 6 ms ou de 3 a 18ms.

pitch shifiting/harmony

Entre os efeitos (especialmente os realizados em tempo real), esses são os que exigem os algoritmos mais sofisticados, e até recentemente, os resultados não eram convincentes. Eles funcionam comprimindo ou expandindo o sinal que está sendo processado. Para transpor um som para cima, o sinal é tocado mais rápido, o que o torna mais curto. Então é preciso copiar segmentos do sinal processado e adicioná-lo ao sinal resultante para eliminar essa diferença temporal. Para tornar um som mais grave, o sinal é reproduzido mais lentamente, o que requer o corte de algumas seções do sinal para diminuir sua duração. Ou seja, pitch shifters estão constantemente cortando ou colando pequenas porções do áudio a ser processado. Delays e feedbacks são frequentemente adicionados para criar uma defasagem em relação ao sinal original e não deixar o som muito artificial e uniforme.

Na produção de games este efeito é muito utilizado para a fala de personagens, alterando a altura da voz conseguimos efeitos interessantes.


Parâmetros comuns encontrados em editores de audio:

- Transposição: Esse é o parâmetro básico. Em geral existem dois controles: a) um harmônico, que permite transposções em passos de um semitom; b) um ajuste fino, que permite um ajuste em passos menores (geralmente, centésimos de tom).

-
Outros: Muitas vezes os efeitos de pitch shifiting são usados em combinação com outros efeitos, exigindo outros controles como feedback, delay e modulação.


Pitch Shifter

Esse efeito permite dobrar o som em intervalos, dando a impressão de ter 2 instrumentistas tocando. Existem os Pitchs inteligentes nos quais você diz qual escala está usando, e os não-inteligentes que dobram sem respeitar o intervalo da escala, apenas pela nota tocada.

Efeitos de Amplitude

Modificam a amplitude do sinal criando efeitos como tremolo e panning. É uma das poucas categorias de efeito que não empregam algoritmos baseados em transformações temporais. Geralmente um modulador é aplicado à amplitude do sinal que é direcionado para o(s) canal(ais) de saída.

Parâmetros comuns encontrados em editores de audio:

- Taxa de modulação: Determina a frequência da modulação.

-
Depth: Determina o quanto o sinal vai ser modulado.

Efeitos de dinâmica

Compressor / Sustain

Compressores são dispositivos que fazem com que um sinal, ao entrar nele, saia com menor força. Limitadores são dispositivos que fazem com que o sinal que entra saia sempre com o mesmo nível, não importa quão alta seja a entrada.

O Compressor comprime sinais altos e aumenta sinais baixos de entrada, na intenção de regular as horas em que o guitarrista toca uma nota mais alta que outra, ou seja, altera níveis de ganho. A desvantagem é que gera ruído, mas pode ser suprimido com o Noise Supressor, Noise Gate, etc. Esse efeito faz com que uma nota possa durar bem mais do que o limite do instrumento. Muito útil!

Parâmetros comuns encontrados em editores de audio:

- Threshold: É o nível de intensidade a partir do qual o compressor passa a funcionar. Antes dele ser atingido pelo sinal (antes do som ficar suficientemente intenso, em outras palavras), o aparelho não interfere em nada no sinal;

- Relação de compressão: É a relação entre o que entra no compressor e o que sai dele, em termos de dB. Uma relação de 2:1 significa que, para um aumento de 2 dB no sinal, a saída vai aumentar só 1 dB. A fig. 12 mostra o resultado dado por várias relações diferentes. Os valores do gráfico são os valores geralmente dados pelos fabricantes em compressores. Na prática, um aparelho com uma relação maior que 10:1 tem uma saída tão pequena comparada com a entrada que é considerado um limitador.

- Ganho antes de threshold: Muitos compressores podem funcionar como amplificadores antes do threshold ser atingido. Isto é, amplificam o sinal até um certo limite, depois o comprimem.

Wa-wa

Este efeito ficou muito famoso devido ao modelo Cry-baby (usado por Hendrix, Eric Clapton). Muda a frequencia de graves e agudos de forma tão rápida, que parece que a guitarra "fala". Geralmente é um pedal no formato de um acelerador de carro, e precisa de um toque inicial com o pé para iniciar o efeito. O modelo "BadHorsie" de Steve Vai (marca Morley), possibilita o acionamento do efeito sem o toque inicial, porém para desativar o efeito é necessário aguardar 1 segundo. Existem modelos de wah-wah automático, aonde permite regular o tempo e a "profundidade" da frequencia.

Distorções

O efeito de distorção é a saturação do som. Quando o nível de entrada se torna muito elevado o sinal fica distorcido. Distorção e Overdrive são os dois modos em que estes efeitos podem ser feitos e podem gerar harmônicas de alta-frequência.

A distorção é a personalidade do guitarrista, porque em alguns segundos, você já reconhece quem está tocando. Tem haver com o tipo de som que vai levar (pop, heavy, rock, etc) e existem milhares de técnicas para regular uma distorção.

A maioria dos amplificadores também possuem esse recurso.

Como a intenção não é a de fazer propaganda ou influenciar para nenhuma marca, novamente lembro que essas são apenas exemplos para mostrar alguma referência. Em breve teremos aqui outras marcas.



Princípios de Áudio - parte II



DESCRIÇÃO SIMPLIFICADA DE UMA PLACA DE SOM


PLACA DE SOM

Quando for gravar no computador usando qualquer software como por exemplo o Sound Forge ou audacity, você precisa definir qual(is) entrada(s) você quer que ele grave. Dependendo da placa de som pode ser que só se possa selecionar uma entrada por vez.

No canto inferior direito do windows, possui uma figura como um alto-falante que serve para você definir os controle de volumes para Ouvir (Play Control) e para Gravar (Recording).


As placas de som normalmente possuem conectores do tipo:

Line In,

Mic,

Line Out,

Headphone e/ou Speaker.


Para acessar as configurações basicas de audio do seu pc clique duas vezes no icone na barra do menu iniciar, no windows xp este icone geralmente fica ao lado do relógio.


Através do menu opções, no item propriedades do painel de volume principal, você pode acessar o painel de propriedades para selecionar os dispositivos de reprodução e gravação de áudio, alem de configurar os controles deslizantes que estarão visíveis para ajustar o volume.


FORMATOS DE ÁUDIO

Tipos básicos de formatos de arquivo:

Os parâmetros de dados de áudio e codificação são feitos explicitamente em alguma forma de cabeçalho;

Os parâmetros de dados de áudio e codificação são fixos.

Não comprimidos

PCM - Padrão básico para conversão de sinais analógicos para armazenamento ou transmissão em dispositivos digitais. Esta codificação é feita sem uso de algoritmos de compressão. A maior parte dos formatos de arquivos não comprimidos é própria de sistemas operacionais específicos.









Waveform Audio

Formato de áudio digital do Windows.

Desenvolvido pela IBM para o Windows 95.

Os arquivos neste formato utilizam a extensão wav.

RIFF Waveform Format

Formato de som Wave da Microsoft Windows.

Usado para o sistema de som Windows.

Arquivos Waveform RIFF têm extensão WAV.

Audio Interchange File Format (AIFF)

Formato de áudio utilizado pela Apple.

A extensão destes arquivos pode ser aiff ou aif.

Formato de voz Creative

Formato de som da Sound Blaster.

Tem a extensão VOC.

Formato de Amostra de 8 bits crus (RAW)

O formato do som não contém codificação ou compressão.



REPRESENTAÇÃO HEXADECIMAL DE UM TRECHO DE UM ARQUIVO WAVE



REPRESENTAÇÕES DE ÁUDIO DIGITAL

O áudio digital é construído por um grande número de pedaços de informação designadas por amostras. Cada amostra contém informação sobre a amplitude (ou volume sonoro) de um som em um dado instante. Esta representação assemelha-se em tudo à representação das imagens bitmap em que cada pixel possui um determinado valor de brilho e uma localização espacial específica. No caso de áudio, cada amostra possui uma amplitude e uma localização temporal específica. No caso das imagens bitmap, os pixéis, quando combinados, constituem uma determinada imagem. No caso do áudio digital é a combinação das amostras que constitui um determinado som.

Os fatores mais importantes que determinam a qualidade de uma forma de onda de áudio digitalizada são os seguintes:

  • A taxa de amostragem.
  • A dimensão da amostra, isto é, o número de bits utilizados para codificar cada uma das amostras.
  • O número de canais (pistas).
  • O tipo de intercalação utilizado.
  • O método de codificação utilizado, podendo envolver a compressão do áudio.

Taxa de amostragem

A taxa de amostragem é o número de vezes por segundo que se retém uma amostra do áudio analógico. A utilização das taxas de amostragem mais elevadas permite produzir uma seqüência de áudio digital com mais qualidade, da mesma forma que as imagens com altas resoluções apresentam melhor qualidade. A taxa de amostragem a utilizar depende assim do tipo de som que se pretende produzir, bem como da quantidade de memória e de espaço de armazenamento disponível no sistema a que se destina. As taxas de amostragem mais elevadas consomem, como seria de esperar, um espaço de armazenamento maior. Por exemplo, um clip sonioro com uma qualidade CD (taxa de amostragem de 44,1 KHz) exige um espaço de armezenamento cinco vezes superior ao espaço exigido pelo mesmo clip quando é mostrado com qualidade telefônica (taxa de amostragem de 8 KHz).


Taxa de amostragem

Largura de banda utilizável

Comentário

44,1 KHz

20Hz – 20KHz

Equivale à largura de banda da audição humana

22,050 KHz

20Hz – 10KHz

Equivale à metade da largura de banda da audição humana

11,025 KHz

20Hz – 05KHz

Equivale à um quarto da largura de banda da audição humana

Formas de compressão de um arquivo de áudio:

  • Com perdas de informação;
  • Sem perdas de informação.

Formatos de compressão com perdas

Os mais populares provêm da família dos Motion Picture Experts Group (MPEG).

MPEG - refere-se a uma família de padrões para áudio e vídeo que inclui o MPEG-1, MPEG-2, MPEG-1 Layer 3 (MP3) e o MPEG-4.

Formatos:

MPEG-1 -> Padrão para vídeo e CD-ROM

MPEG-2 -> Padrão para DVD e TV digital

MPEG-1 – Layer 3 (MP3) -> Os arquivos apresentam tamanhos pequenos e com um som de qualidade. A sua característica principal é a sua universalidade.

MPEG – Layer 3 (MP3) -> Formato muito utilizado nas transmissões de música pela Internet. O seu processo de compactação funciona através da eliminação de frequências sonoras não audíveis pelo ouvido humano. Transforma arquivos com 40MB de tamanho em 4MB, mantendo uma qualidade razoável.

MPEG 4 Audio AAC -> O MPEG-4 é o padrão que permite introduzir áudio e vídeo na Internet, em dispositivos móveis, em jogos e em aparelhos sem fios, ...





COMPRESSÃO DE ÁUDIO

Diferente de imagens ou vídeo, existe pouca relação entre amostras vizinhas ou quadros consecutivos para o áudio. Os níveis de compressão práticos são limitados para muito menos de 10:1 (compressão de vídeo de 25:1 pode ser produzida).

Os algoritmos de compressão funcionam de forma similar à compressão de imagens. Arquivos comprimidos ocupam menos espaço que os arquivos iniciais e resultam da eliminação de informação redundante e outras informações de áudio com pouca influência na qualidade do mesmo

Métodos de compressão de áudio digital

Foram desenvolvidos vários métodos de compressão de dados de áudio com o intuito de reduzir o espaço de armazenamento e os custos associados à transmissão do áudio digital. Os métodos de compressão mais utilizados no âmbito da produção de áudio para aplicações multimídia incluem o PCM (Pulse Code Modulation), o ADPCM (Adaptive Delta Pulse Code Modulation) e o MP3 (MPEG – 1 Layer III).

O método PCM constrói um sinal digital a partir de uma série de impulsos. Os sinais PCM fazem uma boa utilização da largura de banda e são menos sensíveis a interferências quando comparados com outros métodos de codificação de dados digitais, tais como o PAM ( Pulse Amplitude Modulation). No contexto da codificação de áudio digital, um valor PCM é simplesmente uma seqüência de amostras descomprimidas, pelo que possui um débito binário muito elevado. No entanto, como não comprime o áudio digital, o método PCM funciona como formato de referência para outros métodos de compressão.

O método DPCM permite reproduzir o débito binário do PCM através da codificação das diferenças entre valores das amostras. Cada amostra é substituída por um único bit que indica o sinal da diferença entre ela própria e a amostra interior. Durante o processo de descodificação, as amostras são reconstituídas processando-se a diferença e adicionando essa diferença a ultima amostra decodificada . Esse último valor indexa uma tabela de fatores de escala que determina o valor real da diferença. Os fatores de escala dependem das amostras originais e são determinados durante a codificação.

O método ADPCM foi utilizado no sistema CD-i (Compact Disc-interactive), agora obsoleto, mas continua a ser utilizado na compressão de seqüências de áudio digital para aplicações multimídia e telefonia digital. Por exemplo, os formatos AIFF e WAVE do MS Windows representam áudio digital codificado no formato ADPCM. Para a telefonia digital, o ADPCM utiliza-se no formato G. 721. A compressão ADPCM fornece rácios de compressão que variam desde 2:1 a 4:1.

O método da compressão MP3 (MPEG-1 Layer III) é o terceiro esquema de codificação para a compressão de sinais de áudio especificado na norma MPEG-1. O layer III utiliza um método de compressão com perdas que se designa por codificação perspectiva. Esta codificação baseia-se na teoria psicoacústica e funciona de modo a eliminar do sinal sonoro original apenas a informação auditiva irrelevante, ou redundante, que o ouvido humano não consegue detectar. Para além disso, o layer III utiliza uma transformada que se designa por MDCT (Modified Discrete Cosine Transform). Em termos práticos, o MPEG-Layer III permite obter um rácio de compressão de 1:12 sem perda aparente de qualidade. Isto significa que, por exemplo, a compressão de um segundo de áudio com qualidades CD-DA, possuindo um débito binário de 1411,2 Kbit/s, resulta num débito de 112 a 128 Kbit/s, quando comprimido com o compressor MPEG-Layer III.




Editores de Áudio

AudaCity

Editor de áudio gratuito, para você gravar sons, tocar músicas, importar e exportar arquivos WAV, AIFF e MP3 e muito mais. Use-o para editar sons, corta-lo, copiar e colar pedaços de som, com undo infinito. Misture músicas ou aplique efeitos já contidos no programa.

Cool Edit Pro

Desenvolvido pela Sytreilium Software Corporation para plataforma Windows.

Possui uma elevada variedade de efeitos DSP, e suporte para um grande número de formatos de arquivos.

Sound Forge

Indicado para a criação e edição de som digital sob Windows.

Editor de áudio de uso fácil, apresenta diversos recursos úteis ao desenvolvimento de projetos em multimídia.