Você não pode ter falado sobre áudio e computadores em nenhum momento nos últimos 15 anos e não ter ouvido falar de um arquivo MP3. Arquivos de áudio MP3 e sites, como o Napster original, iniciaram uma mudança em onde, como e quando as pessoas adquiriam música. Se você está no extremo mais antigo do espectro, como muitos de nós na indústria de eletrônicos móveis, então você comprou seus CDs, cassetes e talvez até seu vinil em uma loja de discos. Os computadores e a Internet mudaram isso. Você pode ficar online depois do jantar e baixar uma cópia ilegal de uma música em poucos minutos. Foi errado, mas as pessoas adquiriram dezenas de milhões de músicas dessa maneira.
Nos anos 1990 e início dos anos 2000, o acesso à Internet era lento. Começamos a nos conectar à Internet usando linhas telefônicas e modems. Cada byte de informação levava tempo para ser transferido para o seu computador, então qualquer coisa que acelerasse o processo era um prazer. Baixar (roubar) música usando a Internet é onde a popularidade do arquivo de áudio MP3 encontrou seu chamado.
Uma cartilha sobre áudio digital
Poderíamos escrever 10 artigos sobre áudio digital – e talvez. Por enquanto, vamos olhar para o básico e usar o disco compacto (CD) como nossa referência. Os CDs armazenam áudio digital amostrado a 44,1 kHz com resolução de 16 bits. Esses números significam que cada amostra pode ter uma amplitude que é um valor único dentro de um intervalo de 65.536 níveis diferentes (2 elevado a 16). A informação é amostrada 44.100 vezes por segundo. A amostragem no que é conhecido como 44.1/16 permite capturar a faixa audível de áudio (considerada de 20 Hz a 20 kHz) com bons detalhes e precisão.
Para armazenar 1 segundo de áudio nessa resolução, precisamos armazenar 1.411.200 bits de informação. Qualquer pessoa que tenha jogado com software de transcodificação de áudio pode reconhecer 1.411 kbps como uma taxa de dados padrão. Esse número é calculado multiplicando o número de bits por amostra (16) vezes o número de amostras por segundo (44.100) vezes 2. O fator vezes 2 é porque gravamos em estéreo – que são dois canais. Portanto, uma música de 3 minutos tem 254.016.000 bits ou 31.752.000 bytes.
Vamos arredondar para 31 megabytes de informação. Você pode imaginar quanto tempo leva para fazer o download com um modem dial-up rodando a 14.400 bauds? A resposta é pelo menos 3,5 minutos – sem verificação de erros, ruído de linha e outros fatores que diminuem o tempo real de download para cerca de 5,5 minutos.
Compressão de dados
E se alguém encontrasse uma maneira de diminuir o tamanho do arquivo de áudio para acelerar o tempo de download e reduzir o uso da largura de banda? A ressalva é que o áudio ainda soa essencialmente o mesmo na maioria dos sistemas de áudio básicos, como uma TV, alto-falantes de computador ou um rádio de carro de fábrica dos anos 90. Em 1991, um grupo de empresas, incluindo o Instituto Fraunhofer, France Telecom, Philips, TDF e IRT, começou a trabalhar em uma maneira de reduzir o tamanho dos arquivos mantendo informações relevantes. Essa é a chave para reduzir o tamanho do arquivo usando a compactação MP3.
O formato de arquivo MP3 é um algoritmo de “compressão com perdas”. A compactação com perdas significa que as informações são descartadas para reduzir o tamanho do arquivo. A equipe de desenvolvimento trabalhou em um método de compactação chamado codificação perceptual para decidir quais informações remover. A codificação perceptiva é baseada em como ouvimos sons em relação a outras informações e os limites de nossa audição.
O que os arquivos MP3 jogam fora
Vamos analisar as informações que os arquivos MP3 removem para reduzir o tamanho do arquivo. Uma das maneiras mais fáceis de reduzir o armazenamento de informações é reduzir a frequência mais alta que será reproduzida. Se analisarmos um arquivo MP3 de 128 kbps, veremos que a maior frequência reproduzida está logo abaixo de 16 kHz. Se essa fosse a única informação removida, nossa nova taxa de bits com amostras de 16 bits em estéreo seria de cerca de 1.004.800 kbps em vez de 1.411.200 kbps para 20,05 kHz.
A próxima parte do processo de compactação analisa o conteúdo comum a ambos os canais. É comum que algumas partes de uma gravação estejam virtualmente em mono. O processo de codificação remove informações duplicadas do arquivo e adiciona código para copiar o canal oposto. Se a faixa de áudio fosse puramente mono, o tamanho do arquivo seria dividido em dois. Poucas faixas são completamente mono, mas podemos ver mais economia de espaço nesse processo.
O processamento subsequente analisa informações de baixo nível durante passagens de alta amplitude. Vamos usar o exemplo de uma música com muitos graves e algumas informações harmônicas de médios muito silenciosas. Processos de codificação perceptiva, como MP3, removerão essas informações de baixo nível da faixa de áudio. Esse processo é chamado de mascaramento de áudio. Há informações de áudio suficientes em outras frequências para distraí-lo de ouvir o que foi removido.
Você consegue ouvir a diferença?
Dezenas – ou melhor, centenas – de testes compararam arquivos MP3 com faixas de áudio com qualidade de CD completa. Existem diferenças? Certamente existem. Uma coisa ficou evidente durante nossa pesquisa:como um arquivo MP3 é criado é crucial para a qualidade subjetiva do som. Diferentes codificadores funcionam de maneiras diferentes com resultados diferentes.
Talvez a melhor maneira de descrever a diferença entre uma gravação com qualidade de CD e um arquivo MP3 seja observar a diferença entre os dois. Eu gostaria que pudéssemos compartilhar algumas amostras aqui para você ouvir, mas isso violaria as leis de direitos autorais. O que podemos fazer é mostrar visualmente a diferença.
Pegamos uma amostra de 3 segundos de “Give Life Back to Music” do Daft Punk. Escolhemos esta faixa por causa do esforço claro e consciente do Daft Punk em disponibilizar comercialmente uma versão em alta resolução do álbum. Queremos agradecê-los por isso! A amostra é de 31,5 segundos a 34,5 segundos na música.
Este espectrograma mostra o conteúdo de frequência da amostra. A escala horizontal é o tempo. A escala vertical é a frequência. Finalmente, a intensidade da cor mostra a amplitude.
Você pode ver que há conteúdo de frequência de até 30 kHz, demonstrando claramente a natureza de alta resolução dessa faixa. Cada faixa de cor vertical representa uma batida de bateria eletrônica – mais ou menos.
Análise de arquivo MP3 de 128 kbs
É claro que as informações de áudio acima de 16 kHz foram removidas. O conteúdo de frequência infrassônica também é claramente diferente. Há mais informações no arquivo MP3 abaixo de 30 Hz em comparação com o original. Esse aumento na informação, no entanto, se apresentará como um alcance menos dinâmico.
MP3 x arquivo original
Invertemos o arquivo MP3 e o adicionamos à amostra original para fazer a imagem que você vê aqui. O resultado líquido é a diferença entre as duas faixas. Você pode ver o conteúdo de alta frequência que foi removido acima de 16 kHz. De fato, as informações foram removidas em todas as frequências e essas informações seguem o padrão de intensidade do arquivo de áudio.
O arquivo original tem uma amplitude de pico de -0,1 dB para ambos os canais e uma amplitude média de cerca de -14,2 dB. A informação removida tem um nível de pico de -10,9 dB e uma amplitude média de -37,01. As informações removidas são enterradas bem abaixo das informações de amplitude de pico.
Como é o som do áudio removido? Descreveríamos o clipe como o som de uma banda marcial distante. O áudio é principalmente informações de alta frequência. A faixa também tem uma textura decididamente trincada:as batidas da bateria eletrônica são claras e presentes, mas soam como batidas de prato distorcidas.
Mesmo com um pré-amplificador de fone de ouvido de última geração e fones de ouvido de estúdio, é difícil perceber a diferença ao alternar entre a faixa original e o arquivo MP3. Em um ambiente de audição com um palco sonoro maior, pode ser mais aparente.
Conclusões sobre arquivos MP3
Os puristas dirão que você deve ter as gravações da mais alta qualidade disponíveis. Não há falha nessa lógica. Por que economizar quando você pode ter tudo? Arquivos MP3 de alta taxa de bits, como os de 320 kbps, por exemplo, são de excelente qualidade. Testes repetidos mostraram que, quando criado com algoritmos de compressão de qualidade, a diferença de som entre uma gravação com qualidade de CD e um arquivo MP3 de 320 kbps é quase impossível de detectar. Arquivos MP3 com taxas de bits mais baixas passam a dispor de mais informações, e as diferenças tornam-se maiores.
As unidades de origem mais recentes do mercado são capazes de reproduzir arquivos de áudio WAV e FLAC de grande resolução e profundidade de bits. Em breve, veremos unidades que reproduzirão arquivos MQA em conexões digitais. Quase todas as fontes lidam com arquivos MP3 e WMA.
Entre hoje mesmo no seu revendedor local especializado em eletrônicos móveis e traga algumas músicas para curtir. Achamos que você ficará impressionado – não importa o formato que você escolher.