Neste artigo da Mouser Electronics Jon Gabay, descreve as características das novas tecnologias de áudio a partir das transformações por que estão passando.

Nota: o artigo é de 2015, mas bastante atual pelo conteúdo.

Produtos em destaque:

• Analog Devices AD1934

• Analog Devices AD1974YSTZ

• Cirrus Logic CS5343 24-bit A/D converters

• Cirrus Logic CS5344 24-bit A/D converters

• TI TAS5548 high-definition audio processors

Fornecedores em destaque:

• Analog Devices

• Cirrus

• Texas Insturments

• Aplicativos de áudio

 

Todos nós estamos muito familiarizados com o áudio cotidiano. Usamos uma variedade de “players” em nossas casas, carros e dispositivos pessoais para ouvir nossas músicas favoritas quando estamos relaxando ou em trânsito. Nós crescemos com a música como uma grande parte de nossas vidas, e nos relacionamos com amigos e familiares por causa das escolhas de músicas que compartilhamos, dançamos e cantamos junto.

Mas a tecnologia de áudio passou por uma grande transformação. Muitas pessoas de mais idade hoje testemunharam que essa tecnologia onipresente passou por grandes melhorias em qualidade, conveniência e popularidade.

 

Voltar quando

Embora existisse uma tecnologia de captura de áudio tradicional, o disco de vinil foi o primeiro esteio amplamente adotado por mais de uma geração. Fornecia procedimentos relativamente simples para captura de áudio e tinha largura de banda, volume, clareza e resolução de reprodução limitados. A largura de banda utilizável foi determinada principalmente pela velocidade de rotação, que até mesmo variou de país para país com base em motores síncronos e frequências de linha de energia. Era até um pouco transportável, como podemos ver nas primeiras gravações do Chief Blackfoot em 1916 (ver Fig. 1).

 

Fig. 1: As primeiras tecnologias de gravação e reprodução analógica de vinil são anteriores aos microfones, amplificadores e motores. Fonte: Wikipedia
Fig. 1: As primeiras tecnologias de gravação e reprodução analógica de vinil são anteriores aos microfones, amplificadores e motores. Fonte: Wikipedia

 

 

A fidelidade dos registros estava relacionada à velocidade de rotação e estava disponível principalmente em 78, 45 e 33 1/3 RPM. Antes do vinil, vários outros materiais eram usados, como goma-laca, vidro e alumínio, mas o vinil se tornou a forma dominante para as massas. (Uma nota interessante: o vinil foi inicialmente considerado inquebrável.)

Embora os discos de vinil permitissem a reprodução de áudio monofônico gravado, eles traziam alguns problemas de qualidade de áudio, como estalos, assobios e arranhões, que podiam fazer com que o áudio gravado pulasse. Mas os discos de vinil eram fáceis de comprar, armazenar e usar, e os tocadores eram relativamente baratos, oferecendo música gravada de verdade para as massas pela primeira vez.

Os primeiros sistemas de vinil eram de natureza mecânica, não eletrônica. Os primeiros eram rmecanismos estáveis ​​baseados no movimento das mãos, sem motor, e não havia microfones, transistores, válvulas e amplificadores. O desenvolvimento e o crescimento da eletrônica mudou isso para sempre.

 

 

Fita, a próxima geração

A fita magnética mudou a indústria fonográfica de uma forma monumental. Composta de celulose revestida com óxidos de ferro, a fita magnética movendo-se por uma cabeça de gravação criava uma gravação que podia ser apagada e regravada. A fita foi usada quase exclusivamente para capturar e gravar música e áudio profissionais por muitas décadas e ainda hoje é usada por audiófilos analógicos puros de coração.

Mas a fita também introduzia erros. A fita tinha problemas de wow e vibração associados ao alongamento e compressão do meio um tanto elástico. Além disso, a fidelidade era limitada pelas velocidades de transporte da fita, medidas em polegadas por segundo. No entanto, a fita permitiu algumas inovações, como estéreo, dublagem e multitrilha.

Os primeiros sistemas reel-to-reel dominaram e continuaram a dominar o mundo do áudio profissional. Mas para as massas, cassetes e sistemas de oito faixas foram introduzidos. Eles eram mais fáceis de usar, baratos e podiam incluir uma guia de registro que não permitiria que algo fosse regravado. Ainda assim, a fidelidade foi limitada às velocidades da fita e, eventualmente, a classificação de Oersted mais alta na fita DAT permitiu a captura de larguras de banda muito altas e a reprodução de formas de onda de frequência ainda mais alta.

 

 

Melhor por Bits

A era digital inaugurou uma nova era para gravação, quando conversores A/D podem ser usados ​​para capturar formas de onda e conversores D/A podem ser usados ​​para recriá-los. Usando microfones, filtros e microcontroladores, o áudio pode ser amostrado e armazenado sem nenhuma parte móvel (exceto o diafragma no microfone e os alto-falantes).

A gravação digital, portanto, eliminou as distorções de wow e flutter das fitas induzidas mecanicamente, bem como as distorções de estalo e chiado (pop e hiss) associadas aos defeitos de meio físico do vinil. Mas, como acontece com qualquer tecnologia, também existem compensações aqui.

Em vez de as velocidades mecânicas serem o fator limitante, a resolução da frequência depende das taxas de amostragem e a faixa dinâmica depende da largura do barramento. As taxas de amostragem padrão evoluíram para uma variedade de aplicações (consulte a Tabela 1). As taxas de amostragem afetam diretamente a precisão reproduzida da forma de onda. Além disso, a natureza digital das formas de onda D/A cria uma forma de escada com transições de frequência fundamental muito nítidas que introduzem distorção (ver Fig. 2). Uma filtragem especial pode reduzir isso.

 

Fig. 2: Enquanto os filtros anti-aliasing limpam o lado de entrada A/D, a filtragem também é necessária no lado D/A de saída para compensar as transições de escada nítidas que introduzem distorção e ruído fora de banda. Fonte: Wikipedia
Fig. 2: Enquanto os filtros anti-aliasing limpam o lado de entrada A/D, a filtragem também é necessária no lado D/A de saída para compensar as transições de escada nítidas que introduzem distorção e ruído fora de banda. Fonte: Wikipedia

 

 

Os dados de entrada capturados da amostragem digital síncrona também introduzem distorção relacionada à taxa de amostragem. Os teoremas de amostragem de Nyquist determinam que a taxa de amostragem deve ser pelo menos duas vezes a frequência de qualquer sinal que você deseja capturar e / ou reproduzir. Qualquer forma de onda periódica tem uma oscilação de tensão para cima e uma oscilação de voltagem negativa correspondente. A fim de capturar um fac-símile razoavelmente razoável, você precisa amostrar no ponto alto e no ponto baixo para captar toda a oscilação de tensão. Como você pode imaginar, se seu timeslot de amostra não estiver sincronizado com os picos e vales de sua frequência máxima, você não obterá uma representação verdadeira da forma de onda analógica no domínio digital. É por isso que taxas de amostragem mais rápidas podem melhorar a precisão dos dados capturados.

Os aficionados por áudio podem discernir os efeitos de limitação da largura de banda da subamostragem e argumentar que a riqueza dos harmônicos presentes nas formas de onda reais está ausente quando as taxas de amostragem são muito baixas, mesmo que satisfaçam os requisitos de Nyquist. É por isso que taxas de amostragem mais altas podem empurrar essas limitações bem para a região ultrassônica, tornando-as perdas fisicamente inaudíveis.

Por causa dos avanços na tecnologia de semicondutores, geometrias menores formam A/Ds e D/As mais amplos que podem ser executados em velocidades muito mais rápidas. Não é incomum usar taxas de amostragem cinco vezes mais altas do que as limitações de Nyquist, levando a uma melhor captura e reprodução de formas de onda, bem como a faixas dinâmicas mais altas. Larguras de amostra de 32 bits ou mais não são incomuns, e quanto maior a largura da amostra, maior a faixa dinâmica (ver Fig. 3).

 

Fig. 3: A faixa dinâmica é a resolução do passo de volume e é diretamente afetada pela resolução dos conversores A/D. Fonte: Soundbooth CS4/CS5/ Áudio digital
Fig. 3: A faixa dinâmica é a resolução do passo de volume e é diretamente afetada pela resolução dos conversores A/D. Fonte: Soundbooth CS4/CS5/ Áudio digital

 

 

As arquiteturas dos A / Ds e D / As também têm muito a ver com isso. Os primeiros A/Ds de baixa resolução podiam usar tecnologias de conversão flash para fornecer amostras bastante rápidas de 8 bits ou mais. Como cada bit adicional de resolução dobra o número de elementos de circuito necessários, essa abordagem perdeu força com os primeiros semicondutores de geometria grande.

À medida que as velocidades de resposta do semicondutor aumentam, arquiteturas de aproximação sucessiva usando amostra e retenções podem fornecer conversões de largura de barramento mais amplas dentro das faixas de áudio. Conforme as geometrias diminuíram, tornou-se viável novamente usar conversores de flash para obter resoluções de 10, 12, 16 e 18 bits. Os conversores modernos de 24 bits podem usar uma variedade de arquiteturas novas e aprimoradas, incluindo over-sampling, e 192K samples/seg tornou-se o novo padrão de áudio high-end.

Outro fator que afeta a qualidade do áudio da entrada à saída é o tipo de CODEC implementado no pipeline digital. Um CODEC (para COmpresor-DECompressor) codifica o fluxo de dados para transmissão ou armazenamento usando técnicas de compressão que podem ser com ou sem perdas. Como você pode imaginar, os CODECs com perdas são mais eficientes, mas não recriarão as formas de onda iniciais 'exatamente'.

Vários CODECs gratuitos e licenciados são usados ​​para diferentes fins. Isso inclui esquemas de transmissão não compactados como: Modulação por Código de Pulso, Modulação por Densidade de Pulso, Fluxo Direto e Modulação por Amplitude de Pulso, para citar alguns. Técnicas de compressão com perdas, como Adaptive Differential, Adaptive Rate Optimized, Adaptive Transform Acoustic e Dolby Digital ajudam a reduzir os requisitos de largura de banda e armazenamento de dados e fazem um bom trabalho recriando a forma de onda inicial.

Várias técnicas sem perdas também se mostraram bastante eficazes. Isso inclui padrões populares como MP3HD, MPEG4, RealAudio Loss-less, True Audio e WavePack, para citar alguns. Mais recentemente, o Free Lossless Audio CODEC (FLAC) e a versão da Apple - o Apple Lossless Audio CODEC (ALAC) vêm ganhando aceitação e atenção. Como você sugeriria, ALAC é a versão da Apple para uso com dispositivos e serviços da Apple, e FLAC é um formato de código aberto gratuito para uso. Ambos não têm perdas e podem parecer idênticos, embora usem técnicas diferentes para compactar os dados. Diz-se que o FLAC pode comprimir um pouco melhor porque você tem algum controle sobre os parâmetros de compressão.

Você já deve ter percebido que um padrão estável executado em software é um alvo ideal para implementação de hardware. CODECs não são exceção. A capacidade de realizar uma tarefa intensiva de processo e torná-la parte de um fluxo de dados em pipeline ajuda a reduzir o tamanho do chip, os requisitos de desempenho do processador, o uso da bateria e os custos.

Além disso, os avanços com o isolamento dielétrico no chip permitiram que dispositivos de sinais mistos de melhor qualidade incluíssem filtragem especial nos mesmos dispositivos de amostragem e reprodução. Os caminhos de sinal no chip aproveitaram os caminhos de sinal diferencial para melhorar a qualidade. Mais tarde, o processamento digital de sinais manipulou as informações analógicas no domínio digital, abrindo uma nova avenida de recursos e recursos de processamento de sinais.

Os principais benefícios são os recursos multicanais dos modernos conversores A/D e D/A de alta resolução. Mero estéreo não é melhor o suficiente para som surround moderno e sistemas de áudio baseados em subwoofer que estão no índice "wow factor", e os sistemas de áudio são uma dessas tecnologias que as pessoas adoram exibir.

Isso permite sistemas altamente densos em um chip que pode amostrar e reproduzir vários canais simultaneamente, enquanto fornece equilíbrio de filtração, faders, equalização espectral e muito mais. Além disso, esses recursos não são apenas sutilezas, mas exigidos pelos padrões modernos e pela base de clientes.

 

 

Onde começar

Como acontece com qualquer projeto de cima para baixo, seu aplicativo de destino ditará os tipos de tecnologias e dispositivos que você poderá usar. Todos nós temos restrições impostas quando fazemos o design, e o áudio de alta qualidade não é exceção.

Os sistemas de áudio de última geração abrangem uma grande variedade, desde reprodutores e gravadores pequenos, portáteis, de baixo consumo e alto desempenho, até estúdios de última geração com várias dezenas de canais, painéis de transmissão e racks de equipamentos. Embora A/Ds e D/As discretos estejam disponíveis para projetos para fins especiais, a maioria das soluções hoje são mais integradas, consistindo em dispositivos dedicados que executam funções exatas ou periféricos para um micro integrado de controle.

Isso significa que os componentes que temos disponíveis serão dispositivos razoavelmente integrados com alguns recursos de que precisamos, e muitas vezes alguns de que não precisamos. O segredo é escolher peças que tenham os recursos e benefícios para o seu projeto e não sejam um exagero de custo mais alto e mais complexo.

Simples e eficazes são os componentes Cirrus Logic CS5343 e CS5344, que são conversores A/D diretos de 24 bits com filtragem básica e serialização de dados para uso por sucessivos processadores de áudio digital (consulte a Fig. 4). Suportando taxas de amostragem de até 108 kHz por canal, essas peças apresentam filtros digitais e entradas de alta impedância, eliminando a necessidade de amplificadores operacionais externos e filtros anti-aliasing.

 

Fig. 4: Alta impedância, filtragem no chip e serialização digital tornam este conversor A / D de alta resolução simples e elegante para aplicações de áudio digital a escolha ideal para um sistema de áudio de ponta.
Fig. 4: Alta impedância, filtragem no chip e serialização digital tornam este conversor A / D de alta resolução simples e elegante para aplicações de áudio digital a escolha ideal para um sistema de áudio de ponta. | Clique na imagem para ampliar |

 

 

No lado da saída D/A, também temos dispositivos mais simples e direcionados apenas para a saída, bem como peças mais funcionais e integradas. Um bom exemplo de uma parte simples, mas eficaz de apenas saída, é o Analog Devices AD1934, que fornece oito saídas D/A de terminação única e tira proveito da arquitetura sigma delta multibit patenteada da empresa (consulte a Figura 5). Ele usa as mesmas técnicas de clock PLL que o AD1974YSTZ para reduzir EMI e eliminar a necessidade de um segundo clock e também é uma parte de 3,3 V (com E / S tolerante a 5 V).

 

Fig.5: A mesma funcionalidade periférica independente escalonável é útil ao gerar saídas de áudio de alta qualidade. A integração de filtros e controles de volume economiza espaço e componentes externos, e a arquitetura de áudio mudou para analógica apenas nas extremidades.
Fig.5: A mesma funcionalidade periférica independente escalonável é útil ao gerar saídas de áudio de alta qualidade. A integração de filtros e controles de volume economiza espaço e componentes externos, e a arquitetura de áudio mudou para analógica apenas nas extremidades.

 

 

Uma densidade funcional mais alta, se necessária, pode aproveitar as vantagens dos processadores de saída altamente integrados, como os processadores de áudio de alta definição TAS5548 de oito canais TI (consulte a Fig. 6). Esta parte flexível aceita o áudio serial e executa o processamento de saída e as funções de unidade de maneira flexível e de alto desempenho.

 

Fig. 6: A funcionalidade máxima pode ser comprimida em um único dispositivo, que visa áudio multicanal para aplicativos avançados. MCUs incorporados trazem recursos como controle dinâmico de energia e gerenciamento de energia, bem como controle de graves e agudos sobre IIC.
Fig. 6: A funcionalidade máxima pode ser comprimida em um único dispositivo, que visa áudio multicanal para aplicativos avançados. MCUs incorporados trazem recursos como controle dinâmico de energia e gerenciamento de energia, bem como controle de graves e agudos sobre IIC. | Clique na imagem para ampliar |

 

 

Esta parte pode funcionar como um conversor de taxa de amostragem e tem a capacidade de interagir perfeitamente com a maioria dos decodificadores de áudio digital de acordo com TI. Outra compatibilidade importante é com as especificações DTS-HD para designs Blu-ray HtiB.

Arquitetonicamente, dois módulos de entrada separados lidam com quatro canais, cada um permitindo interface simultânea com duas taxas de amostragem potencialmente diferentes. Os estágios de saída flexíveis podem acionar oito canais de estágios de energia H-Bridge em configurações de terminação única ou de carga ligada em ponte.

Essas partes são particularmente adequadas para amplificadores digitais de classe D, pois usam taxas de comutação de 384 kHz para as taxas de amostragem de 48, 96 e 192 kHz. Eles suportam as técnicas de modulação AD, DB e Ternary. A sobreamostragem 8x combinada com a filtragem de qu Filtragens digitais e técnicas de DSP também permitem funções de mix e forma, como controles de tons graves e agudos e frequências de canto selecionáveis. Nota: Esta parte também é controlada por periféricos e acessada pela porta IIC.

 

 

Na estrada

Para apoiar projetos de áudio, a abordagem moderna altamente integrada de sinal misto simplifica muito o processo. Os pares de sinais diferenciais de PCB, planos de aterramento analógicos e preenchimento de cobre não são mais necessários para fazer placas de circuito silenciosas e eficazes. As funções modulares e altamente integradas modernas absorvem muitos componentes externos e mantêm as placas firmes.

Espere ver sistemas de áudio de ponta mais integrados e concentrados para gravação em campo, mixagem, masterização e até mesmo integrados na próxima geração de instrumentos. As interfaces digitais estão substituindo os controles analógicos de controles deslizantes, potes, medidores e assim por diante. As placas de mixagem de 16, 24 e 48 canais não serão mais a maneira preferida de masterizar. Com o controle orientado por software e a funcionalidade DSP, a chave é capturar o áudio bruto e permitir que a potência de processamento seja a forma preferida de ajustar o som. Isso traz o áudio de alta qualidade ao alcance de todos.

O que você pode esperar hoje? Até que o conteúdo e os players estejam disponíveis em formatos de alta resolução, você apenas converte e reproduz arquivos de alta resolução em um sistema de baixa resolução ou arquivos de baixa resolução em um sistema de alta resolução. Não há realmente nenhum benefício, mas os tempos estão mudando.

Com a Sony anunciando que levará áudio de alta resolução para novos lugares, as pessoas estão prestando mais atenção ao conteúdo, formato, serviços, padronização e interoperabilidade. Claro, a Sony está bem posicionada com seu player HAP-Z1ES com 1 TB de memória. A conectividade sem fio e com fio (USB) pode expandir isso, e o player HAP-Z1ES suporta todos os formatos até o momento e taxas de até 192 KHz.

No lado da nuvem, você pode esperar mais servidores e serviços de alta resolução, como hiresaudio.com. As engrenagens estão apenas começando a se encaixar e é um momento emocionante para entrar em áudio de alta resolução.

 

- Jon Gabay é engenheiro de design, escritor e gizmologista. Como consultor, ele projeta, constrói, testa e desenvolve novas tecnologias para startups, bem como empresas estabelecidas que podem usar ideias e pensamentos inovadores. Embora sua paixão seja energia alternativa, gerenciamento de energia e automação, ele também pesquisa e escreve sobre sistemas embarcados, projetos de sinais mistos, tecnologia RF, sensores, automação de projetos e muito mais.

 

 

NO YOUTUBE