Alta fidelidade em audio?

Júlio Martins

UFES - Dep. Comunicação Social/ CCJE
Av. Fernando Ferrari, s/n - Campus Universitário - Goiabeiras
CEP 29060-900 - Vitória - ES - Brasil - Tel.: (27) 33352603



Resumo - O presente trabalho examina a possibilidade de existência de uma reprodução, de alta-fidelidade, levantando uma série de questões relevadas ao longo da história, sob a ótica da teoria da percepção de Charles Sanders Peirce. A conclusão é de que, se a obtenção de uma alta-fidelidade já é questionável, se considerarmos apenas as questões técnicas e éticas, relevadas ao longo do tempo, ao analisarmos sob a ótica da teoria peirceana, é impossível existir qualquer fidelidade.

Abstract - This work intend to examine the possibility of existence of a kind high fidelity reproduction, rising a roll of questions, underconsidered along the history, under the Charles Sanders Peirce´s theory of perception and of signs. The conclusion is that if the posssibility of obtaining high fidelity is full of doubts, only considering the technical and ethical issues which historically remained untouched, under or with the interface of Peirce´s theory of signs and perception, it´s impossible to exist any kind of fidelity.




I. CONSIDERAÇÕES INICIAIS

O presente trabalho monográfico, trata de um assunto incomum na área de Comunicação e Semiótica, que é uma análise da alta-fidelidade em áudio, à luz da teoria peirceana. Para se compreender a discussão que pretendi levantar, percebi que seria necessária uma boa dose de informação colateral e consequentemente familiaridade com o tema, para que eu pudesse me fazer entender adequadamente, tamanha foi a necessidade de mencionar e descrever questões técnicas. Isto, acabou por alongar o texto dificultando às vezes, a retomada da linha de raciocínio que pretendi desenvolver, de modo que achei necessário elaborar um apêndice. Também há uma outra razão para que esta análise tenha se estendido tanto: as questões do aúdio sempre foram analisadas à luz das técnicas e das leis da física, sem considerar que a sua manifestação – o áudio como som no nosso dia-a-dia, ou como música – produz significações, ou evoca as já construídas e, sempre dentro de uma intrincada rede de relações culturais. O leitor perceberá que a tônica deste trabalho é abordar a questão por uma ótica interdisciplinar e especialmente tratando os sistemas de captação, gravação e reprodução sonoras, como procedimentos e técnicas também intrínsecos à área de Comunicação.

Assim, no intuito de manter um texto mais enxuto e direto e, ainda com o desejo de fornecer a informação colateral necessária para o entendimento, transportei a maioria das explicações que entendi como indispensáveis, para este apêndice. Não se trata de um glossário, por que não são apenas definições, mas sim definições comentadas e, dentro do contexto da discussão que levantei. Peço portanto ao leitor que, quando encontrar a indicação [V.A. 00] (que significa ver no apêndice o item Nº 00) após uma palavra destacada em negrito, se necessário for, que vá até a seção denominada Apêndice, para obter informações mais detalhadas. Esta opção não tem o objetivo de substituir as normas da ABNT para citações e referências, pelo contrário, estas permanecem rigorosamente como estabelecido na nova norma agora denominada NBR6023:2000, que substituiu a NBR 6023:1989.


II - INTRODUÇÂO

Desde que surgiram os primeiros processos de registro sonoro, especialistas em áudio, consultores, audiófilos, pesquisadores, empresas de sonorização e indústrias de transdutores [V.A. 01], discutem, pesquisam e desenvolvem métodos, procedimentos e equipamentos objetivando a reprodução perfeita de eventos sonoros (gravados) especialmente de música, o que se convencionou denominar de alta-fidelidade [V.A. 02], no Brasil.

Ao longo da história recente do áudio, temos observado ciclos constantes de busca, alcance, insatisfação, nova busca, e assim sucessivamente. Artigos e livros são escritos descrevendo as inúmeras qualidades positivas de um novo processo. Num momento seguinte inúmeros problemas e limitações são levantados e discutidos, aperfeiçoamentos diversos são implantados até que se encontram as fronteiras do processo, mais adiante, a plataforma ou padrão até então perfeita é substituída por uma outra, cujas características técnicas permitem uma melhor reprodução do programa musical. Na história recente podemos citar o disco de vinil como exemplo de uma plataforma no seu limite e, o CD como o seu sucessor, com uma resolução de áudio nunca antes pensada, naquela ocasião.

Não é possível precisar exatamente quando e por quem foi cunhada a expressão alta-fidelidade (ou High Fidelity como originalmente no inglês) mas a Enciclopaedia Britannica (2000, CD-Rom) refere-se ao surgimento da revista High Fidelity [V.A. 03] em 1951, o que nos dá uma pista de data aproximada. Desde então vem sendo usado com o intuito de significar a possibilidade de captar/amplificar/reproduzir ou captar/gravar/reproduzir um evento sonoro com máxima fidelidade ao fenômeno sonoro original. O termo carrega consigo a certeza de que se trata de uma busca de reprodução muito fiel, mas que não é mais o programa original, apesar de que, também traz embutida a crença na existência de uma reprodução perfeita. Entretanto e infelizmente, como sempre ocorre com termos e conceitos que são difundidos largamente, fora de seu contexto, as palavras adquirem outros significados (às vezes equivocados e/ou indesejáveis) ou estendem os já existentes, para além do que de fato denotam. O que verificamos hoje nas revistas especializadas e em livros a respeito, é que perdeu-se de vista a noção de reprodução. Dificilmente isso é dito claramente, mas pode-se concluir, após um breve exame, mesmo aleatório, de artigos e livros relacionados, que é uma questão fora de discussão e que a reprodução perfeita de um evento sonoro (gravado ou ao vivo) existe.

A busca por melhores condições técnicas de captação/gravação/reprodução de um evento ou fenômeno sonoro, para representá-lo de forma muito parecida com a que ocorreu, na minha avaliação, é legítima e, continuaria sendo se nunca se tivesse perdido de vista que, apesar de todos esforços e da rápida evolução tecnológica, ainda é uma busca e, da reprodução de algo que, só foi possível com o uso de dispositivos transdutores para captar/gravar/reproduzir, que por melhores que sejam, em hipótese alguma são capazes de recriar o fenômeno ou evento sonoro tal e qual ele ocorreu. Não é o que tem acontecido. O conceito se disseminou a tal ponto – para grande desgosto dos audiófilos – que mesmo pequenos sistemas portáteis de som, largamente difundidos como microsystems passaram a ser denominados como sendo de alta-fidelidade. Ficando o termo então vulgarizado, audiófilos, fabricantes e revendedores passaram a adotar um novo termo para significar um novo patamar na qualidade de reprodução sonora: sistemas High end ou alta-fidelidade High end.

O problema é que se abandonou definitivamente o contexto original do termo alta fidelidade e agora, parece-nos que a reprodução perfeita (mesmo ainda sendo reprodução) foi finalmente alcançada. O state-of-the-art (como costuma aparecer em artigos nas revistas especializadas) em sistemas de som existe e está ao nosso alcance. A avidez por informações a respeito e o crescente número de consumidores potenciais, fez surgir inúmeras revistas especializadas, cada qual publicando mensalmente análises e avaliações de novos produtos. Com isso temos presenciado também, a publicação de inúmeros artigos com ou explicações simplificadas de fenômenos físicos complexos. O que historicamente tem deixado margem para muitos equívocos.

Então, parece-nos ser o momento mais apropriado para levantar a discussão: será que é possível existir alta-fidelidade?...

Considerando a teoria da percepção peirceana, sou levado a concluir que não. Não é possível existir alta-fidelidade nem mesmo dentro do contexto que historicamente originou o termo, dada a quantidade de questões que não foram adequadamente respondidas, ou relevadas, em decorrência provavelmente, da falta de instrumental teórico para tal, na época. Nunca existiu alta-fidelidade por que toda reprodução de um evento sonoro (gravado ou ao vivo) é um outro fenômeno físico, com características intrinsecamente diferentes daquele original. Pode-se argumentar que tais colocações se constituem num exagero de minha parte já que o termo intenta significar reprodução muito fiel ao original. Entretanto foi assim até agora e o que presenciamos? O termo foi extraído de seu contexto e largamente difundido sem as considerações necessárias, permitindo entendimentos e conclusões equivocadas. Penso que é uma questão de ética e responsabilidade, definir conceitos de forma clara, pensando até nas suas possíveis (e inevitáveis) simplificações que ocorrerão, pelo menos para tentar, evitar equívocos de interpretações futuras.

Estamos inexoravelmente conectados ao mundo e, consequentemente aos fenômenos sonoros, através da mediação dos nossos sentidos e da percepção. Nossos sentidos são transdutores de fenômenos físicos em impulsos nervosos e, a nossa percepção, transdutora por sua vez, destes em significação. Se ainda assim existisse a reprodução perfeita (gravada ou ao vivo) não haveria a menor possibilidade de assegurar que cada indivíduo fosse capaz de realizar a transdução do fenômeno sonoro em impulsos nervosos, e, posteriormente em significação em idênticas condições.

Por outro lado, os estudos e pesquisas em áudio e alta fidelidade, somente consideraram a percepção humana do ponto de vista sensorial e fisiológico (conforme indícios apresentados adiante), ou seja, até a geração dos impulsos nervosos, deixando em aberto a lacuna da elaboração da significação.

Então o que se pretende neste trabalho é procurar demonstrar a impossibilidade de se pensar num conceito de alta-fidelidade, por duas vertentes: a primeira delas é um levantamento da cadeia de transduções intermediárias, presentes em qualquer processo de captação/gravação/reprodução, de questões que foram relevadas ao longo da história do áudio e outras questões pertinentes; a segunda é uma análise do fenômeno sonoro, da sua reprodução, da nossa percepção dele e por fim, nossa construção da significação, à luz da teoria da percepção peirceana.


III - ALTA FIDELIDADE INEXORAVELMENTE MEDIADA

O primeiro livro publicado no Brasil sobre Alta fidelidade é o de Hélio Taques Bittencourt e Paulo Taques Bittencourt, "Curso "Esse" de alta-fidelidade: Fundamentos Psico-acústicos" em 1965 (informação verbal de Celso T. Bittencourt, filho de um dos autores, em 09/04/2001). Este livro foi citado algumas vezes por Cláudio Cesar Dias Baptista [V.A. 15] em seus inúmeros artigos publicados na Revista Nova Eletrônica, sobre áudio e sonorização, no período de 1977 a 84 e, foi através da sua gentil colaboração, que obtivemos uma cópia.

No livro, o título do primeiro item do capítulo 1 é "A alta-fidelidade existe ?" Entretanto, Bittencourt e Bittencourt (1965) não respondem definitivamente a pergunta do título, mas definem alta-fidelidade com sendo " 'reproduzir um som tal como o original' , dentro do limiar psicológico do observador,..." (Bittencourt e Bittencourt, 1965: p.1). Observe que, por considerarem apenas a reprodução, não significa que se esqueceram dos processos anteriores. Na época, pelo que posso concluir, o pensamento comum era de que os processos de transdução, captura e armazenamento, eram tão poucos, tão similares e tão rigorosos na preservação do aspecto mais próximo do original, que era impossível pensar na possibilidade de eles mesmos estarem introduzindo distorções e/ou modificações no som original. Vejamos um trecho inicial deste capítulo:

De fato existem muitas descrições de experiência realizadas,
principalmente na Inglaterra e nos Estados Unidos, em que
orquestras executavam peças que eram sucessivamente reproduzidas
por um sistema eletroacústico, ficando os espectadores com a
mesma sensação auditiva. Até se chegou ao cúmulo de, na primeira
parte de um concerto público, fazer-se os membros da orquestra
fingirem que estavam tocando, quando a música na realidade
provinha de um sistema de alto-falantes bem camuflados;
'enquetes' realizadas no intervalo mostravam que mesmo os
'críticos' não perceberam a troca, menos alguns espectadores
da primeira fila, que notaram 'algo de anormal' porque viram
a fita durex que fixava as cordas dos violinos para que os
músicos pudessem melhor representar...
(Bittencourt e Bittencourt, 1965, p. 1)

Decerto que as experiências citadas carecem de uma descrição mais minuciosa, mas o que nos interessa especialmente não está nelas, mas sim na própria construção do texto. Olhando atenciosamente para o texto de Bittencourt e Bittencourt, verificamos que existem alguns pressupostos, entre ao quais o principal é: para não ter havido percepção de diferenças entre o som ao vivo e o som gravado e reproduzido, existe a crença (no texto) de que houve uma gravação, com o que havia na época de mais perfeito em matéria de captadores (microfones) e a reprodução foi realizada utilizando o que havia também, de mais perfeito como dispositivo reprodutor. A menção de um "sistema de alto-falantes bem camuflados", pressupõe a existência de um transdutor perfeito, e de tal modo construído, que pudesse ser escondido e ainda permitir perfeita cobertura da platéia. Só para não deixar de mencionar agora, é um pensamento comum em áudio hoje, que ainda não existe esse dispositivo, mesmo hoje após uma grande evolução tecnológica.

Pressupunha-se então uma cumplicidade com estúdios de gravação. Era esperado deles que se esmerassem ao máximo para obter o melhor registro possível, usando os melhores equipamentos disponíveis. Esse comportamento que nos soa ingênuo hoje, provavelmente fazia muito sentido na época. Hoje – como veremos adiante – não é possível contar com essa cumplicidade, pois as inúmeras possibilidades abertas pelo processamento digital de sinal, há uma forte tendência de manipular as gravações (ao vivo ou em estúdio), dirigida em parte, pelos interesses comerciais das gravadoras.

No meu entendimento – que não difere muito do de qualquer outro audiófilo, pesquisador ou consultor de áudio – o que se pretende definir com conceito de alta-fidelidade é a busca de uma plataforma ou processo de registro sonoro e, de reprodução, que interfira (modificando-o) o mínimo possível no programa original, para que com isso, nossa atenção fique completamente absorvida pelo principal componente do programa de áudio, a música, e não nas distorções, chiados, e resposta em freqüências limitada, enfim, em outros componentes que se misturam ao áudio no momento da reprodução. E adiciono um detalhe importante, que às vezes é relevado: sem nunca perder de vista que é uma reprodução e portanto outro fenômeno sonoro.

Mas esta reprodução destina-se à nossa recepção através da audição, parte dos órgãos sensoriais da percepção humana. Ora, mediante um breve exame do panorama (já sintético) das teorias da percepção, traçado por Santaella no livro no livro A percepção: uma teoria semiótica (1998, 21-31), verificamos que a percepção – de acordo com as principais teorias – não pode ser compreendida apenas do ponto de vista fisiológico dos órgão sensoriais. Numa passagem esclarecedora, quando comenta uma das importantes teorias da percepção, de James J. Gibson, Santaella coloca a questão do seguinte modo:

Diz Gibson (p.24): 'se tudo o que percebemos nos
chega mediante a estimulação dos órgãos sensoriais, e se,
apesar disso, certas coisas não têm contraparte na
estimulação, é necessário assumir que estas últimas são, de
algum modo sintetizadas. Como essa síntese ocorre, é o
problema da percepção.'


Gibson parte aí, é evidente, de um axioma, provavelmente irrefutável, de que nossos órgãos sensoriais, ou seja, nossos cinco sentidos, são meios através dos quais se estabelece a ponte entre o que está no mundo lá fora, ou pelo menos, o que nos chega como estrangeiro, e o mundo que, na falta de um nome melhor, chamamos de mundo interior. Os órgãos sensoriais funcionam, consequentemente, como janelas abertas para o exterior. Nessa medida, esses órgãos são superfícies, passagens, capazes de explicar alguns dos fatores, os mais propriamente sensórios da percepção, mas não são capazes de explicar por que toda percepção adiciona algo ao percebido, algo que não está lá fora, no mundo fenomênico, e que não faz parte, portanto, da estimulação. Nesse ponto é que a mente entra em cena, pois é dela a tarefa da síntese, vem dela a elaboração daquilo que chamamos de compreensão ou significado tanto do que está lá fora quanto da estimulação que é produzida como efeito. A correspondência entre o resultado perceptivo e aquilo que provoca não é portanto, uma correspondência ponto a ponto. Há uma diferença, há um descompasso, ou melhor, algo se perde e algo se acrescenta. Isso que se acrescenta, especialmente, e que ocorre na passagem dos órgãos sensoriais para o cérebro, é, por enquanto, ainda não observável, não mensurável. E aí se localiza, exatamente o problema da percepção. (1998, 21-22)

É óbvio que a colocação de Santaella, pertence a um contexto muito específico, onde entende como necessária a elaboração do panorama sintético das teorias da percepção, para daí apresentar uma teoria semiótica da percepção, contida na obra se Charles S. Peirce. Mesmo assim esta breve passagem, contém conclusões importantes, decorrentes de uma convivência com as teorias da percepção, suficientemente fortes para causar algum desconforto em audiófilos, pesquisadores e consultores de áudio, por que se já são raros, os casos em que audição é considerada do ponto de vista fisiológico, mais ainda o são aqueles, em que é mencionada a percepção.

Ora, se a percepção não pode ser compreendida apenas do ponto de vista sensorial, então não se pode sequer se pensar em alta-fidelidade, sem considerar a percepção além das fronteiras fisiológicas. Se o conceito de alta-fidelidade, veio sendo discutido desde seus primórdios até hoje, sem considerar as teorias da percepção – e desconfio que sim -sou levado a crer, que muitos progressos, deixaram de ser obtidos e, muito esforço em pesquisa e desenvolvimento foi dispendido em questões, que mesmo com a obtenção de resultados mensuráveis física, elétrica e acusticamente, não são tão aparentes para a percepção auditiva humana, e me arrisco até a dizer, que são irrelevantes.

Vejamos alguns indícios que justificam minha desconfiança.

Há algumas poucas obras em áudio (entre 5 e 10), abrangentes (não me refiro às inúmeras obras específicas) e indispensáveis aos que desejam se aprofundar na área, que reúnem diversos autores, que por sua vez citam inúmeras outras obras e artigos. Uma destas é o Handbook for sound engineers; the new audio cyclopedia (Ballou Ed., 1991). Em seus 37 capítulos de 19 autores, são arroladas 670 referências. Destas, 631 referências (94%) são exclusivamente de eletrônica, acústica, áudio, etc. ; outras 34 (5%) referências remetem a trabalhos relativos à audição e/ou fisiologia humana; apenas 7 (1%) do total é de algum modo (ainda distante) ligado à percepção. No máximo referem-se à uma abordagem advinda da Psicologia ou da Psicoacústica. É claro que esta minha rápida análise considerou apenas os títulos das referências, sem verificar seu conteúdo. Foi uma delimitação necessária, para os objetivos em questão. Sem considerar outras obras importantes, é apressada qualquer afirmação em caráter definitivo. Entretanto isso não deixa de ser uma amostra. Muito estudos e pesquisas contribuíram para que o estágio atual de conhecimentos em áudio fosse atingido, mas com base nesta pequena amostra, podemos afirmar que as referências às teorias da percepção são mínimas. Então meu principal questionamento é: Não considerando as teorias da percepção pode-se construir adequadamente um conceito de alta-fidelidade? Alta fidelidade a quê?... Para quem?... Mesmo considerando-as em parte, pode-se ainda falar em alta-fidelidade, sabendo que após a percepção de um fenômeno sonoro e sua conseqüente transformação em impulsos nervosos, existe um complexo esquema mental de construção da significação, sobre o qual não exercemos nenhum controle?

A alta fidelidade tal como foi concebida, aplica-se à reprodução de um evento sonoro com muita fidelidade ao original, mas pressupõe que haja um compromisso, da parte de artistas, músicos, estúdios, técnicos de gravação e industrialização (produção em massa de mídias, como o CD, por ex.), em assegurar que a captação (transdução), gravação, pós- produção, masterização e prensagem, modifiquem o mínimo, o programa de áudio captado e gravado. Analisar estas questões em profundidade, evidentemente foge do âmbito da discussão da alta fidelidade à que me proponho, entretanto levantarei algumas questões de forma breve apenas para que não seja entendido, que foram relevadas, ou não foram consideradas adequadamente. Devo deixar claro portanto, que apesar de levantá-las mesmo brevemente, o foco da discussão é a existência ou não de uma alta fidelidade e, especificamente delimitada à reprodução sonora.

Ora, faz sentido pressupor a existência de uma espécie de compromisso como o que citei anteriormente, quando o arsenal disponível (nos estúdios), para se captar e gravar eventos sonoros, é limitado em características técnicas, e as marcas e modelos de equipamentos, muito similares entre si. Mas é impossível, quando a tecnologia permite um leque variado de opções, como hoje em dia, o que pela sua multiplicidade, dificulta a criação e aplicação de quaisquer regras.

De 1965 (data da publicação do curso "Esse") até hoje, a tecnologia e o conhecimento disponível para a fabricação de transdutores eletroacústicos (microfones, caixas acústicas e alto-falantes) evoluiu muito e, na mesma medida cresceram as incertezas a respeito da existência de transdutores perfeitos, especialmente microfones e alto-falantes.

As diversas abordagens e conceitos desenvolvidos em áudio, originaram um formidável leque de opções dos mais diferentes tipos de microfones, altofalantes (Woofers, midrangers e drivers, tweeters) [V.A. 04] e caixas acústicas, para as mais diversas aplicações, com os mais variados preços. O que não mudou é o fato de serem transdutores!

Este é o ponto onde queria chegar. Minha desconfiança, de que são se pode falar num conceito de alta-fidelidade, além de se basear nas das teorias da percepção, especialmente a peirceana, também se baseia na irrefutável constatação de que, qualquer forma de captação, registro e reprodução está irremediavelmente mediada pela transdução [V.A. 01].

Toda e qualquer captação [V.A. 05] eletroacústica, eletromagnética, piezoelétrica é uma primeira transdução de energia e, não importando aqui como se processa, é uma forma de representação do fenômeno físico ocorrido, como sinal de áudio.

Toda e qualquer forma de registro (gravação), seja analógica e linear, digital e linear, digital não-linear [V.A. 06], é uma segunda transdução de energia, que uma vez captada e processada (equalizada, comprimida, e corrigida, se necessário) agora será convertida em outra forma capaz de ser armazenada. Na gravação analógica linear em fita magnética, as partículas de óxido de ferro (entre outros materiais) são magnetizadas de forma análoga ao sinal de áudio, que irão representar, durante a reprodução. Na gravação digital o sinal de áudio será representado por um código binário (conversores AD/DA, convertem o sinal analógico para digital e vice-versa), onde se pode ajustar a resolução desejada (sample rate) [V.A. 08], de captura daquele. Uma vez convertido para um código binário, este estará apto para armazenado em uma variada gama de dispositivos.

Toda e qualquer forma de reprodução de um sinal de áudio amplificado, com vistas a reconstituir um fenômeno sonoro, por quaisquer tipos de caixas acústicas, é uma terceira transdução de energia. Colocar a questão da reprodução focada apenas nas caixas acústicas, por ora é suficiente para esta análise. Contudo se desejasse um maior rigor, eu deveria considerar como transduções intermediárias, aquelas decorrentes da pré-amplificação, equalização, etc. Coincidência ou não, três tipos de transdução, que nunca ocorrem em outra ordem ou arranjo, encontram semelhanças com as três categorias fenomenológicas, que estão na base de teoria peirceana: primeiridade, secundidade e terceiridade. Resumindo, acredito que há vários entraves que impedem a construção de um conceito de alta-fidelidade, entre os quais vejo dois como principais: a mediação da reprodução de qualquer som pelos transdutores e a não consideração das teorias da percepção.


IV - QUESTÕES TÉCNICAS E OUTRAS INUSITADAS, QUE NOS LEVAM A QUESTIONAR: ALTA-FIDELIDADE À QUÊ?

Faço a seguir um breve levantamento das diversas questões que, se consideradas adequadamente, nos levam a questionar não só a existência de uma alta-fidelidade, como sequer de alguma fidelidade.

  1. A cadeia de transduções do fenômeno sonoro Apesar de já termos mencionado que a inexorabilidade da transdução é ao nosso ver o mais importante entrave, para se falar na existência de alguma fidelidade, convém assinalar os pormenores mais relevantes, para não deixar essa questão obscura.

    1. Captação: a primeira transdução

      Para que seja possível escutar a sonoridade de um instrumento acústico qualquer, com a maior aproximação possível do real, é preciso que estejamos num lugar silencioso, ao ar livre, sem ventos e, bem perto do músico. O mesmo instrumento quando executado numa sala qualquer, soará diferente, porque as ondas sonoras diretas e refletidas, chegarão aos nossos ouvidos em tempos diferentes (reverberação) e, as características acústicas da sala, ou seja o coeficiente de absorção [V.A. 09], resultante da diversidade de objetos presentes na sala, inclusive do corpo das pessoas, fará com que as ondas refletidas, nos cheguem aos ouvidos, em conteúdo de freqüências [V.A. 07] e harmônicos [V.A. 10], diferentes daquelas diretas, provenientes da fonte sonora. Então a possibilidade de se conhecer o som real do instrumento, existe mas é de difícil acesso. Ainda assim se nos dispusermos a conhecê-lo nas condições acima descritas, estaremos atados às características fisiológicas dos ouvidos, que variam de pessoa para pessoa e, em todos nós se modifica conforme avança a idade.

      No caso de instrumentos elétricos como guitarras e contrabaixos, e eletrônicos, como órgãos e sintetizadores, é impossível conhecer o som do instrumento, sem a eletrificação dele e sua amplificação e reprodução, através de uma caixa acústica. Qualquer amplificador e caixa acústica reproduzirá um som, produzido por um instrumento, introduzindo nele suas próprias características e limitações elétricas, físicas e mecânicas. Ou seja, inscreve no quali-signo, marcas inconfundíveis, que definirão o timbre daquela combinação específica de instrumento, amplificador, caixa acústica.

      Daí decorre a insistência, que músicos, especialmente, guitarristas, contrabaixistas e tecladistas, com que testam, inúmeras combinações de instrumentos, captadores, encordoamentos, caixas e amplificadores, até obter uma sonoridade particular, que virá a ser seu quali-signo. Mas o quali-signo de um músico é ainda mais complexo. Seu modo inconfundível de tocar é adicionado à combinação de timbre obtida com os equipamentos. O que aqui denomino de quali-signo de um músico, engloba o gesto e as características do instrumento e sua amplificação. No que diz respeito à gestualidade Santaella também reconhece sua importância na obtenção do timbre final de um instrumento qualquer:

      De modo geral, em toda música produzida nos instrumentos tradicionais, a gestualidade do intérprete, sua performance, é fundamental para a realização da morfologia do som, ficando imprimida na forma sonora que esse gesto suscita. São essas formas que trazem a marca específica de um intérprete, a marca singular de seu gesto. (Santaella: 2001b, 151)

      Como exemplo vívido, podemos citar a remarcável a sonoridade dos guitarristas Carlos Santana, Brian May (Queen), Ritchie Blackmore (Deep Purple) e dos brasileiros Sérgio Dias (ex-Mutantes) e Victor Biglione, entre muitos outros.

      Sejam os instrumentos acústicos ou elétricos/eletrônicos, para serem gravados o som emitido diretamente (acústicos) ou indiretamente (elétricos), precisa ser convertido em energia elétrica, para que seja gravado. Por melhores que sejam os transdutores nesta fase, os microfones, e não importando o tipo – condensadores dinâmicos, de fita, etc. – é o seu diafragma, que ao vibrar, produzirá uma corrente elétrica análoga às ondas sonoras (Valle, 1997). Cada tipo de diafragma, com sua composição físico-química particular, possui propriedades únicas de reagir ao fenômeno sonoro, inscrevendo no quali-signo, já complexo de um músico tocando qualquer instrumento, outras características sonoras que não existiam antes. Aliado à isso existem as técnicas de microfonação, que permitem sonoridades muito variadas a partir de um único tipo, modelo e marca. Não é à toa que existe no mundo uma enorme variedade de tipos e modelos de microfones. Mais de 500 tipos podem ser encontrados no catálogo da revista EQ Magazine (1998, CD-Rom). A pré-amplificação do microfone e sua equalização é outro procedimento que modifica a sonoridade dos microfones e é claro, a sala onde ocorre a Gravação.

      Diante desta cadeia de transduções, que intentam representar o fenômeno sonoro, já se pode perceber que um sinal de áudio captado e gravado, só pode corresponder em parte ao seu objeto. O que são essas transduções senão ação sígnica? Como podemos ver em Santaella, semiose e autogeração não são próprias do homem:

      ...A ação de gerar, cedo ou tarde, interpretantes efetivos é
      própria do signo, cujo caráter não é aquele de uma matéria
      inerte e vazia à espera de um ego auto-suficiente que
      venha a lhe injetar sentido. Além disso, a semiose não é
      antropocêntrica. A autogeração não é privilégio exclusivo
      do homem. Ela também se engendra no vegetal, na
      ameba, em qualquer animal, no homem e nas inteligências
      artificiais. Para completar, a teoria dos signos e, por fim
      uma teoria sígnica do conhecimento. Todo pensamento se
      processa por meio de signos. ...(Santaella: 2000, 9)

      Decerto que nesses transdutores e equipamentos não há pensamento, mas seu comportamento – reagindo ao fenômeno sonoro – é tão previsível, na sua imprevisibilidade, quanto o pensamento. O que ao fim e ao cabo se constitui numa semiose.

    2. Gravação: a segunda transdução

      O sinal de áudio, já convertido em corrente alternada, para ser gravado em qualquer meio, tem que ser representado por um código, seja este binário, como na gravação digital, ou seja este analógico, como é a bias ou corrente de polarização, na gravação analógica linear em fita. Temos aqui outra cadeia de transduções, ou ação sígnica.

      Apesar da grande sofisticação tecnológica que os equipamentos de gravação – mesmo analógicos – alcançaram, o armazenamento do sinal de áudio, se dá por um representação, que também imprime suas características no quali-signo, modificando-o. Essa modificação soa agradável e musical, mesmo quando registra alguma distorção. Já no caso dos gravadores digitais, nenhuma distorção é admissível. Quando ocorre uma fração mínima de distorção, já se torna audível. Não é por acaso que muitos artistas, produtores e técnicos, optam por gravar em gravadores multipistas analógicos e depois transferir para os digitais e nestes, finalizar o processamento para enfim mixar. Só para citar um caso brasileiro, o artista Lenine é um dos que preferem gravar em gravadores multipistas analógicos, após o que transfere o material captado e gravado para uma plataforma de edição no domínio digital.

    3. Reprodução: a terceira transdução

      Só nos é possível conhecer as características de qualquer material gravado, através da sua reprodução, no que consiste converter uma codificação (analógica ou digital) em sinal elétrico e por fim amplificá-lo a um nível capaz de excitar alto-falantes e então, através destes, produzir som audível. Pois bem aí está a terceira transdução, sem a qual nos é impossível experienciar a reprodução do fenômeno sonoro. Novamente os transdutores, inscreverão no quali-signo suas características e limitações peculiares, de reproduzir a resposta em freqüências, do programa original de áudio. Não existe a menor possibilidade, de um transdutor qualquer, ser capaz de converter energia elétrica em som audível, sem que as suas propriedades mecânicas, física e elétricas, interajam com o som então reproduzido, originando um novo quali-signo.

      Ou seja, recolocando a questão de maneira bem clara: não existe a caixa acústica perfeita e nem pode existir através do modo como atualmente os alto-falantes produzem som: vibrando um diafragma para produzir ondas sonoras, pois não há como evitar que, a ressonância da matéria que o compõe, interferira na reprodução sonora, e se adicione ao quali-signo.

      Esta última transdução se interpõe de modo tão inexorável que, considerando as teorias da percepção, somos levados a concluir inequivocamente que é impossível para nós humanos, dotados destes órgãos sensoriais que dispomos, termos acesso direto ao fenômeno sonoro. Sendo o nosso acesso ao fenômeno intermediado portanto, por melhores que sejam estes intermediários – no caso as caixas – não deixam de ser intermediários e nem de interferir fisicamente na reprodução sonora.

    4. Mediações inevitáveis: Captação, gravação e reprodução

      Podemos concluir então que não nos é possível ter acesso direto ao fenômeno sonoro, nem quando gravamos nem quando reproduzimos. Para ser registrado e armazenado, um evento sonoro qualquer sofre a mediação de duas transduções obrigatórias: captação e gravação (conversão em um código e posterior armazenamento). Um evento sonoro gravado, para ser reproduzido, sofre duas outras transduções, a reconversão do código (binário ou analógico, bias) para sinal elétrico e deste para som audível.

      Enfim, seja na gravação ou na reprodução, o fenômeno sonoro somente pode ser percebido por nós por via da mediação.

  2. A gravação multipistas e o fim do evento sonoro simultâneo

    O termo alta-fidelidade começou a ser utilizado para expressar a condição de uma reprodução sonora fiel ao evento ou som original. Fazia sentido na época em que a expressão surgiu, defini-la desse modo. Mas ao mesmo tempo traz embutida a crença talvez ingênua, de que o estágio tecnológico alcançado naquele momento, perduraria indefinidamente sem mais progressos ou, de que reproduções somente ocorreriam, de eventos que de fato existiram, sob a forma de concertos. Podemos ver isso na passagem transcrita abaixo de Bittencourt e Bittencourt:

    Assim, se Alta-fidelidade quer dizer 'reproduzir um som
    tal como o original', dentro do limiar psicológico do
    observador, podemos afirmar que a moderna audiotécnica
    já resolveu o problema bem satisfatoriamente. (Bittencourt
    e Bittencourt, 1965, p. 1)

    Na medida em que a tecnologia evoluiu e especialmente com a invenção da gravação multipistas [V.A. 11], na década de 50, atribuída à Leo Fender (E.U.A) [V.A. 11] (não encontrei confirmação consistente dessa informação), que permite a gravação de uma obra musical, em partes que são executadas e adicionadas aos poucos, tornando desnecessária a execução simultânea de vários instrumentos, o conceito de alta-fidelidade, a meu ver, foi se tornando cada vez mais inadequado.

    As gravações que outrora eram feitas com a execução simultânea e é claro, com a presença física dos músicos, reduziram-se ao mínimo, permanecendo apenas os casos de concertos ao vivo, orquestras em estúdios, performances acústicas com reduzido número de instrumentos, como o jazz por ex.: freqüentemente gravado com piano, contrabaixo, guitarra, bateria e às vezes voz. Com a gravação multipistas, deixou de existir o evento sonoro simultâneo, por questões de ordem prática. Pois é mais fácil refazer um pequeno solo de guitarra mantendo as outras pistas já gravadas, intactas, do que se expor ao risco de realizar um nova sessão, com todos os músicos, onde o pequeno trecho problemático a ser refeito, poderia ser corrigido, mas com a ocorrência de erros de outros músicos/instrumentos. Com a inexistência do fenômeno sonoro, como evento que teve lugar no espaço/tempo, pode-se falar em alta-fidelidade à quê?

  3. A gravação multipistas e eventos sonoros inexistentes

    A gravação multipistas trouxe ainda uma situação inusitada, entre outras. Um músico, desde que fosse um multi-instrumentista, passou a poder gravar suas músicas, ou seu álbum inteiro, sem precisar recorrer a outros músicos. Arnaldo Baptista (um dos três componentes de Os Mutantes), após o fim da banda, e já na sua carreira solo, gravou um disco (Baptista, 1982) onde tocou todos os instrumentos. Isto só é possível com a gravação multipistas, onde uma pista pode ser gravada por um artista, enquanto escuta, em perfeita sincronia, uma outra gravada anteriormente, por outro músico ou por ele mesmo. Numa situação tão radical como esta, existe alta fidelidade à quê?

    Outro hábito gerado pela gravação multipistas, em todo o mundo, é a gravação da voz principal, na sua versão final, apenas quando todos os instrumentos já foram gravados. No máximo, é gravada uma voz guia, para que os demais músicos e o técnico de gravação, tenham uma idéia aproximada, da peça musical na sua provável versão final.

    Desta forma, totalmente ou parcialmente, quase a totalidade das obras gravadas, não foram decorrentes de um evento sonoro simultâneo. Existirá então, na reprodução, uma alta-fidelidade à quê?

    Há ainda, uma série de obras gravadas em condições especiais e inusitada. Nos álbuns de Frank Sinatra, Duets e Duets II (Sinatra, 1993 e 1998, cf. Tower Records, site) após a gravação de toda a base, envolvendo dezenas de músicos em dias e horários muito diferentes, as vozes principais de Sinatra e do convidado eram registradas num único gravador, entretanto os dois artistas cantaram em estúdios diferentes, situados em cidades e países, separados por milhares de quilômetros e, em tempo real. Imagem e áudio eram transmitidas por um sistema de fibra ótica (EDNet) para ambos os estúdios. Esta inclusive, foi a primeira gravação dessa natureza, em diferentes localidades mas simultaneamente, de acordo com Phil Ramone, o produtor (Ramone, 2001, site).

    No Brasil tivemos a regravação de clássicos Elis Regina após sua morte, Preservando a voz original e refazendo a parte instrumental. Nos EUA vimos Natalie Cole cantando ao lado de Nat King Cole, falecido décadas antes. Num álbum recente e ao vivo, do Paralamas do Sucesso (Vamo batê lata), o CD bônus continha 4 músicas gravadas em estúdio. Dentre elas, a faixa "Saber amar", teve a participação especial de Ernie Watts no Sax tenor, dos E.U.A.. Entretanto os três músicos do Paralamas e os convidados do Brasil, não tocaram nem gravaram na presença de e, ao mesmo tempo que Ernie Watts. As fitas ADAT (cópias das originais) com a base e voz gravadas, quase completas, foram levadas para Los Angeles e lá este músico, escutando os canais gravados, tocou algumas opções de arranjos, preenchendo alguns canais que lhe foram reservados. (Paralamas, 1995, encarte do CD).

  4. Desrespeito ao público: a gravação multipistas e a maculação do evento sonoro

    Até então citamos casos em que, mesmo não existindo o evento sonoro simultâneo, ou sendo este impossível, ainda fica preservada alguma autenticidade, na representação das características de primeiridade, do estilo a da obra de um artista. Mas, e nos casos em que a autenticidade é parcialmente, ou até inteiramente, maculada com o retoque posterior?

    O retoque em estúdio, de gravações ao vivo, é um recurso extremamente usado. Trechos de instrumentos e/ou vozes, são refeitos em estúdio, em substituição aos que, de algum modo, não foram registrados satisfatoriamente ou apresentaram erros de execução durante o concerto. Isto é possível graças à gravação multipistas, onde instrumentos, ou grupo deles, são gravados em pistas separadas. Há ainda muitos casos em que diversos instrumentos são adicionados em estúdio para acrescentar ao evento sonoro gravado, características que de fato não teve. Esta é uma prática condenada por inúmeros artistas em todo mundo. O evento sonoro e simultâneo, que então teria existido de fato, foi completamente maculado, com acréscimos posteriores, sem que o público tenha sido informado a respeito, e que pensa estar adquirindo um obra totalmente registrada ao vivo, o que suscita a mesma questão, porém agora com a preocupação ética: alta-fidelidade à quê? Em certos casos, músicos e técnicos concordam que pode ser legítimo retocar minimamente, uma gravação que por algum motivo teve partes ou notas de alguns instrumentos, dada a importância e raridade... Mas mesmo assim não equivalerá mais ao registro do evento original.

  5. Uso da tecnologia para criação de simulacros de primeiridade

    As características de primeiridade (uma das três categorias peirceanas) de um artista, demonstradas por ele e percebidas por nós, durante um concerto, ou durante a reprodução de uma obra gravada, constituem a personalidade musical, o estilo próprio, que nos permite diferenciá-lo de um outro. Sabe-se que essa personalidade está sempre em construção e nunca acabada. De plena consciência disso, a indústria cultural, na sua sede incontrolável de produzir novos artistas de sucesso (entenda-se muitas vendas), se utiliza da mais moderna tecnologia para criar artistas com uma personalidade predominantemente fictícia, o que estamos denominando aqui de simulacro. Isso, provavelmente, jamais seria percebido, se os artistas nunca se apresentassem em concertos. Contudo, como isso é inevitável, é exatamente nas apresentações que ficam evidentes a inconsistente personalidade musical, quando são complementadas com artifícios tecnológicos.

    Como um artista pode compor e gravar uma obra sem usar um único músico, e se for o caso acrescentando apenas sua voz, pode fazê-lo também ao vivo, num concerto. Os exemplos mais recentes ocorreram nas apresentações de diversas bandas, no Rock'n Rio III, em Janeiro de 2001, no Rio de Janeiro. Algumas bandas se utilizaram do Playback, recurso onde o artista canta (e na maioria das vezes canta mesmo, com sua própria voz), em sincronia com a reprodução de músicas gravadas. É um recurso muito comum nos programas de auditório, da TV aberta. Entretanto em eventos de grande porte como esse festival, anunciado pelo seu idealizador, Roberto Medina, como o maior do mundo, um artista se apresentar com Playback não me parece corresponder, ao que se espera de um concerto: execução ao vivo. Para ficar apenas no nível mais superficial, do nosso dia-a-dia, infringe o código de defesa do consumidor. Anuncia-se uma coisa e vende-se outra.

    Casos mais graves podem ocorrer como o caso da artista Britney Spears em sua apresentação no mesmo festival. Ele á anunciada pela sua gravadora como a sucessora da Madonna, com o aval da própria. Sua apresentação é repleta de coreografias e com muitos dançarinos. Entretanto, o tão esperado concerto, pelos seus fãs – na maioria adolescentes – foi decepcionante. Inteiramente em Playback, algumas vezes, com sua voz ao vivo mixada, outras vezes inteiramente gravada... Até a sua própria voz!.. A cantora Sandy, da dupla Sandy & Júnior, que também se apresentou no mesmo festival, declarou à Isto É, em entrevista:

    ISTOÉ - Você ficou supresa com a Britney Spears usando Playback ?

    Sandy - Saquei na hora! As pessoas comentaram que foi
    uma falta de respeito com o público. Eu acho que, se ela
    podia fazer ao vivo, deveria ter feito. Foi mancada da
    Britney, mas não foi só ela que usou.

    ISTOÉ - Você e Júnior usaram?

    Sandy - Temos um recurso de computação chamado
    Protools. No Rock'n Rio, não foi preciso usar por que
    estávamos com 36 músicos no palco. Quando o show é
    apresentado em um circuito, não dá para levar tudo. A
    banda fica com 12 músicos e a gente bota alguns
    instrumentos a mais, com o Protools, para não ficar aquela
    música magra. Para dublar a nossa voz, nunca. (Sandy,
    2001, Isto é, n. 1641, p.11)

    Pois bem, a busca da alta-fidelidade, na captação, gravação (mesmo que não seja destinada à edição de um álbum, mas apenas para transmissão televisiva) e reprodução, aplicada a um concerto como este, num festival desse porte, estaria baseada na reprodução fiel de quê?

  6. Usando a tecnologia para criação de eventos sonoros virtuais

    Por fim, entre as questões puramente técnicas, temos a gravação digital multipistas (em Hard disk) não-linear, com a interface MIDI (Musical Instrument Digital Interface), que permite a gravação de uma obra inteira, sem utilizar um único músico. Um aplicativo de sequenciamento MIDI executa uma composição (devidamente preparada de acordo com a notação musical) com vários instrumentos, cujos timbres (vários deles gravados de instrumentos existentes) estão armazenados na memória ROM de processadores e/ou placas de computador. Conforme o tempo e compasso, definidos na partitura, as notas de cada instrumento (amostra dele) são exibidas seqüencialmente. Com isso um músico, pode compor uma obra inteira, sem executar um único instrumento de fato, ou fazendo-o apenas parcialmente, limitando-se àquele que é sua especialidade. Estamos denominando esse tipo de evento aqui como sonoros virtuais.

    Ao reproduzir uma música que foi composta, executada e gravada assim, existirá alta-fidelidade à quê?

  7. Processamento de sinal de áudio

    Numa gravação em estúdio, muitos instrumentos após a fase de captação e gravação, são processados de modo a ser obter uma certa textura, tonalidade, às vezes até modificando seu envelope ou A.D.S.R. (attack, decay, sustain, release) [V.A. 12], que em resumo, são as características de quaisquer sons puros ou notas musicais. Não podemos deixar de registrar aqui que uma característica extremamente interessante é que, na medida em que a tecnologia evoluiu, aumentou consideravelmente a presença dos sons graves e subgraves – muitas vezes obtidos com o processamento de sinal – na maioria das obras. O que nos leva a acreditar cada vez mais, que estes sons têm o objetivo de nos fazer sentir no corpo (pelo tato da pele) a materialidade da música, que não é possível apenas com a capacidade sensória dos nossos ouvidos. Esta contudo é uma outra hipótese e por ora, deixo para uma investigação futura.

    Especificamente para captação e gravação de vozes (sem invalidar outras aplicações), existem ainda tantos recursos técnicos para adição de harmônicos, reverberação (re-criando ambiência, profundidade ou posicionamento espacial de um som), afinação, transposição (sem julgar aqui, a adequação, beleza, propriedade... de tais efeitos), que modificam o evento sonoro captado e gravado, de tal maneira, que o tornam outro muito diferente, impossibilitando até, sua execução ao vivo, em condições semelhantes.

    Como será possível existir alta-fidelidade na reprodução de uma gravação feita desse modo? Será alta fidelidade à quê?

  8. Propriedades fisiológicas do ouvido humano.

    Uma vez que assinalamos as diversas questões que envolvem a problemática do evento sonoro e, da sua captação e reprodução, não poderíamos de modo algum, suprimir do rol de questões aqui levantadas, a interferência das características fisiológicas da audição, no processo de percepção do evento sonoro.

    Entre as diversas questões, há duas de maior interesse: A curva de audibilidade humana e, a capacidade do ouvido de nos fazer ouvir sons, além daqueles que compõem um evento sonoro qualquer. Apesar de haverem outras questões importantes, fiquemos por ora com estas, pois o seu adequado entendimento, já será capaz de causar algum desconforto, para os que insistem na existência de uma alta-fidelidade.

    1. As curvas Fletcher & Munson e Robinson & Dadson

      A curva de audibilidade do ouvido é uma questão bastante complexa. Ela varia de indivíduo para indivíduo, pode ser expandida com conhecimento teórico, ou seja, podemos aprender a escutar, e varia conforme a idade, ou seja nossa capacidade auditiva decresce na medida em que a idade aumenta. A melhor capacidade auditiva é conseguida após a puberdade e, pode ser representada por uma curva suavemente ascendente,. Aos 25 anos esta curva alcança o seu ápice e inicia o declínio, também suave gradualmente, sendo diferente para cada freqüência. Este declínio acentua-se cada vez mais na medida em que a idade avança. E há mais uma questão bastante significativa: este declínio é muito mais acentuado nos homens do que nas mulheres. Segundo Beranek Acoustics apud Bittencourt e Bittencourt (1965, p.14), aos 55 anos por exemplo, na freqüência de 4.000 Hz, as mulheres apresentam uma perda auditiva de 15 dB, enquanto que os homens, uma perda de 25 dB. Já aos 70 anos, em 4.000 Hz, as mulheres apresentam uma perda de 18 dB e, os homens, 48 dB, ou seja, 20 dB de perda auditiva, a mais do que as mulheres!

      De acordo com classificação dos signos, contida no edifício filosófico elaborado por Charles Sanders Peirce, todo pensamento é uma forma de representação e, toda forma de representação é um signo. Signos intentam representar seus objetos, ou seja, tudo aquilo que nos bate à porta da percepção. Mas segundo Santaella, um signo não pode representar totalmente o seu objeto:

      " Quando percebemos algo, estamos alertas a algo que está
      lá fora e se apresenta a nós e que não se exaure no
      processo perceptivo. Isto quer dizer: o som que ouço no
      rádio, enquanto escrevo, continua existindo independente
      da minha audição. E minha audição, no caso, não será
      nunca capaz de captar todos o traços e aspectos desse som.
      Haverá sempre uma pluralidade de atributos e caracteres
      que cada percepção particular sempre perderá, mesmo que
      o ouvinte, no caso deste exemplo, fosse um grande
      especialista em música." (Santaella: 1998, 96)

      Quando se trata de áudio, esta não é uma mera afirmação abstrata, baseado na teoria peirceana, e passível de discussão. O ouvido humano devido às suas características fisiológicas, não pode e não o faz em hipótese alguma, a captura do fenômeno sonoro na sua totalidade. A sensibilidade do ouvido varia conforme a freqüência e de acordo com a intensidade sonora, conforme foi demonstrado pela primeira vez em 1933 no trabalho de Fletcher & Munson, dos Laboratórios Bell (EUA), denominado contornos de audibilidade equivalente (Equal Loudness Contours). Este trabalho foi refinado em 1956 por Robinson & Dadson, e veio a ser adotado pelo ISO (International Organization for Standardization), como ISO Recommendation 226 e é conhecido como Equal Loudness Contours (Ballou, Ed. 1991, 33). Na Fig. 01 apresento o gráfico com o trabalho de Robinson & Dadson, que redesenhei, inserindo 4 indicadores identificados como pontos A, B, C e D, para facilitar a compreensão da explicação que se segue.




      FIGURA 01

      Curvas de audibilidade equivalente para tons puros em um campo de som frontal para humanos de média acuidade auditiva.

      Equal Loudness Contours for pure tones in a frontal sound field for humans of average hearing acuity determined by Robinson & Dadson.

      (Ballou: 1991, p. 33)


      A curva de 90 phons, apresenta sempre o mesmo valor em qualquer freqüência, ou seja 90 phons. Entretanto ela não corresponde ponto a ponto às intensidades sonoras em decibéis ou dB/SPL.

      Esta curva de 90 phons, em destaque, e que corresponde a 90 dB/spl em 1.000 Hz, equivale aos seguintes N.I.S. para outras freqüências, indicadas como pontos A, B, C, e D:

      • 90 phons /40 Hz = 107 dB SPL
      • 90 phons/400 Hz = 86/87 dB SPL
      • 90 phons /4.000 Hz = 80 dB SPL
      • 90 phons/10.000 Hz = 94 dB SPL


      Tomando-se como exemplo a curva de 90 phons, que em 1.000 Hz equivale a 90 decibéis (dB), podemos deduzir o seguinte: Um dado som que estejamos escutando e que tenha um nível de intensidade sonora médio de 90 dB, não é capturado pelos ouvidos com linearidade para todas as freqüências audíveis, mas sim obedecendo a uma curva de sensibilidade, que varia conforme a freqüência. Na figura indicamos 4 pontos. O ponto C está exatamente na zona de melhor audibilidade do ouvido que é 4.000 Hz por isso o usaremos como referência, nas explicações.

      Quando estivermos escutando um som qualquer com 4.000 Hz (C) ao mesmo tempo que um outro de 10.000 Hz (D) e, para escutarmos os dois com a mesma sensação auditiva de intensidade sonora, (noção que comumente e erroneamente chamamos de volume) será preciso que o som de 10.000 Hz, esteja maior em 15 dB, que o de 4.000 hz. Comparando o ponto (C) com o ponto (B), vemos que um dado som de 400 Hz precisa estar com + 6 dB de intensidade, que o de 4.000 Hz, para ambos serem percebidos com mesma intensidade. Como o decibel [V.A. 16] não é uma unidade de medida linear, mas sim logarítmica, a cada + 3 dB dobra a intensidade. Então +6 dB significa uma necessidade de intensidade de volume 4 vezes maior.

      Comparando o ponto C com o A, em 40 Hz, vemos que nos graves a situação é trágica: Um som de 40 Hz precisa estar com + 27 dB, que um outro de 4.000 para ambos serem escutados com mesma intensidade. Para que se possa ter uma idéia do que significam estes + 27 dB e, porque caracterizamos a situação como "trágica", suponhamos que existam duas caixas acústicas perfeitas (apenas para efeito de comparação) uma para médios e outra para graves; cada uma delas quando receber digamos, 30 Watts, produzirá um N.I.S. (Nível de intensidade sonora ou SPL – Sound Pressure Level) de 80 dB (por ex.: a 4 m.), de modo linear para todas as freqüências, compreendidas na faixa de trabalho de cada uma (graves e médios). Aplicando a lei do inverso do quadrado [V.A. 17] (Inverse Square Law) então, enquanto apenas uma única caixa acústica de médios recebendo 30 Watts seria o suficiente para produzir 80 dB a 4 m., seriam necessárias 512 caixas de graves, recebendo cada uma 30 Watts, para produzir um N.I.S. de 107 dB (+ 27 dB em relação a 80). Desse modo, somente escutando 512 caixas de graves, ao mesmo tempo que, apenas uma de médios, nosso ouvido perceberia os sons (vindos de 1 caixa de médios e de, 512 de graves) com intensidade equivalente.

      Em outras palavras isso vem demonstrar que a nossa capacidade de perceber os sons não é a mesma para todas as freqüências, ou seja nosso ouvido não possui uma curva de resposta plana (linear para todas as freqüências). Ele recorta de um modo característico e conhecido, a informação auditiva que nos chega. Existe portanto um modo de escutar que extrai do evento sonoro, apenas uma parte do seu real conteúdo em freqüências. Desse modo o fato de o signo só poder representar em parte o seu objeto, em se tratando de áudio, é uma questão pré-definida a priori pelas características fisiológicas da audição e portanto, fora de nosso controle.

      Peirce não chegou a conhecer o trabalho de Fletcher & Munson realizado em 1933, nem o refinamento deste, feito em 1956 por Robinson & Dadson. É bem provável que ele mesmo quando previu que o signo não poderia representar o seu objeto inteiramente, não estivesse se referindo à resposta em freqüências do ouvido, mas é impressionante como as curvas de audibilidade, que recortam o fenômeno sonoro, extraindo apenas parte dele para representá-lo, coincidem com a sua teoria dos signos e da percepção, no que diz respeito ao modo como o signo representa o seu objeto.

    2. A capacidade do ouvido de nos fazer ouvir sons além dos que estão presentes no fenômeno.

      Ao descrever as características do ouvido humano, Braun nos informa que temos a capacidade de ouvir além dos sons principais que nos chegam, os sobretons ou harmônicos e, tons de combinação, como podemos ver nessa passagem que apesar de longa, é por demais reveladora:

      Quando uma onda chega ao ouvido humano, além de ter a
      sensação de ouvir a freqüência do som, se tem a sensação
      adicional de ouvir outros sons, que não chegaram ao
      ouvido e que têm freqüências 2, 3, ... vezes a freqüência do
      som que chegou. Por exemplo, se recebermos uma onda
      de freqüência de 440 Hz (que corresponde a uma nota la),
      teremos a sensação de ouvir, além desta nota, sons de
      freqüências 2 x 440 Hz = 880 Hz, 3 x 440 Hz = 1320 Hz,
      etc. Sons com estas frequëncias se chamam sobretons ou
      harmônicos.

      Quando chegam ao ouvido vários nos de diferentes
      freqüências, ocorre outro fenômeno que é muito curioso.
      Suponhamos que chegam aos ouvidos dois sons com
      freqüências de 500 Hz e de 800 Hz [grifo nosso]. O ouvido
      tem a sensação de ouvir, além das freqüências que
      chegam, sons que têm as seguintes freqüências:

      800 Hz – 500 Hz = 300 Hz,
      800 hz, + 500 Hz = 1.300 Hz,
      2 X 800 Hz – 500 Hz = 1600 Hz – 500 Hz = 1.100 Hz
      2 X 800 Hz – 2 X 500 Hz = 1600 Hz – 1000 = 600 Hz
      2 X 800 Hz + 500 Hz = 1600 Hz + 500 Hz = 2.100 Hz, etc
      [grifo nosso].

      Os sons com estas freqüências se chamam tons de
      combinação. O som do tom de combinação que se percebe
      com maior intensidade e o que tem freqüência igual à
      diferença das freqüências dos dois sons presentes (em
      nosso caso, o de 300 Hz); os outros tons de combinação
      que se produzem têm intensidades muito pequenas e em
      certas ocasiões são difíceis de perceber. (Braun, 1991, p.
      71, trad. nossa)

      Devo registrar aqui que, apesar de ter mencionado no início deste item, não farei considerações a respeito da capacidade dos ouvidos de escutar sobretons ou harmônicos, pelo fato de que já é uma característica conhecida e adequadamente considerada no âmbito do áudio e sonorização.

      A informação que Braun nos apresenta, a respeito da capacidade fisiológica do ouvido, de nos dar a sensação de ouvir tons de combinação, é por demais desconfortante para os que insistem em pensar num conceito de alta-fidelidade.

      Se no momento em que o som enquanto fenômeno físico, é convertido em impulsos nervosos, há uma adição de informação, de modo que nós escutamos mais do que o que de fato está lá fora, como se pode falar em alta-fidelidade? Se, nas três inexoráveis transduções, pelas quais passa o fenômeno sonoro, para ser gravado e reproduzido e então por nós percebido, houvesse a alguma possibilidade de alcançarmos o "grau zero" de temperatura ao qual Peirce se referiu, conforme a passagem de Santaella abaixo, ainda assim estaríamos sujeitos a perceber algo além do que faz parte do fenômeno sonoro:

      ... quanto mais tentamos nos aproximar do objeto dinâmico,
      mais mediações vão surgindo. O único recurso que se tem é
      ir mudando a roupagem da representação por outra mais
      diáfana. Mas há um limite para isso, ' uma realidade última
      como um zero de temperatura' . (Santaella: 1998, 8Cool

      As duas questões que levantamos, quando consideradas adequadamente, vêm encorpar ainda mais os argumentos contrários à possibilidade de existência de uma concepção de alta-fidelidade. Por um lado a nossa audição, pelas características que lhe são próprias, recorta o evento sonoro de um modo específico; por outro, a partir desse recorte que percebemos, contendo uma profusão de notas e acordes (tons de freqüências conhecidas, com riqueza de harmônicos) adicionamos diversos outros inexistentes no evento sonoro original. Como então se pode falar num conceito de alta-fidelidade?

V. A PERCEPÇÃO DO EVENTO SONORO À LUZ DA TEORIA DA PERCEPÇÃO PEIRCEANA

Acreditamos ter levantado até o momento uma série de questões que a meu ver, impedem qualquer intenção, por mais fugidia que seja, de se elaborar um conceito de alta-fidelidade. Não dá para se pensar nem mesmo em alguma fidelidade. O evento sonoro que nos produz um estímulo não é nem mesmo semelhante ao que percebemos, é outro! Passaremos agora à aplicação da classificação de signos de Peirce ao evento sonoro e a nossa percepção dele, de acordo com a teoria da percepção Peirceana, baseado no diagrama proposto por Santaella (1998: 108), que apresentamos no quadro 1.




QUADRO 1


A semiose perceptiva, conforme o diagrama proposto por Santaella (1998: 111) pode então ser representada como na figura 02.




FIGURA 02



A. O phaneron

Segundo Peirce (CP 8.297 apud Santaella, 2001b: 33) phaneron é qualquer coisa que aparece de qualquer modo à mente, que todas as pessoas, em condições físicas e psíquicas normais, pode observar. Phaneron portanto é o evento sonoro que aparece em dois momentos, no processo de captação, gravação e reprodução de um evento sonoro. No primeiro momento temos a ocorrência original do evento no tempo e no espaço determinado, e que nunca de repetirá do mesmo modo. A partir desta ocorrência, tem início a primeira semiose, através da qual o evento será captado e gravado em algum suporte. No segundo momento, temos a reprodução do material gravado que, uma vez decodificado e convertido em sinal elétrico, colocará em movimento os diafragmas dos alto-falantes, produzindo um novo evento sonoro, que intenta representar o primeiro, ou melhor a representação dele, tal e qual foi captado e gravado. Este segundo momento corresponde à segunda semiose.

B. Representâmen

Segundo Pinto, "... um representâmen é um signo ainda não atualizado como signo para um sujeito, isto é, algo que já participa de uma relação de representação sem, contudo, ter sido percebido como signo"(1995, 46). Na reprodução de eventos sonoros podemos identificar a presença do representâmen, logo após a primeira semiose, quando uma representação do evento sonoro original é gravada em qualquer suporte, ficando então pronta para ser reproduzida; pronta para ser atualizada num signo.

C. O evento sonoro enquanto signo

Santaella propõe a primeira classe de signos, a dos quali-signos icônicos e remáticos, como dominante para a sonoridade, mas alerta que deve ser tomada como ponto de referência-limite "...visto que nesse nível, estamos lidando apenas com possibilidades não atualizadas" (Santaella, 2001b: 106). Podemos extrair da sua proposição uma preocupação em não se tomar uma classificação como estanque, imutável, ou ainda impossível de se combinar com outras. Portanto, a classificação dos eventos sonoros enquanto signos, que utilizo parte daí.

Quando escutamos um evento sonoro musical previamente gravado e que já nos é familiar, por se tratar de um evento singular, único e irrepetível, ocorrido num período de tempo, ele é um sin-signo, indicial e dicente. Como a secundidade incorpora a primeiridade, este traz dentro de si, um quali-signo, icônico e remático, sendo este, uma somatória de diversos outros signos de mesmo tipo, que ocorrem simultaneamente, como é característico da música, tanto ao vivo, como gravada. Estes por sua vez representam (cada um deles) a marca sonora inconfundível de um músico (a sonoridade característica dele), somada ao seu gesto. A música como um todo (não apenas um trecho), numa reprodução aqui e agora, também incorpora um quali-signo, icônico e remático, que consiste na somatória de características que nos permite distinguir um intérprete de outro, pelo seu gesto (modo de cantar e/ou tocar), estilo musical e pela forma de arranjar e compor.

Se ao contrário, o evento sonoro, cuja reprodução está em andamento, nos é desconhecido (mesmo que o intérprete e sua obra pregressa já nos seja familiar) o fundamento do signo se alternará com freqüência entre um sin-signo icônico e remático, um sin-signo indicial e remático e um sin-signo indicial e dicente, em muitos momentos desta primeira audição, visto que o puro aspecto qualitativo da música, que está predominando, em alguns momentos nada estará representando (icônico e remático) e nem trazendo informações sobre quaisquer objetos fora dele; às vezes estará representando algo, mas ainda sem quaisquer referência sobre objetos fora dele (indicial e remático); às vezes representando algo e com referência a objetos fora dele (indicial e dicente). Um exemplo muito claro deste último tipo, ocorre quando a música rica em subgraves (tons e harmônicos compreendidos entre 16 e 50 Hz) está sendo reproduzida num sistema de som, numa intensidade sonora acima da média, digamos 90 dB numa sala de aproximadamente 4 x 4 m., que disponha de um subwoofer [V.A. 13], capaz de reproduzir bem estas freqüências. Estes sons quando reproduzidos nesta intensidade sonora (ou acima) têm a propriedade de fazer vibrar os objetos ao seu redor e também de excitar o tato da nossa pele, o que quer dizer que os escutamos não só com os ouvidos mas com o corpo. Neste caso predominará inteiramente a secundidade.

O evento sonoro como puramente som é um legi-signo que se manifesta numa réplica, um sin-signo, visto que sua ocorrência singular no espaço e tempo é regida pelas leis da acústica.

A música gravada, enquanto possibilidade de se colocar um CD num microsystem e exibi-lo, é um sinsigno que por sua vez é a réplica de um legi-signo, tendo em vista que há uma lei geral, segundo a qual se pode gravar um CD e reproduzi-lo.

Na reprodução de um evento sonoro gravado, uma música em particular, o objeto dinâmico é a sonoridade ocorrida no tempo e no espaço, uma ocorrência singular, aquilo que ouvimos. Na semiose perceptiva ele corresponde ao percepto. É o fenômeno que está lá e se força sobre nós compulsivamente e continuará lá, independente da nossa vontade. Mas para tratarmos de som é mais apropriado nos referirmos no passado, porque um som qualquer quando percebido, já ocorreu, vibrou as moléculas de ar criando ondas sonoras que se propagaram e chegaram até nossos ouvidos. Não é possível parar uma reprodução musical, nem mesmo nos equipamentos analógicos como os toca-discos, para "olhar" para uma nota ou trecho como fazemos na exibição de um programa qualquer gravado em vídeo, paralisando apenas um frame da imagem.

O objeto imediato desta semiose corresponde ao percipuum, na semiose perceptiva. Ele apreende uma parte do percepto e " ...isso quer dizer que o objeto imediato tem algum nível de coincidência com o objeto dinâmico. Ele é uma emanação do objeto dinâmico, um certo modo de torná-lo mediatamente presente"(Santaella, 2001b, 46). Uma das razões prováveis, pelas quais a a apreensão do objeto dinâmico é apenas parcial, é a atenção focalizada, regulada e dirigida pelos nossos interesses pessoais voluntários – nossa capacidade intelectual de interpretá-lo – e involuntários – o fluxo da evolução humana, adaptando o homem ao meio; capacidade fisiológica (Braun, 1991) – , conforme se pode inferir a partir da afirmação de Santaella: "Daí Peirce ter dito que só percebemos o que estamos equipados para interpretar. Ou seja só ouvimos o que podemos ouvir, só entendemos o que podemos compreender" (1998: 99). Quanto à capacidade fisiológica, no estágio atual da evolução humana, já é possível perceber nos textos mais recentes dos intérpretes de Peirce, que a noção de representação parcial do objeto no signo, é determinada pelas características do sistema sensório, pelo menos em grande parte e, fora de nosso controle, tal como procurei demonstrar com as curvas de audibilidade de Fletcher & Munson. Vejamos esta passagem de Santaella:

Tão logo o percepto atinge nossos sentidos, ele é
imediatamente convertido percipuum. Todas as espécies
estão equipadas geneticamente com sistemas sensórios
específicos que filtram o estímulo exterior ou percepto de
uma determinada maneira, impondo um certo tipo de
tradução perceptiva àquilo que se apresenta aos sentidos.
Ao ser traduzido de acordo com o potencial e limites que
um dado sistema sensório lhe impõe, o percepto se torna
percipuum. (Santaella: 2001b, 107 e 108 )

O percepto ao ser traduzido em percipuum pode se
apresentar como uma "mera qualidade de sentimento, vaga,
difusa, simples imediaticidade qualitativa imprecisa e sem
limites" correspondendo à categoria de primeiridade; "de
forma surpreendente, conflitante" correspondendo à
categoria da secundidade; ou "em concordância com os
esquemas gerais que regulam os nossos juízos de
percepção" (Santaella, 2001b: 109).

Aplicando os conceitos à audição e interpretação de um evento sonoro gravado, de um intérprete que já conhecemos, mas cuja obra é inédita e está sendo escutada pela primeira vez, podemos detectar a presença do percipuum em nível de primeiridade por curtos instantes e, na medida em que, o que se apresenta à nossa percepção, é desconhecido. Tão logo venhamos a identificar uma linha melódica, mesmo que estranha, desconhecida, passamos à secundidade, que evidentemente já incorpora a primeiridade. Se esta linha melódica se mantiver de forma previsível, de acordo com as convenções musicais, passamos à terceiridade. A cada rompimento, mudança ou transposição desta linha melódica, que se apresentar à nossa percepção como imprevisível, desconhecida, retornamos à primeiridade. o ao Uma vez conhecida a música, nas audições seguintes, predominará a terceiridade com os nossos juízos perceptivos.

Mas não podemos esquecer que o som é evanescente e que a nota o acorde que acabou de ser apreendida no percipuum já não está mais presente. A nota ou acorde seguinte dará origem a outro percipuum e não necessariamente do mesmo tipo. Como o evento sonoro é dinâmico e seqüencial, cheio de altos e baixos, acordes de instrumentos que aparecem em momentos específicos e desaparecem, temos uma seqüência de objetos imediatos do tipo percipuum, onde há momentos em que predomina uma das categorias. Para exemplificar, imaginemos que venha existir algum tipo de instrumento de medição capaz de acusar o tipo de percipuum num dado instante. Escolhi para representá-lo, a figura de um indicador de V.U. (abreviação de Volume Unit), freqüentemente encontrado nos gravadores, de rolo ou cassete mais antigos, e outros equipamentos de áudio). Seu trabalho é mostrar uma informação, cujo objeto dinâmico (o nível de sinal áudio e possível ocorrência de distorção) é um signo do tipo índice e portanto, um signo degenerado. Pois bem, se este indicador existisse, tal como representado na fig. 3 e, se pudesse estar de algum modo monitorando a nossa semiose perceptiva durante uma audição, ele oscilaria freqüentemente entre primeiridade, secundidade e terceiridade, mesmo nas audições seguintes onde a música já nos será familiar. Como o Percipuum nunca captura o percepto na sua totalidade, nas audições seguintes, sempre haverá a possibilidade de percebermos novos trechos ou acordes de algum instrumento que não havíamos percebido nas audições anteriores.




FIGURA 03


Essa característica peculiar do objeto imediato capturar apenas parte do objeto dinâmico, no meu entender é a questão chave para se compreender porque não é possível existir alta-fidelidade. Para tanto demonstramos a seguir o comportamento do objeto imediato nas semioses anteriores – captação e gravação – além de nesta terceira transdução (terceira semiose), que corresponde à reprodução de um evento sonoro gravado.

Na primeira transdução, que corresponde à captação do evento sonoro com a finalidade de registrá-lo num suporte qualquer, o objeto dinâmico também é apreendido no objeto imediato parcialmente, visto que as propriedades físicas do material do qual é feito o sensor em questão (captadores e microfones) determinam um comportamento específico de suas propriedades elétricas, e este conjunto, interagindo com outros circuitos no console de mixagem, bem como com outros adicionados externamente, resulta numa representação do objeto dinâmico no objeto imediato, que por mais que possa guardar semelhanças, não deixa de ser outro bem diferente. Esta diversidade entre objeto dinâmico e objeto imediato, fica muito mais evidente quando consideramos que quase a totalidade das captações de eventos sonoros musicais destinados à gravação hoje em dia, sofre algum tipo de processamento prévio. Daí se pode concluir que não há representação fiel.

Na segunda transdução, o objeto dinâmico é o sinal elétrico proveniente do console de mixagem, após a captação e processamento (mesmo que mínimo) e está então, apto para ser representado num código análogo ou binário, para então ser armazenado. Este objeto dinâmico é então apreendido, novamente de forma parcial, no objeto imediato conforme as limitações impostas pelas características do suporte (gravação analógica em fita magnética) ou pelos circuitos conversores AD/DA (analógico/digital e digital/analógico). Se assim não o fosse, nas condições atuais de recursos tecnológicos para captação e gravação, os diversos fabricantes, não estariam migrando para uma plataforma com resolução de 24 bits e amostragem de 96 kHz, contra os atuais 16 bits e 44.1 kHz do CD de áudio. É uma clara tentativa de ampliar a "resolução" de captura do objeto imediato.

Apesar de nem ser o momento e local apropriado, não posso me furtar a pelo menos, registrar que esta segunda transdução (como muito provavelmente as outras) segundo pude constatar, se subdivide em outras três obedecendo a lógica das categorias Peirceanas. Como durante a gravação no modo multipistas, o conteúdo de cada pista pode ser ouvido isoladamente e, o evento registrado pode ser reproduzido com qualquer combinação de volume entre as pistas, resultando num evento sonoro particular e que depende de ajustes específicos entre canais (e devemos considerar também aqui os conteúdos ausentes que ainda serão gravados) temos uma 2.1 mera possibilidade de morfologia sonora. Uma vez finalizado o processo de captação e registro e, estando a matriz multipistas pronta para ser mixada, temos a 2.2. possibilidade morfológica sonora atualizada. Se temos um console digital e automatizado fica mais fácil entender este segundo nível.

Todo o processo de mixagem vai sendo preparado aos poucos. A cada reprodução, o técnico de gravação executa ajustes físicos nos controles do console, atendo-se me um ou poucos canais por vez. Estes movimentos físicos são gravados pelos circuitos do console e se repetirão automaticamente tal e qual, quando uma nova reprodução for comandada. Este procedimento é repetido, em cada um dos canais por vez, até se obter uma rotina completa de mixagem automatizada. Se a mixagem for realizada num console analógico sem nenhuma automação, o processo de mixagem também será preparado aos poucos, até o técnico obter um registro preciso das operações, que deverá realizar enquanto a música é reproduzida no gravador multipistas e, toda essa informação, gravado num outro de 2 pistas (estéreo ou codificado para Dolby Digital, DTS ou outro). Se for uma plataforma totalmente informatizada, pode ser feito de várias maneiras, mas o que importa é que, de todo modo, haverá um momento em que a informação estará pronta para ser convertida em 2 canais (estéreo ou codificada). Por fim temos a 2.3 morfologia sonora concretizada, regulada por uma lei, quando toda a informação registrada em múltiplas pistas foi mixada para resultar num evento sonoro único, num dado formato. Todas as vezes em que for reproduzido, o será do mesmo modo.

Olhando agora para a terceira transdução sem focalizar a semiose perceptiva, vemos que o CD contendo um evento sonoro codificado, quando posto em execução, criará um objeto dinâmico, que corresponde à uma ínfima quantia de energia elétrica alternada que intenta representar o evento sonoro gravado. Essa energia precisa ser préamplificada para então ser amplificada, pelos amplificadores, até um nível capaz de excitar os diafragmas dos alto-falantes. Vale ressaltar que sempre é preciso existir um pré-amplificador mesmo nos casos em que sua presença é omitida por razões comerciais, como nos microsystems de uso doméstico. A pré-amplificação é outra semiose com outra apreensão parcial do objeto dinâmico no objeto imediato. A amplificação final também é outra semiose, também com outra apreensão parcial do objeto dinâmico no objeto imediato. Há muita discussão entre audiófilos e muitas posições diferenciadas a respeito, o que não vem ao caso. Mas a existência de uma polêmica, sobre a capacidade maior ou menor, dos amplificadores de amplificarem um sinal de áudio corretamente, suas taxas de distorção harmônica, relação sinal vs. ruído, entre diversos outros parâmetros – e digase de passagem, há fundamento na discussão – já é uma comprovação de que não há possibilidades do objeto imediato apreender a totalidade do objeto dinâmico.

Outra prova inequívoca, da apreensão parcial do objeto dinâmico no imediato, mas que parte do mesmo pressuposto, é a existência de uma técnica de amplificação, que no final das contas, aumenta a "resolução" do objeto imediato. Trata-se da multi-amplificação, onde o sinal de áudio após a pré-amplificação, é filtrado e separado em canais que, usualmente vão de 2 até 5, cada um contendo uma parte do sinal de áudio, que no caso de cinco, correspondem a subgraves, graves, médios-graves, médios e agudos. Com isso, um dado amplificador ao invés de fazer um esforço enérgico para amplificar todo o sinal de áudio (contendo desde os sons mais graves aos mais agudos) sem distorcer, fará o mesmo esforço para amplificar apenas uma faixa, o que resultará numa distorção muito menor. Em se tratando de amplificadores oriundos de projetos reconhecidamente eficientes, é comum escutar a afirmação, no ramo de sonorização profissional, de que quanto menor a faixa entregue ao amplificador, menor será a taxa de distorção. Usualmente fala-se em um zero a mais, na taxa, por cada via adicionada. Por ex.: se um amplificador apresenta uma THD (Total Harmonic Distortion) de 0,01 quando operando em uma via; em duas vias será de 0,001; em três, 0,0001, e assim por diante (Bortoni, 2000). Contudo, em se tratando da tão propalada alta-fidelidade ou sistemas High end esta é uma questão relegada ao segundo plano ou muitas vezes esquecida, muito provavelmente pelos interesses dos fabricantes em manter a simplicidade dos sistemas, cercando apenas quatro pontos chave: Fontes de programas (CD players, tape-decks, etc.), pré-amplificadores, amplificadores e caixas acústicas. É sabido que o quinto elemento – a multiamplificação – requer conhecimentos para se ajustar corretamente e que um pequeno desajuste acidental, deteriora o resultado do sistema inteiro e, infelizmente muitos audiófilos ou não têm conhecimento para realizar os ajustes, ou simplesmente não querem ter esse tipo de compromisso.

Bom, se mesmo após todos os argumentos que levantei sobre a impossibilidade de existência da alta-fidelidade tal como é conhecida hoje, ainda fosse possível de algum modo se falar num conceito de alta-fidelidade, esse modo teria que obrigatoriamente, implicar no uso da multiamplificação e extinguir definitivamente o uso de filtros passivos (que normalmente ficam dentro das caixas acústicas), para que com a ampliação da resolução de captura do objeto dinâmico no objeto imediato, nos seja possível uma aproximação máxima como um grau zero de temperatura à que Peirce se referiu. Infelizmente não é o que ocorre. A maioria dos sistemas comerciais não utiliza a multi-amplificação, mas divisores passivos dos mais diversos tipos com todos os seus problemas e inconvenientes, fabricantes diversos têm preferido pesquisar, desenvolver e fabricar os mais perfeitos cabos, conectores, sonofletores, até mesmo os divisores passivos e, os mais sofisticados (e caros) amplificadores, relevando uma questão relativamente simples e há muitos anos conhecida.

Para finalizar a abordagem sobre os objetos dinâmico e imediato, vejamos a terceira transdução de modo genérico, sem considerar o evento sonoro específico na qual se materializa. A reprodução de evento sonoro qualquer, já pré amplificado e amplificado dá origem à um outro objeto dinâmico, uma corrente elétrica alternada várias vezes maior do que a inicial, capaz de excitar os alto-falantes. Esta é capturada pelo objeto imediato dentro dos limites impostos pelo conjunto magnético, enrolamento da bobina móvel, resistência, impedância, tipo de fio utilizado, compliância do conjunto móvel, material do diafragma, enfim um conjunto de características que determina o comportamento de um alto-falante em termos de sua curva resposta em freqüências.

Para dar conta de um método de classificação dessas características, com o propósito de se obter conhecimento acerca da previsibilidade desse comportamento dos alto-falantes, A. Neville Thiele desenvolveu um método e apresentou em 1961 na Radio and Eletronic Engineering Convention em Sidney, Austrália que veio mais tarde a ser ampliado por Richard H. Small e amplamente disseminado graças à proliferação dos computadores pessoais (Silva, 1996). As informações obtidas com este método são conhecidas hoje como parâmetros Thiele & Small [V.A. 14]. Usando aplicativos de simulação de desempenho de alto-falantes em caixas acústicas e, de posse dos parâmetros fornecidos pelo fabricante, é possível conhecer o comportamento de um dado alto-falante, numa caixa, antes de construí-la, e assim corrigir inúmeros problemas, ainda na fase do projeto e ensaio de desempenho.

Pois bem, utilizando um desses aplicativos, o Bassbox 6 for Windows, que nos permite fazer modificações em alguns parâmetros, de modo que as alterações se reflitam nos demais, e simulando o desenvolvimento de um projeto aleatoriamente, nós nos deparamos com a prova mais irrefutável, de que as características físicas e elétricas determinam um modo particular, segundo o qual, o objeto imediato irá representar o objeto dinâmico. Para exemplificar de modo rápido e mais facilmente inteligível, uma pequena mudança no parâmetro Fs (freqüência de ressonância do alto-falante ao ar livre), de um alto-falante qualquer, adicionando algumas gramas de peso, quer dizer, mudando o valor do parâmetro Mms fornecida pelo seu fabricante, (que depois devem ser de fato adicionadas no cone do alto-falante) modificam todo o comportamento do alto-falante, o que se pode detectar na alteração de vários outros parâmetros e por fim na curva de resposta em freqüências dele. Conforme o tipo de caixa acústica em que venha a ser instalado, de acordo com os objetivos de projeto, tais mudanças podem se constituir num razoável desastre ou, numa boa melhoria. O que importa é que isso vem comprovar que as características de um alto-falante, vistas como parâmetros T&S, impõem ao objeto imediato, condições e limites bem definidos, segundos os quais o objeto dinâmico deverá ser representado. Desse modo não é possível existir a caixa acústica perfeita, visto que não existem na natureza matérias-primas inertes para a fabricação de alto-falantes e, para ouvir o evento sonoro, estaremos sempre dependentes de como um certo tipo de caixa representa o objeto dinâmico, no imediato.

Ao finalizar minha análise desta semiose correspondente à terceira transdução, não posso deixar de registrar aqui outra questão importante e há anos conhecida, que vem comprovar eletricamente, esta apreensão parcial do objeto dinâmico, no imediato. É de amplo conhecimento daqueles que estudam e pesquisam áudio, que os melhores alto-falantes do mundo, no que diz respeito à eficiência deles, ou seja, sua capacidade maior ou menor, de transformar energia elétrica em som, possuem eficiência ao redor de 10%! Note... 90% da energia recebida não é transformada em som, mas em calor, principalmente. E isto nos mais eficientes (e caros), e nos demais?!

Precisei me demorar um pouco mais na análise dos objetos dinâmico e imediato porque é exatamente no entendimento da noção de representação parcial, que está a chave para se entender porque não pode existir um conceito de alta-fidelidade. Passemos então à análise do interpretante para enfim concluir.

Segundo o diagrama da semiose perceptiva apresentado por Santaella (1998: 111) e que representamos na fig. 02, o percipuum apreende o percepto, como 2.1.1. qualidade de sentimento; como 2.1.2. relação física; e como 2.1.3. generalização. Na audição de um evento sonoro desconhecido (mesmo que de um intérprete já familiar) predomina a qualidade de sentimento e portanto a primeiridade, se alternando freqüentemente com a relação física, secundidade, já que o evento é um existente. Dependendo do conteúdo de subgraves na gravação, e dependendo se o sistema de som, no qual está ocorrendo a reprodução, o reproduz adequadamente, a ocorrência destes dá origem a signos do tipo índice, no caso, índices da materialidade da música, presença material ainda que não visível, uma vez que faz vibrar os objetos à sua volta e, o nos faz senti-la com o tato da pele. Mas não é só isso. Os sons subgraves estão no imaginário coletivo muito associados a eventos catastróficos como explosões, desastres, terremotos, em suma eventos que ameaçam a vida, que por conseguinte nos evocam medo ou apreensão. Quando fazem parte da sonoplastia de um filme, sabemos que se trata de ficção e portanto, o efeito mais imediato é o de trazer realismo às cenas, fazendo-nos sentir com o corpo, a materialidade do mundo fictício apresentado na tela. Uma comprovação dessa materialidade representada pelos subgraves, o é fato de que, a presença dos subgraves, quando utilizados pela primeira vez, no filme Terremoto (Earthquake, Mark Robson, 1974) foi muito mais facilmente percebida pelo público, do que os avanços no sistema de leitura do som contido na trilha ótica, quando passou de mono a estéreo; de estéreo Dolby A-NR [V.A. 18]; deste para Dolby Stereo; até chegar aos padrões atuais. Por ocasião do lançamento deste filme, as salas de exibição tiveram que adicionar aos sistemas de som, caixas acústicas específicas para subgraves, para reproduzir adequadamente o som, dos tremores mostrados na tela.

Portanto, se a percepção dos subgraves permanecesse no nível da 2.1.1, qualidade de sentimento, manifestada na 2.1.2 relação física, tais sentimentos teriam componentes de medo e apreensão, as reações mais imediatas, nos levando a elaborar significações em dissonância com a significação pretendida da música. Para que não tenhamos uma percepção equivocada, passamos deste segundo nível para o terceiro, 2.1.3. generalização, e deste para o interpretante. Para elaborarmos as nossas sentenças lógicas, "acessamos" outros signos interpretantes, para então retornarmos à 2.1.2. relação física, e lá permanecemos na maior parte das vezes – com relação aos subgraves – já sabendo que tais componentes subgraves na música não nos oferecem riscos. Como a toda a semiose é um continuum esse retorno, de acordo com a lógica das categorias peirceanas, é na verdade um avanço para uma outra semiose e não um retorno dentro da mesma. Ou seja, a 2.1.2. relação física (secundidade), incorporando a 2.1.1. qualidade de sentimento, dá origem a sentenças lógicas (interpretante) em desacordo com o evento que estamos experienciando; tais sentenças se constituem no objeto dinâmico da semiose seguinte, a ser representado no objeto imediato ou percipuum, e aí sim, permanecer – na maioria das vezes – na 2.1.2. relação física, gerando sentenças lógicas em nível de secundidade predominante. Se dispusermos de conhecimentos de áudio e acústica, que nos permitam chegar ao nível da generalização, identificando o tipo de subgraves, o momento de sua ocorrência, a sua origem como harmônicos de notas ou acordes emitidos por determinados instrumentos, neste caso predominará a 2.1.3. generalização e sentenças lógicas e interpretantes em nível de terceiridade. É claro que em se tratando de eventos sonoros, que têm sua ocorrência no tempo, a semiose perceptiva é dinâmica e seqüencial e além disso, composta de várias outras semioses que ocorrem simultaneamente, de modo muito análogo, ao que ocorre com a música gravada que, no seu processo gerativo, que devido aos recursos da gravação multipistas, põe em andamento uma série de eventos sonoros simultâneos e harmonicamente sicronizados.

Santaella está certa de que há também três níveis do interpretante. "...Estou certa que sim e que eles ficam muito perto de se identificar com os níveis do percipuum, visto que essa é uma outra característica especial da semiose perceptiva" (1998: 109). Penso que é de extrema importância para a semiose perceptiva e, mais especificamente a auditiva, uma compreensão mais detalhada do interpretante, contudo, como este não é o foro apropriado, nem mesmo para propor, utilizo uma forma provisória de divisão do interpretante, até mesmo nas denominações que escolhi. O interpretante então se subdivide em 3.1. sentenças lógicas relativas à qualidades de sentimento; 3.2. sentenças lógicas em nível de relação física; e 3.3. sentenças lógicas generalizantes. É fácil constatar que estes três níveis apresentam muita similaridade com os três níveis do interpretante dinâmico, que são, respectivamente, emocional, energético e lógico.

Pois bem, sendo o signo de um evento sonoro que se nos apresenta aos sentidos, um ícone, seu objeto imediato só pode ser uma qualidade possível de sentimento e, seu interpretante, só poderá ser uma 3.1. sentença lógica relativa à qualidades de sentimento. Se o signo for um índice e, na maioria das vezes o é, tanto pela a presença dos subgraves, como de outros caracteres no evento sonoro, seu objeto imediato tanto poderá ser uma 2.1.2. relação física como uma 2.1.1. uma qualidade de sentimento. Sendo o signo um índice e seu objeto imediato uma 2.1.2. relação física, seu interpretante poderá ser tanto uma 3.1. sentença lógica relativas à qualidades de sentimento como 3.2. sentenças lógicas em nível de relação física. Se o signo for um símbolo, e seu objeto uma 2.1.3. generalização, o interpretante poderá ser qualquer um dos três tipos de sentenças lógicas. Esta classificação que ora apresento não é excludente, ou seja, quando descrevo o signo como um índice, tendo como objeto imediato uma 2.1.2. relação física, não quer dizer, que não possa ser um índice tendo com um objeto imediato uma 2.1.1. qualidade de sentimento. Mas pela lógica das categorias peirceanas, certamente este signo do tipo índice, não poderá ter um objeto imediato de terceiridade como a 2.1.3. generalização. Pois a primeiridade pode prescindir da secundidade e da terceiridade, enquanto que a secundidade incorpora a primeiridade e pode prescindir da terceiridade e, esta por sua vez, incorpora primeiridade e secundidade. Daí se extrai a noção de signos genuínos (triádicos) e signos degenerados, de Peirce. Degenerados são aqueles signos que, de algum modo, prescindem da secundidade e/ou terceiridade. Não deixam de ser signos, embora não sejam genuínos, triádicos.

Exemplifiquemos um caso mais raro em que, o signo é do tipo simbólico na audição de um evento sonoro. Neste caso é preciso entender melhor as nuances do objeto, para o que, o trecho a seguir de Santaella é bem esclarecedor:

Para esclarecer o papel que o objeto desempenha nesta
relação, os intérpretes de Peirce, entre eles Johansen
(1985), Pape (1989) e também Savan (1976), têm
recorrido à noção de contexto, uso do signo e ligação do
signo ao contexto. Peirce não chegou a formular essa
ligação com precisão; deixou muitas sugestões de que o
caminho para compreensão do objeto do signo estaria
nessa ligação. Seus intérpretes têm, assim, levado à frente
a tarefa de estruturar mais precisamente a função do objeto
na sua relação com a noção de contexto. De um modo
geral, pode-se afirmar que a informação anterior ao signo,
adquirida colateralmente por meio de outros signos,
constitui-se no contexto do signo.(Santaella: 2000, 107 e
108 )

Então no caso da audição de um evento sonoro (familiar ou não) cujo contexto seja o trabalho de um técnico, digamos um feito particular, como o caso de Carlos Savalla, técnico de som da banda Paralamas do sucesso por vários anos, tanto em concertos como em gravações, que no álbum ao vivo da banda (Vamo batê lata), tentou reproduzir no CD, a mesma experiência que o público teve, nos concertos com os subgraves, é um signo do tipo simbólico, da capacidade deste profissional, do seu estilo, que com a sua experiência e conhecimento, conseguiu reproduzir muito bem a morfologia sonora da banda em concertos. Sendo o signo um símbolo, seu o objeto imediato poderá ser tanto 2.1.1. uma qualidade de sentimento, 2.1.2. uma relação física ou, uma 2.1.3. generalização e seu interpretante poderá ser do tipo 3.1. sentenças lógicas relativas à qualidades de sentimento; 3.2. sentenças lógicas em nível de relação física; e 3.3. sentenças lógicas generalizantes. Destas possibilidades se pode extrair 6 combinações de objeto imediato e interpretante, para o signo simbólico.

O que determinará a predominância de uma combinação, é o conhecimento daquele que, na audição do evento sonoro, se dispõe a analisar o objeto, nesse contexto de um feito particular. Só para não deixar de exemplificar as possibilidades mais gerais dessas combinações, se o ouvinte em questão for um técnico de gravação sem muitos conhecimentos teóricos, pode predominar o julgamento de percepção (signo simbólico), tendo como objeto imediato uma 2.1.2. relação física e um interpretante do tipo 3.1. sentenças lógicas relativas à qualidades de sentimento. Se por outro lado, além da experiência, possuir um bom conhecimento teórico, sobre áudio e sobre suas próprias atividades profissionais, certamente predominará o julgamento de percepção simbólico, tendo como objeto imediato uma 2.1.3. generalização, com um interpretante do tipo 3.3. sentenças lógicas generalizantes.

Não é difícil notar que ao citar exemplos em abertos da audição de eventos sonoros, fiz questão de diferenciá-los entre familiares e desconhecidos. A razão pela qual assim procedi, foi para facilitar a introdução das subdivisões do percipuum em ponecipuum e antecipuum. O primeiro corresponde à uma antecipação próxima e, o segundo à uma memória recente e, acompanham o percipuum, na sua ocorrência, ora predominando um, ora outro, e/ou ainda uma combinação de ambos (Santaella, 1998, 79). Em nada mudam as análises, dos exemplos que citei, com a introdução desses dois novos termos. Saber que o percipuum ou objeto imediato pode ser do tipo antecipuum e ponecipuum, ou uma combinação deles, nos auxilia ainda mais, no entendimento do porquê, em nossa percepção de um evento sonoro, ora predomina a primeiridade, ora a secundidade, ora a terceiridade e mais, porquê chegamos a interpretantes, ou sentenças lógicas, também obedecendo três sub-níveis, predominando um deles em especial, conforme se o evento que nos bate à porta da percepção, é familiar ou totalmente desconhecido ou ainda combinações derivadas: intérprete familiar, álbum/música desconhecido, intérprete desconhecido, álbum/música familiar, etc.

Não é difícil perceber que, deliberadamente, concentrei a análise do interpretante na semiose perceptiva, visto que para o trabalho em questão, entender esta semiose, é mais premente para se compreender adequadamente os nossos argumentos em favor da impossibilidade da existência de uma alta-fidelidade e, de sequer, alguma fidelidade. Não pretendo dizer com isso que a semiose, digamos "normal" para diferenciá-la da perceptiva, é menos importante.

Ainda assim, sinto-me impelido a pelo menos abordar superficialmente, a questão do interpretante, por que como pude presenciar nas discussões das aulas de semiótica peirceana (anotações de aula, 2000), pareceu-me haver uma compreensão, entre os músicos e/ou estudiosos da área, que na semiose "normal", somente é possível se chegar ao interpretante lógico, se dispusermos de conhecimentos de composição e notação musical, caso contrário, não estaremos ouvindo música, mas apenas som. Como cheguei à uma conclusão diferente, creio ser importante registrá-la.

O interpretante, na semiose "normal" subdivide-se em três níveis: emocional, energético e lógico. Se recorrermos novamente à noção de contexto do signo, conforme o trecho transcrito de Santaella anteriormente, fica fácil entender como e por que cheguei à uma conclusão diferente. De acordo com o contexto do signo, veremos que a audição de música pode ocorrer sob vários enfoques, incluindo a audição como simplesmente qualidade sonora, como composição musical (segundo as discussões em aula citadas)e também como morfologia sonora, tecnicamente interpretável. Esta última é aplicável à técnicos de gravação, produtores musicais e audiófilos.

Desse modo, se na audição do evento sonoro, o contexto do signo for apenas o aspecto qualitativo, conhecendo ou não o intérprete e sua obra pregressa, predominará o interpretante emocional. Se o contexto do signo for uma tentativa de se entender uma obra ainda desconhecida, de um intérprete já familiar, considerando sua obra pregressa, predominará o interpretante energético. Este é o caso de amantes da música, apreciadores de um intérprete particular, mas sem conhecimentos de composição e notação musical e/ou também de técnicas de produção e gravação. Por fim, se o contexto do signo for a análise da "textura sonora" obtida e aspectos qualitativos, características de produção, do ponto de vista da composição musical predominará o interpretante lógico. Também predominará o interpretante lógico, se o contexto do signo for a análise da "textura sonora" obtida, aspectos qualitativos, características de produção, do ponto de vista da morfologia sonora, o que é aplicável a audiófilos e técnicos de gravação. Observe que incluí características de produção nas duas modalidades, porque é uma condição básica para produtores musicais, conhecimentos tanto de música, como de técnicas de gravação. O que nos leva a concluir que estes profissionais, conforme o contexto do signo, numa audição em particular, podem chegar à interpretantes lógicos diferentes. É claro que não excluímos a possibilidade, de técnicos de gravação e/ou audiófilos, também possuírem amplos conhecimentos musicais e, poderem alcançar interpretantes lógicos diferentes, tal como os produtores musicais.


VI. CONCLUSÃO

Bom, à essa altura, depois de tantos argumentos e comprovações apresentados, naturalmente brota em nossa mente o seguinte questionamento: se não existe alta-fidelidade existe o quê? Não existindo alta-fidelidade, o que se pode extrair de útil para os sistemas existentes ou, para projetos de novos sistemas? Será inútil o esforço de fabricantes de equipamentos de gravação para estabelecer novos padrões, como por exemplo gravação com amostragem (sample rate) de 96 kHz e resolução de 24 bits?

Em primeiro lugar, esclareço de início que não pretendo inventar um novo termo ou conceito. Deixo essa tarefa em aberto para contribuições futuras. Não acredito que seja o mais correto continuar usando esse termo já que evoca muitos significados impróprios. Contudo, reconheço que, na hipótese de meus argumentos serem aceitos e adotados amplamente, ainda levaríamos uns bons 10 anos, para ver esse conceito extinto da maioria das publicações do gênero. Então devemos nos contentar com uma coexistência pacífica ainda prolongada. Certamente não é possível existir um conceito de alta fidelidade na reprodução de eventos sonoros gravados, mas é possível se falar numa reprodução alta resolução, média resolução, baixa resolução, sem atribuir juízos de valor. A questão mais importante que se deve ter em mente, não é esta ou aquela definição de resolução, mas o fato de que, na audição de um evento sonoro qualquer, a mediação deste, pela cadeia de transduções e pela percepção humana, é inexorável e portanto, o evento percebido é um outro diferente daquele que ocorre no mundo físico. É uma representação do evento sonoro original e não ele mesmo.

Contudo para se introduzir esta noção de resolução de reprodução, sem pretender que sejam estabelecidos vínculos com juízos de valor, de imediato devo registrar que ainda é preciso encontrar palavras mais adequadas do que baixa, média e alta, pois justamente aí estaria um fonte de novos problemas de interpretação. Mas isto é tarefa para o futuro. Fiquemos por ora com a passagem de Santaella, onde isso fica muito claro:

Há um admirável texto de Peirce sobre a ética da
terminologia, no Qual ele diz que termos novos têm de ser
inventados para designar conceitos novos, e isso para que
os novos conteúdos não se misturem na poeira que recobre
velhos conceitos. De resto, ele diz ainda que o uso de
termos rigorosos é também uma boa maneira de a filosofia
se livrar de leitores preguiçosos. ...(Santaella: 1998, 78 )

Para Peirce todo o pensamento humano ocorre sob a forma de signos. Representação é a palavra apropriada para se entender o conceito de signo. Todo pensamento é uma representação de algo que acontece, aconteceu ou, que provavelmente acontecerá, seja no mundo físico ou na nossa mente. Tal representação é um signo. Um signo é interpretado num outro signo num continuum. "Qualquer coisa que substitui uma outra para algum intérprete é uma representação ou signo. Por exemplo: 'uma palavra representa algo para o conceito na mente do ouvinte', um retrato representa uma dada pessoa para a concepção do seu reconhecimento por alguém, um catavento representa a direção do vento para a concepção daquele que assim o entende, 'um advogado representa o seu cliente para o juiz ou júri que ele influencia' " (CP 1.553 apud Santaella, 2001b: 31). Sendo o pensamento uma forma de representação e portanto signo, a semiose ou ação do signo, especialmente a semiose perceptiva, nos conduzirá a julgamentos de percepção, baseados na informação capturada no objeto imediato, ou seja, no modo como o objeto dinâmico foi representado no objeto imediato. Se esta apreensão, do objeto dinâmico no objeto imediato, sempre é parcial, não há como se falar num conceito de alta-fidelidade, mesmo se as três primeiras transduções, que abordei em detalhes, tivessem alcançado um limite tecnológico último, como o grau zero de temperatura à que Peirce se referiu.

Entretanto reconheço que, no estágio tecnológico atual, é possível registrar casos específicos de reprodução de eventos sonoros, que na maioria dos sistemas, em qualquer configuração, já são reproduzidos com tamanha perfeição, em filmes, programas de TV, rádio, música gravada, que freqüentemente nos induzem a enganos, ao pensarmos que estão ocorrendo ao nosso redor, quando na verdade estão presentes numa reprodução qualquer. Tratam-se de tons puros gerados por telefones, pagers, relógios de pulso, campainhas residenciais, etc. Tomando-se como base os padrões de gravação atualmente utilizados e comparandoos com o conteúdo e complexidade (que é mínima) desses tons, podemos concluir que ainda há um bom trecho a percorrer na evolução tecnológica, para que uma reprodução, de um fenômeno sonoro musical gravado (que é centenas de vezes mais complexo), tal e qual ocorreu, se aproxime de equivalente perfeição.

Certamente a evolução dos sistemas de captação, gravação e de reprodução sonora, se dará no sentido de nos fazer experienciar o fenômeno sonoro ao nosso redor. Essa tendência começou com os sistemas quadrafônicos (4 canais) no fim dos anos 70, em oposição ao estéreo (2 canais), mas não progrediu, (para uso doméstico) provavelmente devido à limitação tecnológica dos suportes, no caso o disco de vinil e, do alto custo dos equipamentos. Contudo, no cinema essa tendência prosperou, evoluindo do som mono para simples estéreo; deste para estéreo processado Dolby A type NR, no início dos anos setenta; deste para Dolby Stereo (marca registrada da Dolby Laboratories) em 1975; deste para Dolby SR a partir de 1986; deste para Dolby Digital a partir de 1992; e finalmente, alguns anos depois, para Dolby Digital Surround EX (Dolby Laboratories, site, 2002) [V.A. 18]. Hoje os sistemas Dolby não são mais os únicos equipamentos disponíveis para decodificação do som de cinema, existem modelos de outros fabricantes. O som do tipo envolvente ou surround portanto, hoje é uma realidade estabelecida a tal ponto, que as cópias de filmes, além da trilha ótica (com som analógico), impressas numa das bordas (estéreo e codificadas para Surround), trazem na sua outra borda também, o som digitalmente codificado nos sistemas Dolby Digital, DTS (Digital theater sound)e SDDS (Sony dinamic digital sound), tudo com o objetivo de trazer maior realismo aos filmes, usando a técnica de som circundante ou surround.

Com o advento do videocassete doméstico e do videodisco, a Dolby Laboratories criou uma versão do sistema de decodificação, usado nos cinemas, para uso doméstico, o Dolby Surround Pro-logic que implica da reprodução do som através de 4 canais de áudio. Agora com o DVD (Digital video disc) é possível dispor, no âmbito doméstico, do um padrão de decodificação similar ao utilizado nos cinemas, o Dolby Digital AC-3 com 5 canais mais um para subwoofer, daí porque é conhecido como 5.1 (Dolby Laboratories, 2002, site). O áudio gravado nos DVDs, embora sofra compressão (MPEG Layer 2 ou MPEG2), possui resolução de 24 bits, em oposição aos 16 bits do CD de áudio. Já se pensa num padrão de reprodução de áudio doméstica, utilizando o mesmo suporte e equipamentos de DVD, trata-se do SACD ou Super Audio Compact Disc, com resolução de 24 bits e amostragem de 96 kHz, ao contrário dos 44.1 kHz do CD de áudio e, já existe um bom número de obras gravadas ou reprocessadas para este formato, conforme se pode verificar no site da Tower Records (SACD, 2001).

Todos esses saltos tecnológicos vêm confirmar que a tendência, na reprodução de áudio, é de fato a de o evento sonoro nos envolver. Mas isso não é tudo. Esse padrão de distribuição multicanal, ainda não é suficiente para nos fazer experienciar a localização espacial, como numa sala de concertos, de cada instrumento. Há 17 anos atrás, Cláudio Cesar Dias Baptista [V.A. 15], conhecido como CCDB, após longa experiência no desenvolvimento, construção e operação do sistema de som dos Mutantes, escreveu uma série de artigos sobre áudio, na extinta revista Nova Eletrônica entre 1977 e 1984. Durante uma longa conversa, onde debatíamos a alta-fidelidade - tema de um desses artigos - em seu laboratório no RJ, considerando a incapacidade do sistema estereofônico de reconstruir adequadamente um campo sonoro, ele argumentou que se houvesse a possibilidade de uma reprodução perfeita, esta deveria reproduzir o campo sonoro de modo que pudéssemos localizar espacialmente os instrumentos. Ele denominou essa possibilidade teórica, uma idéia originalmente sua, como som holográfico (Baptista, 1987, p. 94). De algum modo (ainda não inventado) um dispositivo, recriaria as vibrações de moléculas de ar, de forma localizada, em um espaço tridimensional.

De todo modo, isso ainda permanece como uma possibilidade futura, contudo há que se registrar essa inclinação para se buscar um forma de reprodução envolvente, recriando o campo sonoro, deixou de ser uma idéia inalcançável, tal como pareceu-me na época, para se constituir numa possibilidade concreta. Dr. Karlheinz Brandenburg, professor e pesquisador da Universidade de Ilmenau, Alemanha, muito conhecido por ter sido o criador do algoritmo de compressão MPEG-1, nível 3, o popular MP3, trabalha atualmente num projeto de criação de campos virtuais sonoros. O projeto é coordenado pelo Instituto Fraunhofer (Alemanha) e está sendo desenvolvido em parceria com instituições de vários países da Europa. Segundo Dra. Sandra Brix, em entrevista a Sólon do Valle, há em Ilmenau "uma sala de estar para demonstração, com 48 alto-falantes formando um 'u'. A necessidade disso vem do conceito Wave Field Sinthesis (Síntese de Campo de Ondas). É realmente necessário um array de alto-falantes, para reproduzir o que foi gravado." (Valle, 2001, 66-69).

Por fim, considerando todos os progressos tecnológicos já alcançados, bem como aqueles por vir, se houver condição de se conseguir uma reprodução sonora, de resolução tão alta, que permita uma representação perfeita do evento sonoro gravado, que nos faça experienciar o fenômeno como ocorrido aqui e agora, diante de nós, teremos alcançado aquele ponto último, como o grau zero de temperatura a que Peirce se referiu. Mesmo assim, a reprodução não deixará de ser mediada pelas três primeiras transduções , por mais que se aperfeiçoem e enfim pela percepção humana.

Para que esta forma de reprodução tão exata, venha existir um dia, – mesmo mediada – penso que será preciso um esforço conjunto e persistente, de audiófilos, músicos, técnicos de gravação, consultores de áudio, pesquisadores da área e fabricantes, no sentido de realmente demolir certos mitos que foram criados ao longo do tempo, enfrentar corajosamente concepções ultrapassadas e em desacordo com a realidade tecnológica e, o que é mais difícil, lutar incessantemente para que fabricantes diversos não mais utilizem denominações comerciais equivocadas, e até mesmo fantasiosas, que induzem consumidores ao erro e, por conseguinte à frustração, de adquirir algo que não corresponde ao prometido.

Se nos dispusermos a estes esforços, de forma a contribuir para que, esta reprodução exata, venha a existir um dia, ainda assim, penso que devemos dedicar máxima atenção possível aos elos mais frágeis da cadeia de transduções, na elaboração ou execução, de qualquer projeto de sistema de som, para esta finalidade. Para tanto, os sistemas devem obrigatoriamente, incorporar progressos do conhecimento humano já solidamente estabelecidos.

Exemplifiquemos algumas questões encarnadas em exemplos:

Uma questão das mais importantes é eliminar das caixas acústicas, os divisores passivos que são fonte de distorções e perda de potência, e utilizar largamente a multiamplificação. Com a tecnologia já disponível atualmente, no que tange à terceira transdução, é possível se obter excelentes resultados com amplificadores de médio custo, quando em multiamplificação.

Transistores ou válvulas? Em muitos equipamentos eletrônicos, a válvula não passa de vaga lembrança, mas em vários equipamentos de áudio – especialmente amplificadores – ainda existem e, para os quais vários modelos delas, continuam a ser fabricados. Esta é uma questão muito controversa. Valle, num artigo que tem o propósito de apresentar fatos e mitos a respeito dessa controvérsia, após apresentar inúmeras características sobre ambos os dispositivos, afirma que:

O transistor tem inúmeras vantagens sobre a válvula, :
consumo de energia 60% mais baixo, menos geração de
calor, ruído mais fácil de reduzir, menor tamanho, menor
peso, menor desgaste com o tempo, menor distorção
dentro da potência nominal, pode ser usado em circuitos
integrados, não usa necessariamente a alta tensão, etc.. As
vantagens da válvula são a maior musicalidade e
'transparência' , a capacidade de dar maior potência que a
nominal a uma distorção ainda aceitável e, no caso dos
amplificadores de guitarra, uma distorção do tipo
'overdrive' natural e extremamente 'macia'. (Valle, 1994,
15).

Ele faz ainda outras considerações sobre a válvula e conclui que a sonoridade de amplificadores valvulados e transistorizados é definitivamente diferente. Não pretendo de modo algum, alimentar ou prosseguir aqui, esta controvérsia. Penso que, se é necessário fazer uma opção, que seja no sentido de beneficiar um número maior de pessoas, com custos mais acessíveis. O amplificador transistorizado quando utilizado em multi-amplificação pode oferecer musicalidade e transparência, equivalentes aos valvulados e é especialmente educativo lembrar aqui de algumas opiniões de Rupert Neve, autor de inúmeros projetos inovadores de equipamentos de áudio, entre eles os lendários consoles Neve para estúdios e amplificadores valvulados, numa entrevista ao mesmo Sólon do Valle.

M&T - O que o Sr. pensa do lançamento de produtos
usando válvulas?


RN - Acho que as pessoas que usavam válvulas quando
não havia outra alternativa, têm muito a ensinar àqueles
que usam válvulas hoje. Outro dia, publiquei um artigo
sobre este assunto. As válvulas eram pouco confiáveis,
caras, ruidosas, ineficientes, quentes e grandes, sujeitas a
microfonia, produziam hum e nunca havia duas iguais.
Depois de tanto tempo, as pessoas começaram a
redescobrir as válvulas, e achá-las maravilhosas – é porque
não tiveram a experiência de usá-las na vida real. [...]
Enfim, é interessante ver entusiastas de hi-fi usando
amplificadores a válvula hoje. Eu uso mesmo um
amplificador integrado de 300 dólares, e descobri que é
um projeto classe A [refere-se a classes de amplificadores,
A, B, AB, D, G e não a um juízo de valor], com baixo
ruído e nenhuma distorção de crossover. [...]me satisfaz
tanto quanto outros que custam não 300, mas 3.000
dólares. [...] enquanto pessoas pagam milhares de dólares
por amplificadores de potência 'esotéricos' [...] Válvula
hoje é moda, é prestígio, é status. É como o sujeito que
compra um carro esporte... (Neve, 1995, 15).

Considerando as palavras de Rupert Neve, fruto de longa experiência com válvulas e transistores, e considerando o propósito de tornar essa "reprodução exata" num futuro, acessível ao maior número de pessoas, acredito que seja mais sensato nos inclinarmos para a multiamplificação, com uso de crossovers e amplificadores transistorizados. É em questões como essa que o conhecimento da teoria da percepção peirceana, ilumina sobremaneira o problema e nos ajuda a decidir mais acertadamente: a mediação é inexorável, o objeto dinâmico nunca será inteiramente captado no objeto imediato. Porquê insistir num assunto, cuja discussão não terá fim, e se dispomos de alternativas muito satisfatórias? Além do desuso de divisores passivos e da opção preferencial pelos amplificadores transistorizados, há várias questões, para as quais deveremos nos posicionar, nenhuma mais importante do que a outra, mas foge ao escopo desse trabalho uma abordagem minuciosa de cada um, fiquemos por ora com uma descrição mais resumida de alguns mais importantes.

Devemos também utilizar nas caixas acústicas, elementos transdutores com propriedades físicas mais próximas dos instrumentos que reproduzem. É sabido que a maioria dos instrumentos musicais, cujas freqüências mais altas e mais baixas, estão compreendidas entre 1.600 e 14.000 hz, gera seu som a partir da vibração de peças metálicas (cordas, chaves, corpo), pois bem, se não é possível existir um conjuntos de transdutores (drivers e tweeters) diferentes entre si, com membranas de metais diferentes, para reproduzir cada um desses instrumentos – o que seria obviamente inviável – que pelo menos, estes transdutores utilizados (para esta região do espectro de freqüências), utilizem membranas metálicas, que reproduzem com mais exatidão a maioria dos instrumentos, que de algum modo também são e/ou soam metálicos. Atualmente são usadas ligas de titânio nas membranas de drivers e tweeters. Então devemos optar pelo titânio, até que surjam drivers com membranas metálicas de outra composição. Observe que o propósito da escolha é atingir esta teórica reprodução exata!

Se a voz humana é indiscutivelmente melhor reproduzida por drivers de compressão acoplados a cornetas, que sejam preferidos estes em detrimento dos midrangers de cone e, é claro com membranas metálicas, mesmo não sendo obviamente, as cordas vocais, feitas de metal, prevalece na escolha a maioria dos instrumentos que dá textura à música, sem prejudicar reprodução da voz. Ainda na questão dos drivers e, por conseguinte, na região dos médios, médios-agudos, e agudos, se a melhor e mais aproximada forma de reprodução do evento sonoro, ocorre com drivers de compressão acoplados à cornetas, sendo tanto melhor o resultado quando maior for a rigidez delas, com o mínimo de absorção, porque escolher cornetas de materiais flexíveis e acusticamente absorventes (como plásticos, resinas com pintura, etc.)? Porque não insistir junto aos fabricantes para utilizarem matérias-primas como cerâmica, resina de poliéster com mármore em pó, e o que é melhor, Vidro! Porque não?

Se já há tecnologia fartamente disponível em todas as partes do planeta, para embutir crossovers eletrônicos nos amplificadores, por que não insistir junto aos fabricantes, que o façam? Neste caso devo ressaltar que tal insistência, se aplica mais à reprodução doméstica, visto que já existem opções no mercado, para aplicações de sonorização profissional. Um bom amplificador de dois canais, quando utilizado em bi-amplificação aumenta incrivelmente o rendimento, principalmente nos graves, a faixa de freqüências que mais de deteriora, quando filtrada por circuitos passivos. A bi-amplificação ainda não é o ideal – três ou quatro vias sim, a melhor opção – mas já será um passo significativo em direção à uma reprodução mais exata do evento sonoro, preservando a simplicidade de instalação, operação e custos mais acessíveis, sem modificar significativamente, os procedimentos industriais, através dos quais, os aparelhos são montados hoje.

Enfim o que deve prevalecer antes de tudo é o bom senso. O objetivo final de todo esse complexo sistema de captação, gravação e reprodução é uma tentativa de recriar o evento sonoro musical. A música é uma das grandes paixões humanas e sua reprodução, para o nosso deleite infinito, deve retirar do caminho tantos obstáculos quanto forem possíveis, já que a mediação é inexorável. Devem prevalecer os ganhos no "atacado" que realmente trazem diferenças perceptíveis, e não minúsculos ganhos como aqueles obtidos com cabos sofisticados e caros, conectores banhados a ouro, e uma infindável lista de acessórios para minimizar perdas. Não estou dizendo que não sejam necessários, mas o foco da nossa atenção deve estar voltado para ganhos significativos audíveis e mensuráveis com instrumentos de medição. Muitos dos sistemas, que se auto denominam como de alta fidelidade, existentes atualmente, ignoram essas questões que levantei, de modo que, já há alguns anos, poderiam possuir "fidelidade" maior do que a que dispõem atualmente, se as tivessem considerado adequadamente.

Nunca haverá a reprodução perfeita. Sempre o objeto dinâmico estará parcialmente representado dentro do signo, apesar de que, as novas técnicas de gravação com alta resolução, permitirão que o objeto imediato, capture o objeto dinâmico – nas duas primeiras transduções – com uma aproximação cada vez maior, mas certamente, ainda há uma longa distância a percorrer, até que o conhecimento humano, em seu progresso contínuo, permita que nos aproximemos do grau zero de temperatura à que Peirce se referiu.

Muito do que se pode fazer já está ao nosso alcance há vários anos. O que temos a fazer é utilizar adequadamente, prevalecendo o bom senso, sem esquecer que a mediação é inevitável e, sem nunca perder de vista que a música, enquanto nossa grande paixão, é o mais importante.


VII. REFERÊNCIAS BIBLIOGRÁFICAS:

    AZEVEDO, Alberto Vieira de. Teatros e auditórios: Acústica e arquitetura. Rio de Janeiro: H. Sheldon, 1994. 144 p.

    BALLOU, Glen (Org). Handbook for Sound Enginners: The new audio cyclopedia. Carmel (IN): Howard W. Sams & Company, 1991. 1506 p.

    BAPTISTA, Cláudio Cesar Dias. A gravação profissional de som ao seu alcance (1ª parte). Nova Eletrônica. São Paulo, ano V, n. 50, p. 78-83, abril, 1981.

    ______. Gravação profissional. Rio de Janeiro: editado pelo autor, 1987. 1134 p. Exemplar n. 5. (obs.: todos os exemplares comercializados são numerados e assinados pelo autor).

    ______. História de uma marca I. Rio de Janeiro, edição do autor: 1992. 130 p.

    ______. História de uma marca II. Rio de Janeiro, edição do autor: 1995. 56 p.

    BAPTISTA, Arnaldo. Singin' alone. São Paulo, Baratos e afins, 1982. 1 disco sonoro [? min.].

    BIANCOLI, Lucio. Teoria da alta fidelidade ou como ouvir melhor seu sistema de som. Traduzido por Juliano Barsali. Nova Eletrônica. São Paulo, ano V, n. 79 [?], p. 38-43, outubro, 1983.

    BITTENCOURT, Paulo Taques; BITTENCOURT, Hélio Taques. Curso "ESSE" de alta fidelidade: fundamentos psico-acústicos. 2. ed. São Paulo: Edições Monitor, 1965. 120 p.

    BRAUN, Eliezer. El saber y los sentidos. México: Fondo de Cultura Econômica, S. A. de C.V., 1991. 154 p.

    BORTONI, Rosalfonso. Curso de curta duração sobre Sonorização profissional, ministrado de 23 a 25 de Julho de 2000, em Vitória, ES. Promovido pela Eletrônica Selenium.

    CALADO, Carlos. A divina comédia dos Mutantes. Rio de Janeiro: Ed. 34, 1995. 360 p.

    ______. Mutantes: pop aliens in the land of samba! IN: Os Mutantes. Everything is possible: The best of Os Mutantes! (cidade?): Luaka Bop, Inc. (licenciado pela Universal Music Brasil), 1999. CD. (? min.). Ensaio sobre Os Mutantes contido no encarte do CD.

    CYSNE, Luiz Fernando O. Áudio: engenharia e sistemas. 2. ed. Rio de Janeiro: H. Sheldom, 1992. 220 p.

    DICKASON, Vance. Caixas acústicas e alto-falantes: um guia prático e seguro para construção de caixas acústicas de alta qualidade. Trad. Homero Sette Silva. Rio de Janeiro: H. Sheldom Serv. Marketing, 1992. 148 p.

    Dolby laboratories. Overview of Dolby technologies. s.d. Disponível em http://www.dolby. com/company/is.ot.0011.TecchOverview.html Acesso em: 02 fev. 2002.

    Eq Magazine, CD Rom, 1998. (coletânea de artigos publicados na revista, em diversas edições distribuído como brinde aos assinantes; ver inform. em http://www.eqmag.com ).

    EVEREST, F. Alton. Psychoacustics. In: BALLOU, Glen (Org). Handbook for Sound Enginners: The new audio Cyclopedia. Carmel (IN): Howard W. Sams & Company, 1991. 1506 p.

    Enciclopaedia Brittanica.[CD-ROM]. Londres: Enciclopaedia Brittanica, [2000]. 3 CD-ROM; Kit multimídia, placa de som.

    Enciclopédia Barsa. [CD-ROM]. São Paulo: Enciclopédia Britânica, [2000]. 2 CD-ROM; Kit multimídia, placa de som.

    GIDDINGS, Philip. Audio Systems: design and instalation. Carmel (IN): Howard W. Sams & Company, 1990. 574 p.

    Harris Technologies. Bassbox 6.exe [CD-ROM]. 6.0.1.4 Pro. Aplicativo para desenvolvimento e ensaio de desempenho de caixas acústicas. Edwardsburg (MI): Harristech, 2001. Especificações de sistema: PC com processador Pentium ou equivalente e um mínimo de 16 MB de Ram, 35 Mb de espaço livre e, disco rígido e drive de CD compatível com CD-R; Fontes true type Arial e Symbol devem estar instaladas. Windows 95, 98 ou 2000 e Windows NT 4

    HUBER, David Miles. Microphone Manual: Design and application. Boston (MA): Focal Press, 1988. 298 p.

    MATRAS, Jean-Jacques. O som. Trad. Edison Darci Heldt. São Paulo: Martins Fontes, 1991.

    NEVE, Rupert. Rupert Neve: na AES 1994 a oportunidade de uma entrevista inesquecível. Música & tecnologia, Rio de Janeiro, ano 7, n. 49, p. 22-28, jan./fev. 1995. Entrevista concedida à Sólon do Valle.

    NISBETT, Alec. The technique of the sound studio: for radio, television and film. Londres: Focal Press, 1974. 560 p.

    NÖTH, Winfried. Panorama da Semiótica: de platão a Peirce. São Paulo, Anna Blume (E;3), 1995. 141 p.

    Os Mutantes. Everything is possible: The best of Os Mutantes! (cidade?): Luaka Bop, Inc. (licenciado pela Universal Music Brasil), 1999. CD. (? min.). Compilação feita por David Byrne e Béco Dranoff. Contém encarte com letras traduzidas para o inglês e ensaio de Carlos Calado.

    Paralamas do sucesso. Vamo batê lata. São Paulo: EMI, 1995. CD. (? min.)

    PEDRUZZI, Carlos Roberto. A história do áudio. Música & Tecnologia, Rio de Janeiro, ano VIII, n. 54, p. 10-18, (mês?). 1995.

    PEIRCE, Charles S. Semiótica e filosofia. Trad. Octanny S. da Motta e Leonidas Hegenberg. São Paulo, Cultrix, 1972.

    ______. Semiótica. Trad. J. Teixeira Coelho. São Paulo: Perspectiva, (estudos, 46) 1977.

    ______. The collected papers of Charles Sanders Peirce. [CD-ROM] Databases, Intelex Corporation. 1992. (aqui referidos como CP, n. do volume, n. do parágrafo, por ex.: CP 8.297 significa volume 8, parágrafo 297)

    PINTO, Júlio. 1, 2, 3 da Semiótica. Belo Horizonte: Editora UFMG, 1995. 70 p.

    PLAZA, Júlio. Tradução intersemiótica. São Paulo: Perspectiva (estudos 94); (Brasília): CNPq, 1987.

    RAMONE, Phil. Biography of Phil Ramone. Disponível em http://www.philramone. com/ Acesso: 14 dez. 2001.

    SANDY, ?. Não sou santinha. Isto é, São Paulo, n. 1641, p.11, 14 mar. 2001. Não sou santinha. Entrevista a Clarissa Meireles e Sara Duarte.

    SANTAELLA, Lúcia. A assinatura das coisas: Peirce e a literatura. Rio de Janeiro: Imago, 1992.

    ______, Lúcia. A percepção: uma teoria semiótica. 2 ed. . São Paulo: Experimento, 1998. 154 p.

    ______. Teoria geral dos signos: como as linguagens significam as coisas. São Paulo: Editora Pioneira, 2000. 154 p.

    ______. Comunicação e Pesquisa. São Paulo: Hacker Editores, 2001a. 216 p.

    ______. Matrizes da linguagem e pensamento: Sonora, visual, verbal. São Paulo: Iluminuras, 2001b. 432 p.

    SACD (Superáudio CD). Disponível em http://towermusic.endeca.com/towermusic?n=39196...;sid=3C5BD0D38262 Acesso em: 20 dez. 2001.

    SILVA, Homero Sette. Análise e síntese de alto falantes e caixas acústicas pelo método T-S. Rio de Janeiro: H. Sheldom Serviços de Marketing, 1996.

    SINATRA, Frank. Duets. Disponível em http://www.towerrecords.com/product.asp?pfid=1465534#notes_reviews) Acessado em 06 dez. 2001.

    SINATRA, Frank. Duets II. Disponível em http://www.towerrecords.com/product.asp?pfid=1465534#notes_reviews) Acessado em 06 dez. 2001.

    Terremoto. Direção: Mark Robson. Produção: ?. Intérpretes: Charlton Heston; Ava Gardner; Victoria Principal[S.I.]: ?, 1974. 1 filme (? min.). Tower records. Disponível em http://www.towerrecords.com acesso em 27 nov. 2001.

    VALLE, Sólon do. AES – 110ª convenção: Os muitos canais de Amsterdã. Aúdio, Música & tecnologia, Rio de janeiro, ano 8, n. 119, p. 58-72, agosto. 2001.

    VALLE, Sólon do. Microfones: teoria e aplicação. Rio de Janeiro: Música & Tecnologia, 1997. 80 p.

    VALLE, Sólon do. Transistor x válvula: quem tem razão? Música & Tecnologia, Rio de Janeiro, ano 6, n. 46, p. 8-15, jul./ago. 1994.

    VASSALO, Francisco Ruiz. Manual de caixas acústicas e altofalantes: Teoria, funcionamento, exemplos práticos para profissionais e amadores. Trad. de Joshuah de Bragança Soares. São Paulo: Hemus, 1980. 166 p.


VIII. Apêndice

(Citações e/ou referências indicadas nos verbetes abaixo, encontram-se na seção referências, que é única para todo este trabalho)

  1. TRANSDUTORES, TRANSDUÇÃO

    Em física, transdução é a capacidade de um dispositivo qualquer de transformar uma forma de energia em outra. Especificamente em áudio e música, transdutores são dispositivos que convertem energia acústica em elétrica como os microfones ou, elétrica em acústica, como as caixas acústicas. Entretanto, as caixas não são efetivamente os transdutores, mas sim os seus componentes, altofalantes específicos para graves, médios e agudos.

    Genericamente falando é mais apropriado referir-se à caixa acústica pela denominação de sonofletores, abrangendo todos os tipos.

  2. ALTA-FIDELIDADE, HIGH-FIDELITY, HI-FI

    Denominação usual para a obtenção de uma reprodução sonora muito fiel ao fenômeno sonoro original, que implica na existência de um compromisso entre estúdios de gravação, músicos e técnicos, com o objetivo de se captar e registrar o mais fielmente possível um evento sonoro, e dos audiófilos para com estes, preocupando-se em se acercar das melhores alternativas de equipamentos e transdutores, de modo a permitir, durante a reprodução de um evento gravado, uma similaridade muito grande com o evento sonoro original.

    Neste meu trabalho, questiono exatamente esta possibilidade de reprodução fiel, uma vez que o fenômeno para ser captado, registrado e por fim reproduzido, passa por uma cadeia de transduções intermediárias. Contudo não posso deixar de me referir à ela por esta denominação, caso contrário deveria propor uma outra, o que não vem ao caso no momento.

  3. HIGH-FIDELITY, ORIGEM DA EXPRESSÃO

    De acordo com a Enciclopédia Britânica (2000, CDROM) "... No campo da música popular especialmente, muitos artistas não podem competir, nas aparições ao vivo, com gravações nas quais eles dependem maciçamente de auxílio tecnológico. Há alguns que sentem que que a gravação fonográfica pode causar o fim das performances na sala de concertos, a qual, se sobreviver, o será mais por razões sociais do que musicais. Uma possível indicação desta tendência é o desaparecimento de revistas de música clássica não-profissionais, não-acadêmicas e independentes, na América: ao contrário, existem agora revistas que se referem à obras gravadas. Seus nomes são significativos: The American Record Guide, fundada em 1935, inicialmente como American Music Lover; High Fidelity, fundada em 1951; e Stereo Review, fundada em 1958, inicialmente como Hi Fi/Music Review. A revista dedicada às gravações, não é um fenômeno peculiarmente americano; A Inglaterra teve The Gramophone and Records and Recording; França, Diapason and Harmonie; Alemanha, HiFi Stereophonie e Fono Forum; Italy, Discoteca Hi Fi; Holanda, Luister; Belgica, Hi-Fi Musique; Suécia, Musikrevy; e Japão, Record Art/Record Geijutsu, entre muitas outras publicações periódicas. (2000, Enciclopédia Britânica, CD-ROM, trad. nossa)

  4. ALTO-FALANTES

    Segundo Homero Sette Silva "Desde a concessão da primeira patente, em 20 de janeiro de 1874, à E.W. Siemens (fundador de Siemens & Halske, na Alemanha), referente a um dispositivo idêntico ao alto falante eletrodinâmico (bobina móvel), mas usado como atuador mecãnico (relé), passando pela primeira patente do altofalante e, 1898, em nome de Sir Oliver Lodge, os princípios básicos deste transdutor mantiveram-se praticamente os mesmos. Mudaram apenas os materiais e os processos de fabricação e, mais recentemente com a teoria de Thiele e Small, a metodologia empregada na análise e síntese dos sistemas eletroacústicos" (Silva, 1996, p. 1.1).

    Às vezes grafado erroneamente como
    alto-falantes, são os componentes elementares de toda e quaisquer caixas acústicas, os transdutores propriamente ditos. É uma tradução literal do inglês loudspeakers equivalendo portanto à alto-falantes. São classificados de acordo com modo pelo qual transformam energia elétrica em acústica, sendo os do tipo dinâmicos, os mais comumente utilizados e, de acordo com a sua faixa de reprodução de freqüências. Woofers são alto-falantes destinados à reprodução de sons graves; midrangers, sons médios; tweeters, sons agudos. Drivers de compressão, são alto-falantes destinados à reprodução de sons médios e agudos, que precisam ser acoplados à cornetas projetoras, o que aumenta o seu rendimento em mais de 4 vezes. Não existe um só tipo que seja igualmente eficiente para reproduzir graves profundos e ao mesmo tempo, agudos cristalinos. Por isso mesmo toda caixa acústica contém uma combinação de dois ou mais, para reproduzir o espectro de áudio, conforme os objetivos de projeto. Existem no mercado alternativas de transdutores denominados "full range" (o que na tradução literal, equivale a Alto-falantes de amplo espectro) destinados à reproduzir uma parte significativa do espectro de freqüências de áudio (20 a 20.000 hz), entretanto o fazem com alguma perda de parte do espectro, o que, conforme a aplicação a que se destina, é plenamente aceitável.

  5. CAPTAÇÃO ELETROACÚSTICA, ELETROMAGNÉTICA, PIEZOELÉTRICA

    Em áudio captação é uma definição mais específica do que transdução, contudo, sem deixar de sê-la, genericamente falando. Transdução descreve uma possibilidade, segundo as leis da física, independentemente de sua ocorrência. Captação implica na existência de um fenômeno físico realmente ocorrido, que por isso mesmo, pode ser detectado e capturado, para produzir alguma reação, sendo usualmente, a conversão de uma forma de energia em outra, a reação mais esperada.

    Em áudio e música as formas de captação mais difundidas e utilizadas, são a eletroacústica, referindo-se à captação com o uso de microfones; eletromagnética, referindo-se à captação de instrumentos musicais através de captadores que se utilizam das propriedades de indução eletromagnéticas, como por ex.: guitarras, contrabaixos e alguns modelos de pianos elétricos; Piezoelétricas, referindo-se à conversão de vibrações mecânicas em energia acústica, de que se utilizam alguns captadores específicos para violões e violinos.

  6. GRAVAÇÃO ANALÓGICA E LINEAR, DIGITAL E LINEAR, DIGITAL NÃO-LINEAR

    A definição de gravação com que trabalhamos não limita-se à gravação sonora em suporte magnético. Gravação aqui é considerada de modo mais abrangente, é qualquer tipo de armazenamento de um sinal de áudio captado, em um suporte. A classificação que utilizamos foi elaborada para os propósitos deste trabalho.

    Gravação analógica e linear refere-se geralmente à gravações em fita magnética, na qual o sinal de áudio captado e pré-amplificado, é modulado por uma corrente de polarização denominada bias, e através de um cabeçote de gravação em contato com a fita em movimento, transfere para as partículas magnetizáveis, dispostas num suporte, que assim irão ficar magnetizadas, representando o sinal de áudio, de modo análogo (similar) em suas características de intensidade e freqüências. Diz-se linear ou não-linear em relação à forma de acesso aos trechos gravados. Numa gravação linear, para se ter acesso a um trecho gravado é preciso "correr" a fita, avançando ou retrocedendo. Numa gravação não-linear, é possível se ter acesso instantâneo a qualquer trecho da gravação. Na gravação analógica há o inconveniente do ruído da fita (tape hiss), que surge pelo atrito da fita contra os cabeçotes de gravação e de reprodução, que se converte em sinal de áudio, misturando-se portanto ao sinal de áudio, que está sendo gravado ou reproduzido. São desse tipo os gravadores de fita cassete, de rolo estéreo, rolo estéreo pista cheia (full track) e, de rolo multipistas.

    Gravação digital linear refere-se à gravações, cuja representação do sinal de áudio, se dá por uma codificação em linguagem binária, através de conversores AD/DA (analog to digital/ digital to analog). Uma vez que o sinal de áudio é convertido para um código binário (bits e bytes), é este código que é armazenado pelas partículas da fita magnética, eliminando-se assim o tape hiss.

    Gravação digital não-linear refere-se à gravações digitais, onde o sinal de áudio é representado por um código binário, em qualquer suporte que permita acesso instantâneo à qualquer trecho gravado. Usualmente é associado à gravação em disco rígido dos computadores, mas este atualmente, não é o único suporte que permite acesso não-linear. Existem ainda MD-data, CDRW (CDs regraváveis em gravadores de CD), Zip disks (em zipdrives), Jaz disks (em Jazdrives), Syquest disks (em drives Syquest).

    É bom ressaltar que o mero uso do termo digital não define a qualidade de uma gravação. No nosso dia-a-dia encontramos um sem número de mensagens comerciais e até mesmo artigos em revistas e jornais, que simplificadamente, associam tudo o que é digital à melhor qualidade, seja de imagem, de som, etc. Não é bem assim. Uma gravação mesmo digital, pode ser ruidosa e indefinida. A representação do sinal de áudio com maior ou menor aproximação, depende de dois parâmetros: resolução em bits e amostragem (sample rate). Mesmo a gravação sendo digital, ainda é linear porque o acesso aos trechos gravados não é instantâneo, ainda depende de avançar ou retroceder a fita. Veja também Sample rate e resolução, item 08, neste apêndice.

  7. HERTZ, FREQÜÊNCIA

    Unidade de medida a exemplo de metros, polegadas, litros, para quantificar a ocorrência de ciclos de onda ocorridos num período de um segundo. É aplicável à qualquer sistema ondulatório, desde ondas de áudio até ondas eletromagnéticas, estendendo-se ao comportamento dos processadores de computadores, quanto à sua capacidade de processar informações no período de um segundo, como aparecem nas designações de modelos e marcas, por ex. Pentium 900 MHz. Quando se diz em áudio, que um dado som tem uma freqüência de 100 Hz, significa que este som possui 100 ciclos por segundo.

    As expressões Kilo, Mega e Giga, correspondem respectivamente, à multiplicação dos ciclos, por 1.000, 1.000.000, 1.000.000.000. Trata-se apenas de um modo matemático mais simples de descrever números elevados, encurtando o texto. Por exemplo é mais fácil falar 1 tonelada, do que 1 milhão de gramas! De modo análogo em áudio, é mais fácil se referir a um som de 10.000 Hz, como 10 Kilohertz ou 10 K.

    A palavra Hertz foi atribuída em homenagem ao físico alemão de Rudolf Heinrich Hertz (1857-1894), que contribuiu para o aprimoramento das técnicas de radiotransmissão, com seus estudos sobre as ondas eletromagnéticas (Barsa, 2000, CD-ROM). Ver também item 19 neste apêndice.

  8. SAMPLE RATE E RESOLUÇÃO

    Dois principais parâmetros que definem a maior ou menor qualidade da representação do sinal de áudio para gravações digitais. A unidade de medida de resolução é o número de bits (8, 16, 20, 24, etc.) e a de amostragem (sample rate) é o Hz. Por exemplo os CDs de áudio possuem resolução de 16 bit e amostragem de 44.100 Hz.

    Quanto maior a resolução em bits, melhor será a faixa dinâmica, diz-se usualmente que a cada mais um bit, amplia-se a faixa dinâmica em + 6 dB. E quanto maior a faixa dinâmica, melhor será a relação sinal vs. ruído. Já amostragem diz respeito à quantidade de frações, em que será dividido 1 Segundo do sinal de áudio, para ser então representado. No caso do CD, 1 segundo de áudio é composto de 44.100 partes ou frações, ou ainda 44.1 kHz. A amostragem utilizada numa representação, também determina a freqüência mais alta que poderá ser representada. Continuando no exemplo do CD, numa amostragem de 44.1 kHz, a freqüência mais alta será a de 22.050 Hz.

    Uma gravação, mesmo digital, pode ser ruidosa e seu conteúdo em freqüências limitado, como por ex. uma gravação com resolução de 8 bits e 11 kHz de amostragem. O resultado sonoro é parecido com qualquer gravação realizada nestes gravadores portáteis para entrevistas, ruidoso e "abafado", sem "brilho", o que significa que é pobre em altas freqüências.

    Um bom exemplo de como operam em conjunto estes dois parâmetros, me foi dado em sala de aula por uma aluna, em Produção publicitária em rádio, que descrevo a seguir:

    Imagine que um rapaz muito bonito, simpático e atraente passa perto de duas mulheres, que o observam. Ele no caso, corresponde ao evento sonoro que terá que ser representado. A opinião da primeira observadora, corresponde à uma baixa resolução com baixa taxa de amostragem. Com base na sua formação cultural, grau de educação, nos seus gostos, idade, etc. simplesmente a olha rapidamente e conclui, "muito feio, mal vestido, e com cara de 'galinha' (mulherengo)". O tempo muito curto com que esta observadora o analisou equivale à amostragem, ou seja o que foi possível perceber no curto espaço de tempo. O repertório muito pequeno de adjetivos para caracterizar o que ela viu, equivale à resolução.

    Então sua opinião decorreu da resolução e da amostragem. Já a Segunda observadora, que corresponde à uma resolução e amostragem mais altas, se demora um pouco mais no olhar, e o "escaneia" demorada e minuciosamente. Sua descrição dele é mais detalhada: "não muito bonito, mas simpático, corpo 'sarado', alto, calça não combina com a camisa, jeito esquisito de andar, parece ser tímido, deve ser um 'mauricinho', mas pelo modo de se vestir quer disfarçar. Pela chave na mão, tem carro...

    Bom, para não tirar a graça do exemplo em aula, disseram que a primeira só podia ser uma loura!

    Note que observação mais detalhada permite uma análise mais minuciosa e, pela sua formação e interesses mais específicos a observadora 2, também dispunha de mais adjetivos para caracterizar o que viu. Assim resolução e taxa de amostragem, operam juntas para representar o evento sonoro e então codificá-lo. De onde se conclui que resolução baixa e amostragem alta ou o contrário, não permitem representar detalhadamente o objeto, que no caso é o rapaz, correspondendo ao evento sonoro.

  9. COEFICIENTE DE ABSORÇÃO

    Valor numérico, atribuído à capacidade de cada tipo de material, de absorver as ondas sonoras, diminuindo a sua reflexão. Quanto menor o valor, menos absorvente é o material; quanto maior, mais absorvente. Estes coeficientes são medidos em condições apropriadas e, apresentados para certas freqüências mais interessantes na correção com tratamento acústico, que são usualmente 125, 250, 500, 1.000, 2.000 e 4.000 Hz. Por ex.: um tapete de 5mm sobre base de feltro de 5 mm, possui um coeficiente de absorção de 0.07, 0.21, 0.57, 0.68, 0.81 e 0.72, (Azevedo, 1994, p. 26) respectivamente para as freqüências citadas. Isto significa que este material possui propriedades absorventes que variam conforme a freqüência. Estes números por sua vez podem ser entendidos como percentagens. Um coeficiente de 0.07 por ex.: equivale a 7% de absorção deste material na freqüência de 125 hz. Estes coeficientes são utilizados para o cálculo do tempo de reverberação (RT60) de um ambiente, e também para verificar o comportamento deste (se aumenta ou diminui e, quanto) conforme são adicionados materiais absorventes nas superfícies da sala.

  10. HARMÔNICOS OU HARMÔNICAS

    Segundo Vassalo " por harmônicas de um som de uma freqüência determinada (que se denomina fundamental) se entendem as ondas que a acompanham e cujas freqüências são múltiplos da fundamental" (1980, p. 30). O que ele quer dizer com múltiplos é que são sons cuja freqüência é igual a 2, 3, 4... vezes seu valor. Todas as notas musicais são sons de freqüências conhecidas. Por ex.: a 6ª corda do violão (de baixo para cima) possui uma freqüência de 82,407 Hz ou ciclos por segundo (Ballou, 1991, p. 1432). Esta freqüência corresponde ao seu tom fundamental. Quando um músico, de ouvido treinado, reconhece que esta corda está desafinada, é porque o número de vezes em que está vibrando, é maior ou menor do que este. A nota que esta corda produz, quando Tocada, corresponde à segunda nota mi de um piano com 7 oitavas. A mesma nota mi quando tocada num piano e num violão, soa diferente por causa do timbre e do envelope ou A.D.S.R. (ver item 12 neste apêndice).O timbre " é determinado pelo número e intensidade de harmônicas que acompanham um som fundamental emitido,..." (Vassalo ibid.: 30). Na natureza não encontramos sons puros, sem harmônicos, estes "são sempre acompanhados de um certo número de harmônicas" (Vassalo ibid.: 30). É este certo número de harmônicos, de intensidades diferentes, somados ao tom fundamental, que dá a característica sonora de uma mesma nota em cada instrumento que é produzida.

  11. GRAVAÇÃO MULTIPISTAS (MULTITRACK RECORDING)

    Mais do que um modelo e/ou marca de equipamento é um conceito de gravação, segundo o qual se pode gravar vários programas de áudio em pistas separadas, em perfeito sincronismo, preservando-se o acesso individualizado à cada uma delas. A gravação multipistas foi inventada em fins da década de década de 50, não encontrei referências sobre o seu inventor, há indícios (informação não confirmada) de que pode ter sido Léo Fender, o mesmo criador das guitarras e amplificadores Fender, muito utilizados no estilo musical emergente na época, o rock'n'roll. Segundo Baptista (1981, p. 80) Foi o guitarrista Les Paul quem trabalhou juntamente com um grande fabricante norte americano, para desenvolver o primeiro gravador de oito canais em fita de 1 polegada. Continua Baptista: " Os Beatles usaram gravadores de 4 pistas para criar seus álbuns antigos. Com Sgt. Pepper, estava demonstrado ser o processo de multipistas a 'única´ maneira de se fazer gravações sérias dali em diante. O termo multipistas ou multitrack, é um acrônimo de multiple-track (recording) e consiste na possibilidade de se gravar um ou vários canais, enquanto de escutam outros, já gravados, simultaneamente.

    Como se trata mais de um conceito do que um equipamento específico, não importa se a gravação é do tipo analógica e linear, digital e linear ou digital não-linear, todos os tipos de gravação podem existir na modalidade multipistas, como de fato existem.

    O advento da gravação multipistas mudou definitivamente o modo de se gravar música. A dificuldade existente até então era conseguir equilíbrio entre os diversos instrumentos, ou proeminência de alguns (nos momentos de solo) na gravação feita de uma só tomada. Com a gravação multipistas, a preocupação inicial era gravar adequadamente, para só depois remixar, quando então alguns canais teriam seu nível aumentado, para destacar instrumentos ou vozes, conforme os propósitos do produtor.

    Na gravação em uma só tomada também havia um problema. Um pequeno erro de execução, de um único músico, obrigava a repetição de toda uma sessão, na mesma música. Na gravação multipistas, ao contrário, diversos intrumentos ou grupo deles, já eram gravados em canais separados o que, por ocasião de um erro de execução de um músico, permitia a regravação deste isoladamente, mantendo o conteúdo já gravado nas outras pistas.

    As possibilidades trazidas pela gravação multipistas criaram situações inusitadas, onde um músico pode gravar uma obra, executando todos os instrumentos, ou até mesmo, cantar ou tocar ao lado de um artista já falecido. No âmbito internacional podemos citar a gravação de Nathalie Cole, com Nat King Cole, falecido décadas antes. No Brasil, vimos clássicos de Elis Regina, relançados após sua morte, com sua voz e vários instrumentos regravados, graças à gravação multipistas.

  12. A.D.S.R (ATTACK, DECAY, SUSTAIN E RELEASE)

    É o envelope, segundo o qual é produzida qualquer nota, ou conjunto delas, num instrumento. Pode ser traduzido adequadamente para o português como sendo ataque ou início; decaimento; prolongamento ou sustentação; e encerramento ou finalização. O envelope descreve as características da ocorrência de um dado som, tanto no tom fundamental como nos harmônicos. Para facilitar o entendimento e, de modo bem simplificado, podemos comparar um som qualquer, que nos chega aos ouvidos, com a imagem de um objeto qualquer, que se apresenta aos nossos olhos. Num objeto vemos as características de tamanho, volume físico, formato, bordas, independente das cores. Isso no som, equivale ao envelope. As cores que enxergamos nos objetos, são radiações de luz, cujos comprimentos de onda são conhecidos. Então as cores, o brilho ou a opacidade, equivalem no som, às notas e harmônicos.

    O timbre e o envelope, somados, de uma nota musical, nos permite identificar se esta nota foi tocada num violino, piano, flauta, etc.

  13. SUBGRAVES, SUBWOOFERS

    A rigor, sons subgraves são aqueles cuja freqüência fundamental se situa abaixo do limiar inferior do espectro audível, no caso 20 Hz. Na natureza encontramos diversos sons cuja freqüência é menor do que 20 Hz. Nos instrumentos musicais, segundo Ballou (1991, p. 1432), o único instrumento que produz notas com tons fundamentais abaixo de 20Hz é o órgão e, muito provavelmente aqueles de tubos ressoadores. Subwoofers é a denominação das caixas acústicas especializadas na reprodução de sons subgraves.

    Há muita confusão e equívocos a respeito do que vem a ser sons subgraves e subwoofers, muito provavelmente pelas denominações comerciais, que muitos fabricantes adotaram e adotam, para designar as caixas de graves dos sistemas que desenvolvem e comercializam. Ser ou não uma caixa de subgraves, depende da faixa de frequências de graves que ela é capaz de reforçar. Quanto mais baixas freqüências ela reproduzir, mais ela estará adequada à denominação de subwoofers. Contudo, no mercado de sistemas de som para "alta-fidelidade" encontramos muitas marcas e modelos que reproduzem principalmente freqüências graves facilmente audíveis, estas certamente não se encaixam numa definição rigorosa de subwoofers. Mas, que freqüências deve reproduzir ou reforçar prioritariamente uma caixa para receber esta denominação? Esta é uma questão sobre a qual muitos autores divergem. Também não é o momento nem o foro apropriado de propor uma classificação. Mas podemos ter pistas genéricas desta resposta, se considerarmos que as caixas mais comprovadamente eficientes para reproduzir subgraves, são aquelas cuja resposta mais proeminente em freqüências, está limitada à uma oitava, como as do tipo bandpass, linha de transmissão ou air couplers, entre outras. Se tomarmos como base o limiar do espectro audível e considerando o alcance de uma oitava, chegaremos à resposta em freqüências entre 20 e 40 Hz. Então genericamente falando, qualquer caixa, cuja resposta em freqüências esteja num alcance parecido, como por ex.: 16 a 40 Hz, 25 a 50 Hz, 16 a 32 Hz poderá ser denominada como subwoofer.

  14. PARÂMETROS THIELE & SMALL

    É um conjunto de informações numéricas, obtidas pelo método de A. Neville Thiele, mais tarde ampliado por Richard Small, que representam as características mecânicas e elétricas de um dado alto-falante e/ou caixa acústica.

    Em março de 1961, o engenheiro Australiano A. Neville Thiele apresentou um trabalho denominado Loudspeakers in vented boxes (alto-falantes em caixas do tipo vented), na Radio and Eletronic Engineering Convention em Sidney, Austrália. O trabalho apresentava respostas claras para questões até então bastante obscuras, no projeto de caixas acústicas do tipo refletora de graves (bass reflex). Ninguém havia respondido até então, de forma clara e objetiva, à questões cruciais como volume ideal da caixa, melhor sintonia do duto, valor ideal para impedância de saída do amplificador. Thiele respondeu à estas e a muitas outras questões. Seu método veio mais tarde a ser ampliado por Richard H. Small, na sua tese de doutoramento, e amplamente disseminado graças à proliferação dos computadores pessoais (Silva, 1996). As informações obtidas com este método são conhecidas hoje como parâmetros Thiele & Small.

    Podemos afirmar sem sombra de dúvida que o processo de desenvolvimento e fabricação de alto-falantes e caixas acústicas, em todo o mundo, mudou significativamente a partir da disseminação do trabalho de A. N. Thiele e R. H. Small, a ponto de podermos separá-los em dois momentos: Antes dos parâmetros T&S e, após. Hoje em dia, todos os aplicativos importantes para desenvolvimento de caixas acústicas e ensaio de desempenho, incorporam os parâmetros T&S. A maioria dos fabricantes importantes divulgam os parâmetros Thielle & Small de seus produtos.

    Usando estes aplicativos, mesmo sem estarmos com o alto-falante nas mãos e, podemos simular seu desempenho em vários tipos de caixas, sem mesmo construí-las, desse modo é possível escolher um tipo de caixa, a melhor sintonia (se for o caso), conhecendo a priori, como será o comportamento do alto-falante na caixa, que eficiência terá, qual será a resposta em freqüências do conjunto, qual a potência máxima admissível, entre diversas outras informações.

    O fato de se poder projetar caixas assim, coloca em igualdades de condições, projetistas e grandes fabricantes, de qualquer parte do mundo. Antes disso, desenvolver projetos eficientes e confiáveis, somente era possível a quem dispusesse de recursos financeiros para adquirir os inúmeros e sofisticados equipamentos de medição, para adquirir e adequar o necessário espaço físico, para contratar pessoal treinado e, para manter uma política de suporte à pesquisa e desenvolvimento. Veja também Itens 20 e 21, respectivamente, Paulo Fernando C. Albuquerque e Homero Sette Silva.

  15. CLÁUDIO CESAR DIAS BAPTISTA

    Se na música pop brasileira o grupo Os Mutantes é considerado pioneiro, inovador, transgressor e questionador dos padrões estéticos musicais da época, Cláudio Cesar Dias Baptista ou, como se auto denomina comercial e profissionalmente CCDB, por sua vez merece reconhecimento semelhante na curta história do áudio no Brasil, especificamente em sonorização profissional. Cláudio Cesar foi por vários anos o técnico de som da banda. Mas não satisfeito em apenas operar os equipamentos, ele desenvolveu e construiu boa parte das caixas acústicas, amplificadores e mesas de som que a banda utilizava, além de guitarras e contrabaixos e o inusitado theremin, um instrumento de origem russa. Também desenvolveu pedais distorcedores para guitarra, o primeiro vocoder brasileiro e o primeiro sintetizador para guitarra, utilizado até hoje por Sérgio Dias. O som de Os Mutantes nos shows era considerado por muitos como de alto volume (intensidade) e sofisticado e muito de deve ao Cláudio Cesar, porque como a importação de equipamentos era quase nula na época, muito tinha que ser inventado e fabricado aqui. A formação mais conhecida dos Mutantes é Sérgio Baptista, Arnaldo Baptista e Rita Lee como núcleo, ao redor dos quais transitaram diversos músicos, na suas diversas formações. Entretanto, Cláudio Cesar foi freqüentemente reconhecido e citado, em diversas entrevistas e reportagens, como o Quarto mutante, como na passagem do ensaio de Carlos Calado reproduzido no encarte do primeiro álbum (CD) dos Mutantes, lançado em âmbito internacional, resultante de uma compilação feita por David Byrne e Béco Dranoff, lançado em 1999:

    Desde seu primeiro álbum, Os Mutantes
    apresentavam um uma sonoridade vanguardista em
    relação às bandas naquele período devido aos
    instrumentos e efeitos eletrônicos Criados por Cláudio
    César, o mais velho dos irmãos Baptista. A guitarra
    empresta algo estranho, como cores distorcidas à
    percussiva "Bat Macumba", bem como no samba-rock "A
    Minha Menina" graças às invenções e experimentos do "
    quarto Mutante" (como ele foi algumas vezes chamado).
    Estranho mesmo é o efeito usado na soturna "Dia
    36", do segundo álbum da banda Mutantes gravado em
    fins de 68. Cláudio Cesar inverteu o som de um pedal
    wah-wah popularizado por Jimi Hendrix para criar o
    bizarro "wooh-Whooh" (sic) pedal. Com esse recurso a
    guitarra do Sérgio soou como se estivesse prestes a
    vomitar. ... (Calado, encarte do CD, Universal Music,
    1999, p.17)

    A biografia de Cláudio Cesar, tal como apresentada nos folhetos "história de uma Marca I e II" editados por ele mesmo, ocupam mais de cerca de 180 páginas em formato A5, o que não é possível reproduzir aqui. Ele publicou mais de 700 páginas de artigos sobre áudio em sonorização, na extinta revista Nova Eletrônica entre 1977 e 1984. Criou e colocou em domínio público o projeto de uma caixa cornetada de médios-graves, denominada por ele como Novacaixa, que veio a ser considerada, por muitos técnicos e proprietários de empresas de sonorização, como uma das melhores caixa de médios-graves já projetada e, sem dúvida a mais utilizada. O projeto foi inspirado num projeto da JBL (E.U.A.) conhecido como mod. 4560, para graves. Considerando a baixa eficiência – na época – dos Alto-falantes de médios-graves no Brasil, ele projetou uma caixa-corneta, para dois Alto-falantes de 12". Mas não é só isso, o primeiro livro, sobre gravação profissional editado no Brasil, é de sua autoria e ele produziu diversos equipamentos sob a marca CCDB que comercializou através de mala direta por todo o país. Ele dava um atendimento muito especial aos clientes. Para cada aparelho vendido era dado um treinamento personalizado ao cliente, no seu laboratório e gravado em fita cassete. Respondia diariamente dezenas de cartas assessorando gratuitamente, técnicos de bandas, audiófilos, empresas de sonorização.

  16. DECIBEL

    É a unidade de medida para Nível de Intensidade Sonora ou N.I.S. equivalente ao termo em inglês SPL (Sound Pressure Level) – aquilo que erroneamente chamamos de volume, no nosso dia-a-dia – e também níveis elétricos especialmente de sinais de áudio. O Decibel equivale a um décimo de 1 Bel, que se mostrou uma unidade de medida muito grande para registrar pequenas variações de intensidade sonora, já que 1 bel é igual a 10 decibéis. O termo bel e consequentemente decibel, foi adotado em homenagem ao seu criador Alexander Graham Bell, o inventor do telefone, entre outros.

    O decibel é utilizado para expressar tanto grandezas elétricas como acústicas. Em se tratando destas últimas, e por ser uma escala logarítmica, a intensidade de sonora dobra a cada 3 dB, assim um dado som com 83 decibéis, tem o dobro do volume, de um outro com 80 dB. Um determinado som com 86 dB tem 4 vezes mais volume que um de 80 dB e a metade do volume de um de 89 dB. Há que se considerar ainda, as curvas de ponderação A e C. De acordo com a ponderação "A" a intensidade sonora medida está contida na faixa de 500 a 10.000 Hz e é a que melhor expressa a curva de audibilidade do ouvido humano, sendo mais utilizada para aferir ruídos ambientais, poluição sonora, condições de risco trabalhista, etc.. A ponderação "C" está contida na faixa de 32 a 10.000 Hz e é a mais adequada para se aferir a resposta em freqüências de sistemas de som.

    Para expressar intensidades, sonoras já especificando a faixa de ponderação, usam-se as expressões dBA ou dBC. Mas intensidades sonoras, seja na ponderação "A" ou "C", têm sempre que ser expressas considerando a distância, uma vez decaem conforme nos afastamos da fonte sonora. Veja também neste apêndice 'Lei do inverso do quadrado'.

    Resumindo, intensidades sonoras expressas em debibéis, sem especificar a distância da fonte sonora e a faixa de ponderação, não significam nada. Essa é uma questão importante, que na maioria das vezes, é simplificada, omitida, ou relevada em artigos de revistas e jornais acerca de poluição sonora ou sobre a realização de concertos, que induz o leitor a conclusões equivocadas. Uma pequena caixa de som, com um alto-falante de 5" (sensibilidade de 90 dB@1m/1Watt) recebendo 70 watts, a 12,5 cm do ouvido atinge o limiar da dor, que é de 126 dB. Por outro lado, num concerto ao ar livre, a 30 metros, para se obter a mesma intensidade sonora são necessárias centenas de caixas acústicas, recebendo também centenas de watts, num total de potência aplicada que ultrapassa facilmente a casa dos 50.000 Watts.

  17. LEI DO INVERSO DO QUADRADO (INVERSE SQUARE LAW)

    Uma das leis da física, que descreve a regularidade do aumento ou redução das intensidades sonoras percebidas conforme se modifica a distância do ouvinte para a fonte sonora. Segundo ela, quando essa distância dobra o N.I.S. decai em 6 dB e, quando se reduz á metade, o N.I.S. aumenta em 6 dB, não importando se a ponderação é "A" ou "B".

    Então se num concerto ao ar livre, medimos a intensidade a 20 metros e encontramos 110 dBC, baseado na lei do inverso do quadrado, podemos dizer que a 10 m. o N.I.S. será de 116 dBC e, a 40 m. será de 104 dBC. Uma das aplicações interessantes da lei do inverso do quadrado em sonorização é o dimensionamento de um sistema de som (número de caixas e amplificadores, conforme a potência destes) para atender as necessidades de concertos ao ar livre, conforme o exemplo que se segue:

    A eficiência de alto-falantes e caixas acústicas é expressa como sensibilidade. Quanto maior esta for, maior será a eficiência dos transdutores na tarefa de transformar energia em som. A sensibilidade é aferida atualmente por duas metodologias principais e os resultados obtidos são diferentes. Pela metodologia mais usada (não estou julgando aqui, se é ou não, a melhor), em ambiente controlado, aplica-se ruído rosa (pink noise) geralmente filtrado – para extrair dele, apenas o conteúdo mais interessante em freqüências para o alto-falante em questão – com 1 watt de potência e, mede-se a 1 m. da caixa ou alto-falante, a intensidade sonora produzida. Ela é expressa em decibéis, ponderação "C" para 1 Watt de potência aplicado.

    Conhecendo a sensibilidade de um tipo de caixa e, tendo-se como objetivo um patamar de intensidade sonora, a ser alcançado para uma dada distância, por um concerto ao ar livre, podemos determinar quantas caixas serão necessárias e, qual potência deverá ser aplicada em cada uma, para que juntas produzam aquele patamar de intensidade sonora desejado para a distância estabelecida. Digamos que um evento precise de 105 a 110 dB a 32 metros. Uma empresa X candidata a sonorizar o evento, dispõe de caixas de graves (o cálculo é feito por cada via) com sensibilidade de 96 dB e potência máxima admissível de 600 W/RMS. Bom aí basta fazer uma tabela e ir escrevendo os valores. Se com 1 W, a 1 m., produz 96 dB; com 2 W, a 1 m., produzirá 99 dB. Sempre aumentando 3 dB a cada dobra de potência. Chegaremos a 124 dB com 512 W. Ainda não foi atingida a potência máxima, do altofalante que é de 600 W, mas paremos por aí, neste exemplo. Se a 1 m., com 512 W produzirá 124 dB, cada vez que nos afastarmos, para o dobro da distância, este valor cairá 6 dB. Então a 2 m. a intensidade sonora será de 118 dB; a 4 m. 112 dB e assim por diante... até chegarmos à distância de 32 metros, com 94 dB.

    Para atingirmos o patamar de 110 dB, será preciso ir dobrando a quantidade de caixas (recebendo a mesma potência), sendo que a cada dobra, a intensidade sonora se eleva em 3 dB. Então se para 1 caixa, com 512 W a 32 m., temos 94 dB; teremos 97 dB com 2 caixas; 100 com 4... até chegarmos ao número de 16 caixas produzindo 106 dB, ou ainda 32 caixas produzindo 109 dB, conforme a folga desejada. Determinado o número de caixas a ser utilizado, será possível saber quantos amplificadores serão necessários e, de que potência, para amplificar o total de caixas. O mesmo cálculo deve ser feito para cada uma das vias (médios-graves, médios, agudos) até se conseguir saber a quantidade de caixas, amplificadores e o custo necessário para montar um sistema desse porte.

  18. DOLBY LABORATORIES

    É inegável a contribuição da Dolby para a evolução dos sistemas de codificação e decodificação do som no cinema, a ponto de sua história coincidir com a do cinema em muitas ocasiões. E a exemplo de muitas outras coisas no nosso dia-a-dia, cuja marca comercial passa a se sinônimo de um produto, como Gillette, Bombril, etc., Dolby passou a ser sinônimo de som de cinema. Suas contribuições têm sido relevantes mas a Dolby não é a única fabricante de sistemas de codificação e decodificação de som para cinema.

    O que a Dolby desenvolve e fabrica não são equipamentos de gravação, mas processadores e/ou circuitos que têm o objetivo de reduzir o ruído de fundo e, outros que além disso, codificam o sinal de uma gravação final, geralmente em duas pistas, para que elas contenham informações de quatro ou mais canais, que uma vez decodificados, recriem a ambiência, ou permitam que efeitos sonoros dos filmes, sejam reproduzidos com maior realismo. Os processadores Dolby, como quaisquer outros, têm que ser utilizados tanto na codificação como na decodificação. A aplicação dos processadores Dolby não se restringe ao som de cinema. Muitos dos gravadores analógicos, especialmente os do tipo multipistas, incorporavam circuitos Dolby (sob licenciamento) para reduzir o ruído de fundo e ruído de fita (tape hiss). Há inclusive processadores desenvolvidos para gravadores cassete de uso doméstico e profissional.

    Com o advento da gravação digital e dos CDs, o ruído de fundo passou a não ser mais um problema, então a Dolby concentrou seus esforços no desenvolvimento do conceito de som envolvente ou circundante (surround), já razoavelmente maduro no cinema, aplicado aos sistemas domésticos.

    Veja também adiante item 18A, processamento Dolby.

  19. PROCESSAMENTO DOLBY

    Há uma quantidade razoável de artigos publicados em revistas especializadas sobre sistemas surround, especialmente sobre os da Dolby para uso doméstico. Neste momento devo registrar minha preocupação com o termo "domésticos". Por muitos anos ele foi usado pejorativamente para significar baixa qualidade, em oposição a profissional, alta qualidade. Hoje em dia devese ter o cuidado de não deixar acompanhar ao termo doméstico, o a conotação de má qualidade. Há um sem número de sistemas sofisticados para uso domésticos, dentre os quais alguns, mais ainda do que muitos utilizados em estúdios.

    O problema que detectei ao pesquisar sobre o assunto é que há muita informação incompleta e/ou desencontrada em vários artigos, razão pela qual não pude utilizá-los como referência.

    Uma informação que me pareceu a mais confiável, foi obtida no site da Dolby, no documento denominado "Overview of Dolby technologies", segundo o qual, os processadores Dolby desenvolvidos até hoje, são os seguintes:

    Tecnologia de gravação analógica:

    • A-type NR
    • B-type NR
    • C-type NR
    • Spectral Recording (SR)
    • S-type NR
    • HX Pro

    Codificação de áudio digital:

    • AC-1
    • AC-2
    • Dolby Digital (AC-3)
    • Dolby E
    • MLP Lossless
    • AAC

    Som para filmes:

    • Dolby Stereo
    • Dolby SR
    • Dolby Digital
    • Dolby Digital Surround EX

    Sistemas do tipo Surround para consumo doméstico

    • Dolby Surround
    • Dolby Surround Pro Logic
    • Dolby Surround Pro Logic II
    • Dolby Digital
    • Dolby Headphone
    • Virtual Dolby Surround and virtual Dolby Digital

    O maior número de informações desencontradas, simplificadas e/ou incorretas, dizem respeito ao som de cinema e aos sistemas domésticos e à quantidade de canais.

    No cinema o primeiro tipo de processamento Dolby utilizado foi o Dolby A-type em 1965, criado inicialmente para reduzir o ruído de fundo das gravações analógicas, mas seus recursos se mostraram muito úteis para os filmes, razão pela qual a indústria cinematográfica veio a utilizá-lo largamente. A Dolby considera o Dolby Stereo, introduzido em 1975, como a sua primeira grande contribuição para o cinema. Este incorporava recursos de redução de ruído do Dolby A-type e decodificava as trilhas em estéreo, para três canais atrás da tela (esq., central e dir.) e um quarto canal para surround, ou circundante. Em 1986, a Dolby introduziu o processamento Dolby SR, (Spectral Recording) que além destes quatro canais possuía um canal opcional para subgraves e, em 1992 introduziu o Dolby Digital, que além dos três canais para atrás da tela, possui canais de surround independentes (esq. e dir.) e um sexto canal para subgraves, que muitas vezes é citado como ".1" (por isso Dolby 5.1), porque cobre apenas um décimo do espectro audível. Mais recentemente a Dolby introduziu o Dolby Digital Surround EX, que possui três canais para a tela e três para surround, além de um para subgraves. Este último também é conhecido como 6.1.

    No âmbito do uso doméstico a tecnologia Dolby foi utilizada largamente nos tape decks de fita cassete e rolo, para reduzir o ruído de fita (tape hiss) e aumentar a faixa dinâmica, com o processamento B-type NR, C-type NR, Stype NR e HX-Pro. A tecnologia era licenciada para diversos fabricantes de equipamentos que incorporavam aos seus circuitos. Quando o videocassete se estabeleceu como meio de entretenimento doméstico e, evoluiu para estéreo, a Dolby lançou o processamento Pro logic, que decodifica o processamento Dolby Surround aplicado ao som dos filmes, para 4 canais, portanto sem canal de subgraves e com surround mono. Suponho que o que pode Ter causado muita confusão é o fato de que muitos receivers, tinham duas saídas para caixas acústicas, mas apenas um tipo de sinal presente, mono. Já o Pro Logic II possui canais de surround esquerdo e direito, além dos três frontais, mas não possui canal de subgraves e, às vezes é erroneamente denominado como 5.1.

    Outra provável fonte de equívocos pode ter sido o fato de vários modelos e marcas de receivers incorporarem canais de subgraves (ou saídas para...), sem que estes possuíssem decodificação decorrentes do Pro Logic ou Pro-logic II, sendo a composição espectral deste canal, nestes casos, resultante da soma dos canais esquerdo e direito, com filtro passa-baixas, eliminando as altas freqüências.

    Por fim, ainda no âmbito doméstico, ao Dolby Pro Logic II, seguiu-se o Dolby Digital AC-3, que é exatamente o mesmo processamento aplicado à decodificação do som nos filmes, este sim, decodifica o som gravado nos DVDs, para três canais frontais, dois independentes de surround e um sexto de subgraves

  20. SOM, ESPECTRO E FREQÜÊNCIAS DE ÁUDIO

    Os sons que ouvimos são originados mediante a vibração de moléculas de ar. Quanto mais lenta essa vibração mais graves são os sons, quanto mais rápida, mais agudos. Imagine uma corda de violão, a mais grossa. Ao ser tocada você verá que o som somente é produzido enquanto ela está vibrando. Esta vibração ocorre várias vezes num segundo, daí a denominação de freqüência, que é expressa em ciclos por segundo ou Hertz (Hz).

    Um dado som de 82,4 Hz, ou 82,4 vibrações, ou ciclos por segundo, como a 6ª corda do violão (de baixo para cima), equivale à 2ª nota MI, quer dizer que esta corda vibra 82,4 vezes por segundo para produzir som. Então o som que ela produz dizemos ser de 82,4 Hertz.

    Os sons que o ouvido humano escuta possuem vibrações que vão de 20 Hz(ou 20 vezes por segundo) até 20.000 Hz(ou vinte mil vezes por segundo). Também se usa a expressão Kilo para números acima de 1.000 Hz. Assim 20.000 Hz é a mesma coisa que 20 kHz.

    Esta região compreendida entre 20 HZ e 20 kHz, denominamos espectro de áudio. Teoricamente o ouvido humano escuta o espectro de áudio inteiro, mas nem todas as pessoas escutam igualmente, e, além de tudo, o ouvido escuta com muito mais facilidade as freqüências entre 100 e 4000 Hz que é exatamente a região compreendida pela voz humana.

  21. PAULO FERNANDO CUNHA ALBUQUERQUE

    A introdução do Método Thiele & Small no Brasil não ocorreu por acaso. Paulo Fernando empenhou-se num trabalho sistemático em dissecá-lo, em diversos artigos publicados na extinta revista Antenna, de junho de 1980 a fevereiro de 1981, e graças ao prof. Homero Sette, nos seus livros (ver Silva, 1996), artigos e cursos por todo o Brasil, patrocinados pela Selenium, o trabalho pioneiro de Paulo Fernando não caiu no completo esquecimento. Por ocasião do III ENPA (Encontro Nacional dos Profissionais de Áudio), realizado em outubro de 1993, no Rio de Janeiro, ele foi ainda mais incisivo, trazendo pessoalmente o Paulo Fernando e apresentando aos profissionais do ramo, ressaltando a importância do seu trabalho pioneiro. Os artigos de Paulo Fernando foram os primeiros originalmente produzidos no Brasil, mas não foram os únicos, como ressalta Homero Sette. Ne mesmo período, a revista Monitor de Rádio e Televisão, também traduziu e publicou 2 artigos de Oscar J. Bornello. (Silva, 1996, p. 1.6). Outros artigos, de outros autores se seguiram (ver item 20 neste apêndice, Homero Sette) como do de A. Q. Mais, no nº 114 da extinta revista Nova Eletrônica, em 1986 e vários de Homero Sette.

    No Brasil, existem uma boa quantidade de áreas de conhecimento onde a produção científica e/ou acadêmica ainda é muito pequena, uma delas é o áudio. O pouco que existe, de origem não-acadêmica, não é localizável nas bases de dados e raramente encontrado nas bibliotecas. Talvez por isso e, pela falta do rigor acadêmico, são esquecidos (não citados) inúmeros trabalhos pioneiros. Ora, a produção do conhecimento é uma tarefa essencialmente coletiva e, o rigor acadêmico nos obriga a lembrarmos sempre disso, a recuperar as informações, os trabalhos já apresentados e publicados e citá-los adequadamente. Nesse aspecto as normas da ABNT para citações e referências, mostram a sua real importância. Não fosse pelo esforço e ética de alguns, dos que têm uma atuação mais regular na área do áudio, alguns trabalhos pioneiros como o de Paulo Fernando, e também como o de Bittencourt e Bittencourt (1965, citados no início deste trabalho) teriam sido esquecidos para sempre. Não é preciso muito esforço para perceber o quanto isso é prejudicial ao desenvolvimento de qualquer área do conhecimento, sem registro, sem constar nas bases de dados, sem estar disponível nas bibliotecas, o conhecimento se esvai, perde-se o contexto, tem-se que estar a todo instante estudando e pesquisando assuntos já trabalhados, o que consiste numa duplicação inútil de esforços, enfim atrasa significativamente o progresso do conhecimento.

  22. HOMERO SETTE SILVA

    Formado em Engenharia Eletrônica pela Universidade Santa Úrsula e com pós-graduação em Educação pela Universidade Federal do Ceará, é atualmente consultor da Selenium (fabricante de alto-falantes), pela qual tem viajado por todo o país ministrando cursos sobre altofalantes e, dissecando seus segredos e disseminando a teoria de A. Neville Thiele e Richard H. Small, para instaladores de som automotivo, profissionais de sonorização e audiófilos.

    Percebendo uma grande importância nos artigos de Paulo Fernando (ver item 20 neste apêndice), dedicou-se a entendê-los, aplicando nos diversos projetos que desenvolveu como consultor. Mais tarde, prosseguindo a tarefa de Paulo Fernando na divulgação do método T&S, escreveu diversos artigos a respeito nas revistas Antenna e Saber Eletrônica. Nesta última, como ele mesmo informa (Silva, 1996, p 1.6), os artigos foram o embrião para o seu livro "Análise e síntese de alto-falantes & caixas acústicas pelo método Thiele & Small".

    Traduziu para o português o livro de Vance Dickason, Loudspeaker Design Cookbook, que aqui recebeu o título "caixas acústicas e alto-falantes" (Dickason, 1992). Deve-se ao seu trabalho a iniciativa pioneira da Selenium de aferir e publicar os parâmetros T&S de seus alto-falantes de uso profissional. Com isso outros fabricantes também se sentiram impelidos a fazê-lo, como a Novik, Bravox e Ookpik (este último, fabricante dos produtos Snake).

    Os fruto do seu trabalho podem ser constatados hoje no mercado de alto-falantes. É um fato consumado que quase a totalidade dos fabricantes de alto-falantes, afere os parâmetros T&S de seus produtos e os informa aos consumidores. E há uma forte razão para assim procederem: Com os dispositivos de medição acoplados a computadores (como Woofertester) e softwares dedicados, de custo acessível hoje em dia, se pode aferir com muito boa precisão, tais parâmetros, e assim permitir questionar dados fantasiosos ou "maquiados" por razões comerciais. Assim dados incorretos informados, podem denegrir significativamente a imagem e conceito de produtos e fabricantes.

Nenhum comentário: