DERSİN PROGRAM ÇIKTILARINA KATKISI
12 Hukuk alanına ilişkin temel düzeydeki bir çalışmayı bağımsız olarak X
Este capítulo é inteiramente dedicado à teoria cinematográfica de produção sonora (Film Sound), cujos preceitos são em grande parte aplicáveis à concepção de topologias
sonoras nos jogos eletrônicos. Dentre os tópicos que abordaremos estão: o espaço sonoro e o ponto de audição; as diferentes formas de relacionamento entre sons e imagens; o uso da voz; a música para videogames (VG music); e o silêncio como expressão e forma sonora.
A partir da teoria cinematográfica de produção sonora (Film Sound), podemos afirmar que o som em game:
• Unifica as imagens.
• Potencializa a imersão do jogador por meio da criação de um ambiente sonoro 3D.
• Atua como índice de materialidade sonora, uma “assinatura” da fonte sonora (ser, objeto, máquina, etc.).
• Demarca um território.
• Funciona como índice de espacialidade (características físicas do ambiente).
• Ajuda o jogador a se localizar (ou a se perder).
• Dilata ou contrai a extensão do ambiente sonoro.
• Pode representar ambientes silenciosos.
• Influencia a percepção das características físicas de um objeto. Pode-se categorizar os sons em: mecânicos, eletrônicos, orgânicos ou misturas variadas de duas ou três das categorias citadas.
• Agrega valor, alterando o modo como interpretamos as imagens. Faz com que uma imagem adquira novo (s) significado (s) a partir de sua influência, da mesma forma como pode ter seu significado alterado a partir da influência da (s) imagem (ns). Isto ocorre em função de fenômenos como a synchresis e o pacto audiovisual, que serão tratados adiante.
• Direciona a atenção para algum aspecto da imagem através de manipulações de freqüências, timbre, dinâmica, etc.
• Define a percepção do tempo nas imagens em função de pontos de sincronia (keyframes sonoros).
• Pode transferir características rítmicas às imagens (quando as imagens estão em movimento). Por exemplo, na cena de Psicose em que o pára-brisa parece estar em sincronia com a música, mas não está.
• Confere “perspectiva” às imagens estáticas.
• Esclarece, contradiz ou torna ambíguo um evento visual.
• Faz com que algo pareça mais ou menos real.
• Pode ter função narrativa.
• Cria “cenários” como saloons em filmes de cowboy, por exemplo, por meio de gêneros musicais.
• Cria “realidades”.
• Identifica personagens (leitmotivs), objetos, ambientes, lugares e contextos (amor, mistério, drama, etc.).
• Permite atribuir características humanas a objetos e outros seres.
• Indica mudanças na narrativa.
• Antecipa pistas sobre um acontecimento.
• Oferece dicas e informações sobre o enredo.
• Facilita a identificação de aliados e antagonistas.
• Ajuda a reconhecer os estados emocionais de outros personagens.
• Exerce influência sobre o estado emocional do jogador, por meio de “climas”, “atmosferas”. Em Space Invaders, por exemplo, a aceleração progressiva do andamento da música aumenta a tensão do jogador.
• Reduz a curva de aprendizado em um game.
• Contribui para a continuidade do ato de jogar.
• É índice da ocorrência de eventos, estados (mais “vidas”, “força”, “saúde”, etc.) e modos (de dificuldade, velocidade, etc.).
• Funciona como feedback em interações.
• Indica acertos e erros.
• Denota o sucesso ou o fracasso do jogador.
• Atua como logotipo sonoro.
• Demarca o início ou o fim de uma fase.
• Estimula atividades motoras do (s) jogador (es), especialmente em jogos para Wii e
PlayStation que utilizam o Eye Toy (câmera USB).
• Maximiza o aspecto lúdico do jogo.
• Promove músicas, selos e artistas.
Vamos falar sobre cada uma das funções citadas acima. Uma das questões recorrentes é “para que serve o som?”. Christian Metz (apud Weis and Belton, 1985: 154-160) aponta que os elementos sonoros, que para ele têm autonomia e status equivalente ao das imagens, são percebidos pela maioria das pessoas não como "coisas" em si, mas como características de outros objetos, ou seja, a percepção está vinculada ao conhecimento do mundo e é, portanto, constituída socialmente. Assim, o som de um carro não é, em geral, considerado em si mesmo, mas como atributo, índice, de outro objeto; o carro. Este argumento faz um contraponto ao conceito de escuta reduzida, proposto por Chion (1994: 29), que será discutido no Capítulo 4.
Curiosamente, o som não é mais efetivo ou verossímil quando representa com fidelidade a sua fonte causadora. Quem, entre nós, já esteve em um submarino a centenas de metros debaixo d' água, para saber como é o som "natural" de um submarino? Quantas explosões já presenciamos no espaço? A propósito, na ausência de ar, não haveria qualquer percepção sonora. Como é o som do caminhar sobre a neve, o ruído de ossos humanos sendo quebrados e triturados, ou o roçar em um corpo alienígena? E o que dizer dos sons de golpes nos filmes de ação? Isso nos leva a duas constatações evidentes: primeiro, com muita freqüência, o som construído, montado, é mais convincente do que o som real provocado por sua fonte; segundo, "aprendemos" no próprio cinema e em outras mídias o que soa "natural". Chion (1994: 108) argumenta que o cinema, a televisão e o teatro criaram convenções tão fortemente estabelecidas que o som representado é mais "fiel" do que o som literal. Além disso, o ambiente controlado dos estúdios de gravação permite um registro apurado, nem sempre possível com captação de som direto, que possibilita a criação de ambientações sonoras hiper-realistas. Em Forrest Gump – O Contador de Histórias (Forrest Gump), por exemplo, durante a cena de batalha no Vietnam ouve-se com clareza o tilintar de cartuchos de balas caindo sobre o chão de terra. Algo similar acontece durante as batalhas em Halo 3, desenvolvido para Xbox 360. Bem, em primeiro lugar, no caso do filme, a terra absorveria as freqüências altas que naturalmente não soariam daquela maneira; outro aspecto curioso é o fato de que após a queda da primeira granada próxima dele, o protagonista estaria impossibilitado de ouvir qualquer coisa. Em Metal Gear Solid 4 este fenômeno é melhor
resolvido por meio da representação, ainda que passageira, do comprometimento da audição. Isso demonstra que no cinema, assim como nos games, é possível trabalhar o som com um nível de detalhamento muito mais refinado do que podemos constatar no cotidiano. O trabalho do produtor de áudio é, no caso, “recortar” e isolar determinados sons e realçá-los de acordo com a intenção dramática. A perda de audição simulada, por sua vez, está relacionada com processamentos sonoros como redução de amplitude, alteração de resposta de freqüências e utilização de um som senoidal constante. O leitor possivelmente já teve experiência similar ao ouvir um “apito” agudo contínuo após sair de um local muito ruidoso.
Chion (1994: 103) afirma também que a escuta direta dos fenômenos acústicos tem sido substituída por uma escuta mediada por amplificadores, alto-falantes e fones de ouvido. Para ele, esta escuta mediada está se transformando em um padrão.
É uma forma de escuta que já não mais é percebida como uma reprodução, como uma imagem (com todas as implicações em termos de redução e distorção da realidade), mas como um contato mais direto e imediato com o evento acústico. Quando uma imagem é mais presente do que a realidade, ela tende a substituir esta última, ainda que degrade seu status como imagem.
Paradoxalmente, quanto mais imersos estamos na realidade sonora mediada eletronicamente, mais "valorizamos" as sonoridades naturais. Além disso, o aumento da definição dos meios de registro e reprodução de áudio faz com que o som atue como elemento caracterizador do espaço da cena, influindo nos enquadramentos (sons mais vastos possibilitam imagens mais intimistas), na quantidade de elementos sonoros simultâneos e na própria "ausência" de sons (uma maior resolução em bits permite uma maior definição de elementos sonoros com baixa amplitude). Até mesmo a maneira como falamos é influenciada pelas vozes que ouvimos no rádio, na TV, no cinema e nos games. As vozes mediadas, bem como suas entonações e musicalidades, são referências de "naturalidade" para a fala cotidiana, ainda que a maioria das pessoas não domine as técnicas de locução utilizadas por atores, locutores e apresentadores. Por outro lado, os diretores de cinema, TV e jogos eletrônicos procuram na fala cotidiana das pessoas "comuns", indicações para a orientação e criação da fala mediada. Diretores de filmes publicitários costumam dizer: “Olha, eu quero uma locução que não pareça locução”. Trata-se de um processo que se retroalimenta: as mídias se inspiram na maneira como falamos, e a maneira como falamos é influenciada pela fala mediada, que
imprime suas marcas como estereótipos, entonações, vícios, técnicas e estilos de locução e de interpretação.
Martin (2007: 117) defende que os sons, assim como as imagens, devem ser selecionados. Uma representação absolutamente realista do som muitas vezes é caótica ou difícil de representar. O exemplo clássico é o da cena de cavalo galopando na praia. Se estivéssemos no local, facilmente iríamos identificar cada um dos sons: das ondas do mar, do vento, das patas na água e dos cascos sobre a areia. Escutaríamos tudo com facilidade quer estivéssemos a 50, 100 ou 150 metros de distância. No entanto, a captação do som seria bastante complicada: Rodríguez (2006: 33) explica:
... qualquer microfone de alta fidelidade colocado a 50 centímetros das patas do corcel captaria perfeitamente o ruído dos cascos sobre a areia, mas fazer isso com um cavalo galopando não é tarefa fácil. Se nosso cineasta optasse por seguir o cavalo com um veículo do qual seria feita a tomada de som, isso criaria uma situação em que o veículo produziria muito mais ruído que o próprio cavalo. Além disso, no momento em que esse tipo de microfone se distancia da fonte sonora o resultado da gravação já é muito deficiente, razão pela qual a tomada de som de um ponto fixo também não poderia ser feita. Outra opção seria fazer a tomada de som à distância, com um microfone tipo canhão (altamente direcional). Com essa solução, o som se distorceria, perdendo todas as freqüências graves, e o ruído do galope ficaria pouco natural. De qualquer forma, em nenhuma dessas duas situações seria possível obter também, ao mesmo tempo, uma gravação satisfatória do rumor das ondas. Esse som teria de ser gravado independentemente, e depois ambos seriam mixados no estúdio de áudio.
Duas soluções possíveis para o galope seriam utilizar coletâneas de efeitos sonoros pré-gravados ou realizar a gravação com o técnico de som montado sobre o cavalo. A segunda, no entanto, poderia trazer “efeitos colaterais” indesejados como, por exemplo, ruídos da sela sobre o animal e variações de posicionamentos do microfone. O fato é que, misturando-se os sons gravados separadamente, estaríamos distantes da sensação auditiva que teríamos se estivéssemos na praia ouvindo o cavalo correr. Assim, como as diferenças entre a percepção no local (a praia) e a sua representação artificial são expressivas, pode-se optar pelo emprego de uma música não-diegética que transmita o “clima” da cena. Deste modo, Rodríguez (2006: 32-33) conclui que:
... o que configura a linguagem audiovisual é esse jogo articulado de recursos expressivos, que fornecem soluções narrativas à incompletude audiovisual para resolver as diferenças existentes entre a realidade referencial e a realidade reproduzida audiovisualmente. Assim, toda narração audiovisual se apóia sempre em um equilíbrio constante entre: a) A semelhança naturalista da mensagem com aquilo que é contado. b) Os recursos expressivos que escamoteiam sua verdadeira natureza de
cópia incompleta.
Burch (1992: 117-118) descreve problema similar ao se tentar captar diálogos dentro de um carro em movimento:
... na vida real, facilmente conseguimos abstrair os ruídos que atrapalham nossa audição (como barulhos de motor, de vento, de rádio, etc.) e ainda assim ouvir o que dizem as pessoas dentro do carro. Um microfone, por sua vez, gravando a mesma conversa nas mesmas condições, certamente nos restituiria toda mistura de sons, reproduzindo-os todos por igual, na projeção, através de uma única fonte, o sistema de reprodução de som do cinema, fenômeno comparável à maneira como a câmera reduz as três dimensões de um campo real às duas dimensões da tela.
A solução costuma ser a gravação do som ambiente primeiro, separado dos diálogos, que depois são dublados em estúdio e mixados aos ruídos.
Estabelecemos aqui um paralelo entre o zoom da câmera e o volume do áudio. Da mesma forma como é possível dar zoom in para realçar um detalhe da imagem (a expressão do olhar de um personagem ou um maior nível de detalhamento na visualização em games
3D, por exemplo), o controle de volume de cada som possibilita enfatizar um determinado aspecto da cena. Se em meio a uma multidão, a voz de um personagem específico for realçada, o foco da ação será direcionado para ele. Em grande parte dos games, é a engine que realiza o trabalho de mixagem em tempo real, enfatizando este ou aquele som. Em Halo 3, por exemplo, se uma granada explodir perto do personagem do jogador ao mesmo tempo em que alguém fala com ele, o sistema de áudio será responsável por definir o nível de amplitude de cada som. Martin (2007: 172-173) comenta uma cena do filme Les Étoiles du Midi, de Marcel Ichac, em que se vê um alpinista, em primeiro plano, agarrado a uma parede rochosa; “um fulgurante travelling para trás nos reconstitui então o conjunto da paisagem: o homem, como
um minúsculo e frágil inseto, está escalando o formidável pico do Grand Capucin, nos Alpes”. Em cenas como esta, em que o nível de zoom define o tamanho do plano da imagem, o ambiente sonoro pode ou não refletir as mudanças de enquadramento, dependendo das escolhas do produtor de áudio. O mesmo princípio vale para os games, onde o jogador tem a opção, em alguns casos, de definir em tempo real o nível de zoom. O quanto a topologia
sonora refletirá, com maior ou menor realismo, o tamanho do plano é uma decisão a ser tomada pelos desenvolvedores. De forma similar, os sons podem dilatar ou contrair a extensão do ambiente sonoro. Esta extensão designa a amplitude do espaço sugerido pelos sons, além dos limites do campo visual da tela ou do monitor. Portanto, extensão é um parâmetro baseado no uso dos sons cujas fontes sonoras não são visíveis. Se apresentarmos, por exemplo, a imagem de uma sala ao som de um relógio de parede, o campo sonoro estará circunscrito ao ambiente imediato. O mesmo não irá ocorrer, se a mesma imagem for mostrada ao som de ondas distantes do mar. Neste caso, não apenas a extensão sonora será ampliada, como o áudio funcionará como índice de que aquela sala em particular está em uma casa próxima a uma praia. Tecnologias como o Dolby Digital, o DTS e o THX são bastante úteis para a reprodução de ambientes sonoros, por meio da utilização de múltiplos alto- falantes (surround) em torno do jogador.
Em games 3D, a extensão sonora pode variar entre ambientes distintos e/ou em um mesmo ambiente, assim como funcionar como índice de materialidade do espaço visual (cênico ou não); uma espécie de assinatura sonora do espaço. No cinema, em decorrência da necessidade freqüente de inteligibilidade da fala, a perspectiva dos sons, particularmente da voz falada, costuma não seguir as leis da física com fidelidade. Isto é, em muitas ocasiões, a voz de um determinado personagem é ouvida em primeiro plano, ainda que ele esteja sendo mostrado à certa distância. Enfim, há uma relação onde a imagem está distante e o som está próximo. O efeito inverso acontece em transmissões esportivas como as de futebol, onde lentes teleobjetivas aproximam a imagem, enquanto as vozes dos jogadores e técnicos são captadas por microfones distantes, ou seja, a imagem está perto e o som, longe. Já nos games de tiro em primeira pessoa, onde a localização dos adversários é, por vezes, determinante para o sucesso do jogador, a física do espaço costuma ser mais naturalista.
No filme The Bride Wore Black, de Truffaut, o personagem Claude Rich mostra a seu amigo Jean-Claude uma gravação de um som periódico e não-identificável de algo que parece estar sendo friccionado. Jean-Claude demonstra não reconhecer a fonte sonora. Então, Rich conta que gravou o movimento de uma mulher cruzando as pernas, sem que ela soubesse. Ele
diz ainda que a mulher usava meias de nylon, e que uma outra tentativa de gravação, em que a mulher trajava meias de seda, não havia soado bem. Isso sugere que Rich não estava interessado em evocar o reconhecimento da fonte sonora em si, mas em seu efeito simbólico de erotismo, sensualidade, contato e intimidade. Assim, podemos afirmar que em determinadas situações o foco de um som em um filme, vídeo, hipermídia ou game não é sua fonte sonora, mas um efeito ou qualidade que esta fonte sonora esteja apta a apresentar, ou seja, o signo sonoro parece representar não o objeto, mas o seu significante, como poderíamos afirmar em termos peirceanos. O filme de Truffaut também põe em cheque duas crenças comuns sobre a natureza dos signos sonoros: a de que um som possui um vínculo "objetivo" com sua fonte causadora e a de que este som tem a capacidade de evocar impressões precisas a respeito da natureza de sua fonte. Nem sempre isso é verdadeiro. Normalmente, o que faz com que identifiquemos um determinado som com sua provável fonte sonora são suas qualidades internas (forma de onda e timbre) e o contexto em que ocorre. Chion (1994: 114) chama de índices de materialidade sonora as qualidades que denotam a natureza de um determinado som:
Os índices de materialidade sonora são detalhes dos sons que fazem com que "sintamos" as condições materiais da fonte sonora e dizem respeito ao processo concreto de produção do som. Esses índices nos dão informações acerca da substância de que é feita a fonte sonora - madeira, metal, papel, tecido – assim como o som é produzido – por fricção, impacto, oscilações não uniformes, movimentos periódicos, etc. Entre os ruídos mais comuns que nos cercam, há aqueles que são pobres em índices de materialidade e, ao serem ouvidos apartados de suas fontes sonoras (acusmatizados), se transformam em enigmas: o som de um motor, por exemplo, pode adquirir uma qualidade abstrata, privada de referencialidade.
Por esta razão, facilmente conseguimos discriminar sonoridades próprias de materiais como metal e vidro. Mas o que dizer a respeito de algo que ainda não existe (objetos de filmes de ficção científica, por exemplo) ou de um crânio sendo esmagado? Neste caso específico, costuma-se esmagar um melão para o registro do som que será sincronizado com as imagens. No filme A Pele, de Liliana Cavani, uma melancia foi esmagada para produzir o som que representa o atropelamento de um garoto por um tanque de guerra. Outra questão interessante é o fato de que com muita freqüência um signo sonoro só adquire significado quando associado a signos verbais. No exemplo do filme de Truffaut, o som apresentado a Jean-
Claude não faria qualquer sentido sem o relato verbal do amigo a respeito da natureza da fonte sonora (as pernas de uma mulher).