TOPLAM KALĠTE YÖNETĠMĠ ĠLE
7. Kullanım sistemleri: Elektrik, su ve diğer kullanım sistemlerinin, iĢletme
CVAD é uma combinação de três algoritmos de VAD. A Figura 24 apresenta o fluxograma de funcionamento desta técnica. Como se observa, a técnica utiliza a avaliação da energia do pacote por sub-banda no domínio da freqüência com o uso da DCT. Caso seja verificada uma energia maior que o limiar de silêncio o pacote de voz é considerado ativo (mesmo funcionamento da LSED). Caso o pacote seja considerado inativo, o pacote de voz é encaminhado para uma segunda análise, sendo então verificada a quantidade de cruzamentos do zero ocorrida durante os 20 ms. Para este estágio da técnica, se o pacote de voz for considerado inativo o mesmo não é transmitido, mas caso seja considerado ativo, ele ainda passa pela avaliação da atenuação espectral do sinal. Se a variância do sinal no domínio freqüência for baixa, ocorre a indicação de inexistência de conteúdo significativo para a conversação em curso e o pacote é considerado inativo, sendo desta forma não transmitido, caso contrário, é voz ativa (SANGWAN, 2002a).
Figura 24 - Fluxo de decisão do CVAD. Fonte: Sangwan (2002a)
4 PROPOSTA
Dentro ainda do contexto, esse trabalho se propõe a validar e sugerir melhorias para as implementações propostas neste capítulo. Para tanto, inicialmente é necessário se definir os parâmetros a serem avaliados. Assim, como elementos fundamentais na validação da implementação das técnicas de compressão de voz baseadas na detecção de períodos de silêncio, o que se vislumbra é um alto percentual de supressão de silêncio com um mínimo nível de degradação da qualidade do sinal da voz proporcionada. Ou seja, quanto mais próxima estiver a amostra “degrada”, amostra essa que já tenha sido as técnicas de compressão, da amostra original, melhor a qualidade e melhor o desempenho da técnica, em termos de qualidade do sinal de voz. Lembrando que ainda precisa-se avaliar o percentual de compressão, ainda não considerado aqui.
Mas voltando a sequência, tendo sido realizada a revisão bibliográfica, e definidas as técnicas a serem implementadas, ainda faltava definir a metodologia para a condução dos testes de avaliação. O que se pode observar é a inexistência de uma metodologia de avaliação da voz, dentro da bibliografia consultada, específica para a avaliação isolada de técnicas de detecção e supressão de silêncio. Desta forma, decidiu-se então se propor uma adaptação para os objetivos do trabalho. O que se apresentava mais conveniente, e também por ter sido o método apresentado em outros trabalhos relacionados (PRASAD, 2002) (SANGWAN, 2002a) (SANGWAN, 2002b) e tantos outros, é a recomendação P.800 (MOS) (ITU 1996a) do ITU-T. A recomendação P.800 (ITU 1996a) baseia-se em um método de avaliação subjetiva da qualidade do sinal de voz em sistemas de telecomunicações. Essa recomendação é baseada no método de classificação por categoria absoluta (ACR) (ITU 1996a) para obter-se a pontuação média de opinião (MOS), como já detalhado anteriormente. A descrição dos parâmetros recomendados pela P.800 para este tipo de teste estão descritos no Anexo A deste trabalho.
Mesmo a recomendação P.800 (ITU, 1996a) sendo aplicada em diversos trabalhos, por exemplo os de Zha (2005), Cai (2004), Sangwan (2002a) e muitos outros, o que se sabe, é que essa mesma recomendação é bastante custosa, especialmente no público necessário para avaliar o áudio aplicado as técnicas. E também pensando na execução de mais rotinas de testes, que não avaliem apenas o resultado final do áudio, mas também o processo de construção das técnicas, com testes intermediários. Neste sentido verifica-se a possibilidade de uso da recomendação P.862 (PESQ) (ITU-T, 2001). A recomendação P.862 (ITU-T, 2001) baseia-se em resultados objetivos obtidos a partir de algoritmos matemáticos que analisam de
forma comparativa os sinais de áudio de entrada e saída do sistema. A partir disso, o PESQ (ITU-T, 2001) emite uma nota referente ao nível de entendimento do sinal, que aplicado aqui, pode mensurar o nível de degradação proporcionada pelo pelas técnicas ao áudio.
Outro ponto favorável a escolha de se usar o PESQ (ITU-T, 2001), conforme afirma Fernandez (2003) e é apresentado na própria recomendação P.862 (ITU-T, 2001), é o fato de a mesma possui condições de avaliar o clipping da voz, por exemplo.
Dentro deste cenário, a Figura 25 apresenta um diagrama de blocos com o sistema a ser construído, e os sinais, em pontos intermediários, a serem testados. Neste cenário o que se vislumbra é poder fazer um comparativo do processo evolutivo de implementação das técnicas e verificar o quanto as técnicas de recobrimento e a adição de ruído de conforto podem contribuir para a melhoria da qualidade do sinal de voz na saída do sistema. Destaca- se que em cada ponto do sistema avaliado em termos de qualidade da voz, irá se verificar também o percentual de supressão de silêncio proporcionado pela aplicação de cada técnica.
Figura 25 - Diagrama de blocos do sistema a ser implementado e sinais a serem avaliados pelo PESQ e pelo MOS
Fonte: O autor (2009).
A verificação do percentual de supressão de silêncio proporcionado possibilita que seja feita uma estimativa de redução de informação injetada na rede de pacotes considerando ainda não apenas o conteúdo de voz, mas o overhead dos cabeçalhos dos protocolos aplicados na transmissão da mídia.
Outro ponto que vale ressaltar, e que já foi citado na revisão deste trabalho, é quando da avaliação da qualidade do sinal da voz, existir a necessidade de uma avaliação subjetiva de referência quando da avaliação de codificadores, antes mesmo de uma avaliação objetiva. Aqui isso só reforça o procedimento adotado. Mesmo as técnicas de detecção de períodos de silêncio não serem padrões de codificação, as mesmas podem ser enquadradas na necessidade
de uma avaliação de referência. Nesse sentido a nota MOS certamente será de grande valia para o trabalho.
5 PROJETO, IMPLEMENTAÇÃO E VALIDAÇÃO DOS ALGORITMOS DE COMPRESSÃO DE VOZ
Para esta dissertação de mestrado, quanto a sua construção, a metodologia adotada foi a de sequenciar o texto de acordo com o desenvolvimento do trabalho. Assim, podem-se discriminar algumas partes, que podem ser ditas como fazes do desenvolvimento: levantamento bibliográfico, definição da proposta, implementação dos algoritmos matemáticos, testes de validação e avaliação, e construção do manuscrito.
Na sequência são detalhados os métodos aplicados para a construção do trabalho, considerando o detalhamento de cada uma das fazes citadas acima.