• Sonuç bulunamadı

D. Kişisel Verilerin Korunması Kanunu’na Göre Açılacak Davalar

7. Kişisel Verilerin İhlali

Além das práticas tradicionais da área de biblioteconomia voltadas à representação descritiva oriundas dos séculos 19 e 20, o padrão MPEG-7 usa práticas emergentes envolvendo critérios baseados em sinais de áudio que podem ser automaticamente extraídos de qualquer resolução temporal ou espectral desejado (QUACKENBUSH e LINDSAY, 2001). Segundo os autores, o MPEG-7 é a tecnologia de descrição do século 21.

O framework MPEG-7 Áudio, em conjunto com elementos básicos dos esquemas de

descrição multimídia (apresentados na próxima seção), fornece estruturas para descrever conteúdo relacionado a áudio. Tais estruturas incluem tecnologias denominadas Scale Tree (permite séries

132 para fins de resumos estatísticos) e Audio Segment (permite intervalo temporal com agregação de

descritores de áudio). Em relação aos descritores, o framework contempla os de baixo nível (ou

ferramentas genéricas) envolvendo características espectrais, paramétricas e temporais para descrever sinais e arquivos de áudio; além de descrições de alto nível (ou ferramentas de aplicações específicas) voltadas à indexação e reconhecimento de som; timbre instrumental; conteúdo falado; marcação de áudio; e melodia.

Segundo a norma, existem dezessete parâmetros que cobrem características temporais e espectrais. Podem ser classificados nas categorias abaixo:

• Básico (Basic): os descritores básicos são de uso geral e aplicáveis a todos os tipos de sinais.

• Espectral Básico (Basic Spectral): os quatro descritores organizados em Basic

Spectral compartilham da mesma base, derivando da análise de frequência do

sinal.

• Paramétricos de Sinal (Signal Parameters): aplicados a sinais periódicos ou quase periódicos.

• Timbre Temporal (Timbral Temporal): descrevem características temporais de segmentos de áudio; úteis especialmente para descrever características do timbre118 de instrumentos musicais.

• Timbre Espectral (Timbral Spectral): descrevem características do timbre relacionadas ao espectro do sinal.

• Base Espectral (Spectral Basis): representam projeções de baixa dimensionalidade de um espaço espectral de alta dimensão para ajudar na compacidade e identificação. Os descritores são usados principalmente com ferramentas de classificação de som e indexação de descrição.

• Segmento de Silêncio (Silence Segment): atribui uma semântica simples de “silêncio” (nenhum som significativo) para um segmento de áudio. Considerado um descritor eficaz no suporte à segmentação do fluxo de áudio, sugerindo o não processamento de um determinado segmento.

As ferramentas de descrição de áudio consideradas de alto nível e que podem canonicamente representar um som com certo grau de generalidade para riqueza nas descrições incluem descritores e esquemas de descrição voltados à cobertura de domínios de conhecimento específicos. A norma contempla cinco conjuntos de ferramentas integradas destinadas às seguintes áreas de aplicações: i) marcação de áudio; ii) timbre de instrumento musical; iii) descrição de

118 Timbre é definido na literatura como características perceptivas que fazem dois sons com a mesma altura e

melodia; iv) indexação e reconhecimento de som; e v) conteúdo falado. Os dois últimos são considerados bons exemplos de como o Framework de Áudio e as ferramentas de esquemas de

descrição multimídia (MDS) podem ser integradas para apoiar outras aplicações. A seguir é elucidada brevemente cada ferramenta de áudio para descrição de alto nível (QUACKENBUSH e LINDSAY, 2001; MARTÍNEZ, 2004).

• Esquema de descrição para marcação de áudio (Audio Signature Description

Scheme): o descritor de nivelamento espectral ajuda nas funcionalidades de

combinação robusta de sinais de áudio. O descritor é estatisticamente sumarizado no esquema de descrição AudioSignature como uma representação

condensada do sinal de áudio; além de fornecer um identificador de conteúdo único para fins de identificação automática de sinais de áudio. Exemplos de aplicações incluem impressão digital de áudio e identificação de áudio em bases de dados de obras conhecidas.

• Ferramentas de descrição para timbre de instrumento musical (Musical

Instrument Timbre Description Tools): os descritores de timbre são voltados à

descrição de características de percepção de sons de instrumentos. Relacionam- se com noções de “ataque”, “brilho” e “riqueza” de um som. Algumas classes de sons de instrumentos musicais, tais como sons de harmonia e de percussão são bem detalhadas na norma.

• Ferramentas para descrição de melodia (Melody Description Tools): as descrições incluem uma representação rica de melodias monofônicas para facilitar a correspondência de similaridade melódica, como consultas por sussurros. O esquema de descrição MelodyContour usa um contorno de cinco

passos (representando a diferença de intervalo de escala de passo entre notas adjacentes) em que intervalos são quantizados; além de representar informação rítmica básica por meio do armazenamento do número de notas que pode aumentar consideravelmente a precisão nas combinações de consultas.

• Ferramentas de descrição para reconhecimento e indexação de som em geral (General Sound Recognition and Indexing Description Tools): os descritores e

os esquemas de descrição envolvidos são uma coleção de ferramentas para indexação e categorização de efeitos de sons em geral permitindo apoio na identificação automática de tais efeitos. Podem utilizar taxonomias (esquemas de classificação) e ontologias de reconhecimento de sons como apoio na indexação automática de trilhas de som. Exemplos de aplicações incluem classificação de gênero e reconhecimento de voz.

134 • Ferramentas para descrição de conteúdo falado (Spoken Content Description

Tools): os descritores e os esquemas envolvidos permitem descrições detalhadas

das palavras faladas dentro de um fluxo de áudio. O padrão MPEG-7 reconhecendo a limitação tecnológica de reconhecimento automático de fala no que diz respeito a expressões fora do vocabulário, sacrifica alguma compacidade para robustez de pesquisa. As ferramentas podem ser usadas para indexação e recuperação em fluxos de áudio e indexação de objetos multimídia anotados por meio de fala. Exemplos de aplicações incluem: i) um filme ou gravação de um vídeo em que um personagem fala uma determinada palavra ou sequência de palavras; o suporte de mídia seria então reconhecido e a consulta retornaria o conteúdo na posição específica da mídia; ii) bases de dados de documentos falados possibilitando recuperação de documentos relevantes e, opcionalmente, a posição nesses documentos dos discursos correspondentes; e iii) recuperação de fotografia anotada por uma fala.