• Sonuç bulunamadı

3 BEYOĞLU’NUN TARİHSEL GELİŞİMİ, KENTSEL VE KÜLTÜREL

3.2 Bölgenin Kentsel ve Kültürel Yapısı

3.2.2 Kültürel Yapısı

O componente de Animação é responsável por converter a seqüência de glosas gerada pelo componente de Tradução Automática em um vídeo em LIBRAS. Para realizar essa tarefa, ele utiliza um Dicionário de LIBRAS que contém uma representação visual (por exemplo, uma animação ou um arquivo de vídeo) para cada sinal. Mais especificamente, nesse dicionário, cada sinal é representado por uma animação ou arquivo de vídeo e possui um código (a glosa) associado com essa representação.

Dessa forma, o Dicionário de LIBRAS pode ser definido formalmente como um con- junto de tuplas t no seguinte formato:

t =< g,v >, (4.1)

onde:

• g é a glosa (ou código) do sinal; • v é a representação visual do sinal;

Como cada sinal possui um código fixo, a representação visual do sinal pode ser cus- tomizada (personalizada). Dessa forma, essa representação pode ser uma animação (ou vídeo) gerada(o) a partir de um agente animado virtual (um avatar) ou um vídeo gravado com um intérprete de LIBRAS. Outra característica importante é que as especificidades regionais da LIBRAS também podem ser respeitadas, uma vez que diferentes dicionários podem ser utilizados na solução dependendo da região onde ela é aplicada.

A utilização de vídeos gravados com intérpretes, no entanto, possui alguns problemas. Um dos principais problemas é que para construir sentenças a partir de vídeos (dos sinais) isolados, é necessário que os vídeos de todos os sinais tenham sido gravados com o mesmo intérprete nas mesmas condições (isto é, mesma roupa, iluminação, distância para câmera,

4.3. ANIMAÇÃO E SINCRONIZAÇÃO 61 dentre outros). Caso contrário, a transição entre os sinais consecutivos não será suave [Elliott et al. 2004].

Outro problema está relacionado a atualização do dicionário. Uma vez que LIBRAS é uma língua viva e novos sinais podem surgir espontaneamente, seria necessário gravar novos vídeos para esses novos sinais com o mesmo intérprete nas mesmas condições dos sinais anteriores. Somado-se a disso, a geração desse dicionário demanda, em geral, muito tempo e possui um custo operacional alto.

Em conseqüência disso, na solução proposta, os sinais do Dicionário de LIBRAS são representados através de um agente animado virtual-3D (um avatar-3D). Com a utiliza- ção de avatares é possível gerar todos os sinais sob as mesmas condições e atualizar o Dicionário à medida que novos sinais forem surgindo. Além disso, na solução proposta, os sinais do Dicionário de LIBRAS podem ser desenvolvidos de forma produtiva e me- lhorados sempre que necessário, através da utilização de ferramentas de colaboração e computação humana (de forma similar a geração de regras de tradução). Para isso, uma Linguagem de Descrição de Sinais foi desenvolvida, permitindo que surdos e especialis- tas em LIBRAS descrevam sinais na ferramenta WikiLIBRAS. A partir dessa descrição, os sinais podem ser renderizados pela WikiLIBRAS com base no modelo do avatar-3D proposto. A ferramenta WikiLIBRAS, a Linguagem de Descrição de Sinais s o modelo do avatar-3D serão apresentados na Seção 4.5.

Na Figura 4.3 é ilustrada uma visão esquemática do componente de Animação. De acordo com a Figura 4.3, o componente recebe, inicialmente, uma seqüência de glosas em LIBRAS. A partir dessa seqüência de glosas, uma consulta no Dicionário de LIBRAS é aplicada, associando e recuperando um vídeo para cada glosa (sinal) da sentença. Caso não exista um vídeo para algum dos sinais da sentença no Dicionário de LIBRAS (isto é, não exista uma entrada correspondente para aquele sinal - glosa - no Dicionário de LIBRAS), uma vídeo é gerado para aquele sinal a partir da soletração da sua glosa. Essa estratégia é utilizada para evitar lacunas na representação das sentenças em LIBRAS e é a mesma estratégia utilizada pelos surdos e pelos intérpretes de LIBRAS para represen- tar palavras ou termos que não possuem sinais próprios, como, por exemplo, os nomes próprios e os termos técnicos. Por exemplo, em LIBRAS, o nome próprio "TIAGO"é representado como "T-I-A-G-O".

Após recuperar os vídeos dos sinais, o componente de Animação aplica uma estratégia de síntese para combinar esses vídeos, gerando um fluxo único de vídeo de LIBRAS. Essa estratégia consiste em concatenar (combinar) os vídeos com base nas etiquetas de tempo (pontos de sincronização) geradas pelo componente de Sincronização. Para que as transições entre os sinais (vídeos dos sinais) fossem suaves, uma configuração neutra

62 CAPÍTULO 4. SOLUÇÃO PROPOSTA Figura 4.3: Visão esquemática do componente de Animação

(isto é, posição do avatar, cor de background, brilho, etc.) foi definida no início e no fim do vídeo de cada sinal e durante os intervalos de silêncio. No Capítulo 6, será descrito um processo de experimentação conduzido com usuários surdos para avaliar, dentre outros, a naturalidade e inteligibilidade dos vídeos de LIBRAS produzidos pela solução utilizando essa estratégia de suavização.

Conforme mencionado anteriormente, a estratégia de sincronização utilizada pela so- lução proposta é baseada no modelo de sincronização baseado no eixo do tempo [Blakowiski & Steinmetz 1996]), onde o relógio global do conteúdo multimídia é utilizado como refe- rência para gerar as etiquetas de tempo de apresentação (Presentation Timestamps - PTS) que servem como pontos de sincronização para a trilha de LIBRAS. Considerando que

relmmepulsommsejam, respectivamente, o relógio de referência do conteúdo multimídia e

pulso desse relógio;rellegepulsolegsejam, respectivamente, o relógio e o pulso do relógio

do fluxo de legenda; etleg seja a marcação de tempo do bloco de legenda, o componente de Sincronização define o valor de PTS para o trecho do vídeo de LIBRAS (PTSLibras) correspondente de acordo com a seguinte equação:

PTSLibras=relmm+(tleg−relpulsoleg) ∗pulsomm leg

, (4.2)

De acordo com a Equação 4.2, caso o fluxo de legenda esteja embutido no próprio conteúdo multimídia, o relógio e o pulso do fluxo de legenda coincidirão com o reló- gio e o pulso do conteúdo multimídia e, com isso, o valor de PTS (etiqueta de tempo)

4.4. DISTRIBUIÇÃO 63