7. BÖLÜM KULLANILAN DEĞERLEME YÖNTEMLERİ
7.2. PAZAR YAKLAŞIMI İLE ULAŞILAN SONUÇLAR
Moita et al. (2011) avaliaram a possibilidade de elaborar um avatar capaz de produzir sinais da Língua Gestual Portuguesa (LGP) através de programação e codificação de base de dados linguísticos. Pesquisas sobre as línguas de sinais, geralmente, referem-se à configuração da mão como o parâmetro mais visível na articulação dos sinais. Desse modo, os autores desenvolveram um estudo sobre a descrição das configurações de mãos na LGP e caracterizaram os elementos fonológicos e morfológicos que compõem a articulação do sinal em LGP, com a finalidade de, futuramente, construírem um avatar.
Segundo Moita et. al. (2011) é preciso compreender o gesto linguístico, tanto no processo de segmentação, quanto na movimentação tridimensional no espaço. Além disso, mostra-se necessário desenvolver um método de armazenamento das informações do gesto linguístico passível de ser reutilizado na linguagem computacional empregada na criação do
avatar.
Os pesquisadores investigaram 83 configurações de mãos em LGP e a articulação do sinal para a mão dominante e a não-dominante. A configuração da mão foi representada como categoria autônoma, simultânea e multiassociada às localizações e aos movimentos. Foi efetuada a descrição fonológica de 500 sinais realizada por surdos universitários do curso de licenciatura em LGP. Essa descrição apresentou as três principais categorias fonológicas (configuração de mão, localização e movimento), além das características da expressão corporal e facial. Contudo, o parâmetro de orientação da palma da mão da LGP não foi investigado até o presente momento, impossibilitando, assim, o desenvolvimento do projeto de criação do avatar.
Entretanto, o material recolhido, bem como as generalizações e sistematização gerados, poderão viabilizar a definição de um modelo descritivo do sistema fonológico da LGP detalhado e o armazenamento computacional confiável dos itens lexicais. Por fim, a proposta dos autores contribui para o incentivo da continuidade dos estudos linguísticos descritivos na LGP e nas demais línguas de sinais. A próxima seção discute o sistema computacional desenvolvido por Da Silva Júnior, J. P. (2014) com a finalidade de estabelecer o reconhecimento automático da língua de sinais.
4.1.3 Estudos do movimento realizados na Libras - Da Silva Júnior, J. P. (2014)
A área de reconhecimento automático de gestos constitui um campo de pesquisa relacionado às mais diversas aplicações, tais como: assistência ao ensino à distância, manipulação de ambientes virtuais, monitoramento do grau de alerta de motoristas, monitoramento médico de pacientes e técnicas de identificação forense. Da Silva Júnior (2014) buscou desenvolver uma ferramenta capaz de reconhecer automaticamente os sinais de línguas de sinais (ASL e Libras) com os seguintes objetivos:
a. Estimular o aprendizado e a aplicação da língua de sinais no dia-a-dia; b. Preservar/registrar o uso da língua de sinais e a cultura surda;
c. Difundir a utilização da língua de sinais;
d. Contribuir para a integração entre surdos e ouvintes, reduzindo as barreiras comunicativas entre eles, etc.
A proposta do autor fundamentou-se em dois pressupostos: (i) os seres humanos são capazes de utilizar gestos em seu processo de comunicação, antes mesmo de aprender a falar, conseguindo compreender algumas expressões gestuais ao seu redor e (ii) o complexo sistema da visão é suscetível à adaptação, possibilitando a extração de características e
reconhecimento de padrões das representações do mundo.
Os sistemas baseados em visão devem estar habilitados a lidar com um grande conjunto de posturas estáticas (com posição fixa sem considerar o tempo de encenação) e dinâmicas (considerando-se o tempo de encenação). Contudo, além de rastrear os gestos das mãos, o sistema detém, ainda, a responsabilidade de reconhecer a interação de diferentes partes do corpo e das mãos, para que o processamento da imagem seja realizado levando em consideração a profundidade (DA SILVA JÚNIOR, 2014).
Da Silva Júnior (2014) baseou-se no sistema de aquisição e processamento com uso de imagens de profundidade, adquiridas a partir do sensor Microsoft Kinect, o qual utiliza sensores RGB-D (canais RGB, do Inglês Red, Green, Blue e o canal D, do Inglês Depth) que unem imagens contendo informação de intensidade luminosa e imagens de profundidade. Dessa forma, o autor conciliou a reconstrução em três dimensões (3D) de superfícies densas; o rastreamento 3D de objetos, mãos e corpo humano e a interação com ambientes de realidade aumentada. Esses sensores associam a cada pixel, um valor correspondente à distância dos
objetos em cena ao sensor; além de possuírem fácil acesso, baixo custo e realizarem o processo em tempo real.
Com intuito de desenvolver o sistema de reconhecimento automático das 26 posturas estáticas da mão para as letras dos alfabetos manuais na Língua Americana de Sinais (ASL) e na Libras, o autor adotou o uso combinado de duas técnicas:
a. Algoritmo de alinhamento pareado “Busca Iterativa do Ponto mais Próximo” (do Inglês, Iterative Closest Point – ICP), que ao ser aprimorado permite inferir similaridades na comparação entre duas imagens de profundidade;
b. Estratégia de “Casamento de Modelos” (do Inglês, Template Matching), utilizada para realizar a classificação de uma dada imagem de teste contra uma base de modelos.
O pesquisador propôs aprimoramentos na utilização dessas técnicas para o reconhecimento da língua de sinais de forma que o sensor RGB-D seja empregado na fase aquisitiva dos dados; e, de posse das imagens de profundidade, aplicou-se a combinação da estratégia de Casamento de Modelos com o algoritmo de alinhamento Iterative Closest Point (ICP) na etapa de reconhecimento. A melhoria na estratégia de Casamento de Modelos visou à redução do tempo de reconhecimento e à aproximação da metodologia aos contextos de tempo real. O aprimoramento na técnica Iterative Closest Point (ICP), por sua vez, buscou verificar possíveis parâmetros de entrada e saída no alinhamento de instâncias de teste com a base de modelos. Em seguida, o autor utilizou esses parâmetros como determinantes da acurácia e eficiência do reconhecimento dos sinais. Os resultados apresentados por Da Silva Júnior (2014) mostraram que:
a. O algoritmo ICP pode ser utilizado para produzir casamentos corretos entre as classes do alfabeto, mesmo quando um conjunto próximo (ambíguo) de posturas gestuais for aplicado;
b. A acurácia da metodologia implementada foi: 99,04% de taxa de acerto no reconhecimento da ASL e de 99,62% para a Libras. Entretanto, através da comparação, percebe-se uma ligeira vantagem da acurácia do reconhecimento das posturas para Libras em detrimento da ASL. Apesar de ambos os alfabetos possuírem uma quantidade idêntica de classes (letras), não se encontrou diferenças significativas da eficiência do método em relação a cada alfabeto.
c. Embora a metodologia utilizada seja considerada adequada para o reconhecimento dos alfabetos manuais, o autor ressalta que por estar condicionado ao alinhamento pareado do algoritmo ICP, o paradigma de Casamento de Modelos é ainda uma limitação identificada para a aplicação do método em contextos de tempo real (> 15 FPS).
Sumário
Este capítulo avaliou como a tecnologia e os avanços científicos podem colaborar para o estudo do movimento nas línguas de sinais, contribuindo para o desenvolvimento das teorias e descrições qualitativas dessas línguas. Tyrone (2001) aceitou o desafio de trabalhar com o movimento, com a prosódia na ASL sob a perspectiva da Fonologia Articulatória e com sistema de captura de movimento. Wilbur e Martinez (2002) também estudaram a prosódia da ASL, investigando, porém o papel de parâmetros físicos, como velocidade, aceleração e jerk (alterações na aceleração por unidade de tempo) em frases. Por outro lado, Moita et. al. (2011) discutiram sobre a complexidade quanto à criação de um avatar e Da Silva Júnior (2014) investiu no desenvolvimento de uma ferramenta que reconheça automaticamente os sinais da ASL e da Libras.
Esses trabalhos evidenciam que a cinemática apresenta elementos para o estudo dos parâmetros físicos do movimento em Libras bem como para a descrição e análise da estrutura linguística dessa língua. Assim, a fim de fundamentar esta pesquisa, no próximo capítulo apresenta-se o instrumental teórico que subsidia a análise desta tese. Para tal propósito, abordamos o funcionamento da linguagem, da cognição e do comportamento motor do ser humano em um escopo mais amplo, o dos Sistemas Dinâmicos e Complexos.
5 SISTEMAS DINÂMICOS COMPLEXOS
Este capítulo apresenta a abordagem teórica assumida nesta tese que consiste na Teoria dos Sistemas Dinâmicos e Complexos (THELEN & SMITH, 1994 e 2007; ELMAN 1995, 1998; PORT & VAN GELDER, 1995; LARSEN-FREEMAN, 1997, 2010; LARSEN- FREEMAN & CAMERON, 2008; BECKNER et. al., 2009; BYBEE, 2010). Nessa proposta a linguagem faz-se compreendida como um conjunto de princípios cognitivos gerais que são compartilhados com outras habilidades de cognição (BYBEE, 2010). Ademais, a linguagem é concebida como parte de um Sistema Dinâmico e Complexo, ou seja, as propriedades desses sistemas só podem ser identificadas durante o comportamento coletivo de suas inúmeras unidades que apresentam um comportamento simples, mas que se influenciam mutua e reciprocamente em uma intrincada rede de conexões, as quais, por consequência, geram determinado comportamento complexo global. Nesse contexto, o adjetivo complexo não tem a acepção de complicado, e sim a de combinação de vários fatores ao evidenciar que um fator apenas não é determinístico para a compreensão do sistema, no qual a dinamicidade indica a evolução e as mudanças ocorridas ao longo do tempo.
O movimento da Libras, foco desta pesquisa, pode ser considerado um Sistema Dinâmico e Complexo, uma vez que apresenta interação entre diversos fatores como os parâmetros físicos do próprio movimento (aceleração, deslocamento, duração, energia, variância e velocidade média), os aspectos inerentes ao sujeito sinalizador (época de aquisição da Libras, sotaque, idade, etc.), elementos relacionados ao uso da língua e ao contexto comunicativo, dentre outros. As próximas seções discorrem acerca dos Processos Cognitivos Gerais e das caraterísticas dos Sistemas Complexos e Dinâmicos.