• Sonuç bulunamadı

BULGULAR VE YORUM

4.1. ÖĞRENCİ ÜRÜNLERİNE YÖNELİK BULGULAR

4.1.2 İkinci Haftanın Bulguları

Em (ARBUCKLE, LANGE et al., 1995) é apresentada uma técnica que combina i- magens em diversas resoluções. Para isso, inicialmente, das imagens adquiridas com tamanho 160 x 120 pixels são geradas imagens novas com resoluções menores aplicando a média sobre blocos de 2 x 2, 3 x 3, 4 x 4 e 5 x 5 pixels da imagem, obtendo-se assim quatro imagens novas com 80 x 60, 53 x 40, 40 x 30 e 32 x 24 pixels, respectivamente. Em seguida, são gerados vetores de atributos descritivos das imagens pela concatenação de coeficientes de autocorrela- ção local de ordem zero, um e dois (Figura 3.16), aplicando a equação

= 1 + , + ( ) =0 −1 =2 −1 =2 ,

onde é uma imagem em 256 tons de cinza, e são as dimensões da imagem, são os ker- nels de autocorrelação definidos como conjuntos de ( ) + 1 pares que representam um deslocamento do pixel central definidos por , = −1, 0, 1 ∗ −1, 0, 1 , ( ) é a ordem de autocorrelação e ( ) é uma constante de normalização definida por

= − 2 − 2 (21 8

− 1) + 1.

Figura 3.16. Kernels de autocorrelação de zero a segunda ordem. Adaptado de (ARBUCKLE, LANGE et al., 1995).

A etapa de treinamento consiste de dois passos:

1) Para cada resolução separadamente, é aplicado o algoritmo clustering LDA sobre os dados do conjunto de treinamento a fim de obter matrizes de mapeamento para um espaço que maximiza a variância interclasses enquanto minimiza a variância intraclasses. A seguir, com os dados de treinamento mapeados nos seus respectivos espaços LDA, são encontra- dos o vetor média (centro) de cada classe;

2) Esta etapa pode ser sub-dividida em outras duas:

a) Utilizando o conjunto de teste mapeado no espaço LDA determinado na etapa anterior é realizada a classificação das faces calculando a distância Euclidiana entre cada vetor de teste e o centro de cada classe (obtidos no passo anterior). Para cada vetor de teste, as duas menores distâncias 1 e 2, respectivamente, são utilizadas para calcular a medida de contraste dada por

= 2− 1 1 + 2.

Essa medida será utilizada para verificar a aceitação ou rejeição da classificação de acordo com um limiar. Se a medida for maior que o valor do limiar, essa amostra de teste é classificada como pertencente à classe que gerou a menor distância. Caso con- trário, essa amostra é rejeitada. Dessa forma, conseguimos calcular as taxas de reco- nhecimento correto ( ) e aceitação falsa ( ) para cada resolução;

b) Finalmente, utilizando as taxas obtidas no passo anterior podemos calcular as densida- des de medida Fuzzy usando a seguinte equação

= 1− (

2 + 1 − 2)

2 .

Durante a etapa de teste, inicialmente, as densidades de medida Fuzzy são escaladas utilizando ou a soma de todos os elementos de ou a soma de todos os e as distâncias de cada vetor do conjunto de teste mapeado no espaço LDA para os centros de cada classe e cada resolução são normalizadas utilizando a equação

= 1 1

=1

onde é o número de distâncias indexadas pela classe . Dessa forma, obtemos valores na faixa [0, 1], condição necessária para a aplicação das integrais de Sugeno (SUGENO, 1974) e Choquet (CHOQUET, 1953), que são funções não-lineares Fuzzy responsáveis por realizar a fusão da decisão dos classificadores (um classificador para cada resolução). A integral de Su- geno de uma função com relação à medida fuzzy sobre um conjunto de fontes (distân- cias normalizadas, nesse caso) é definida por

1 , 2 , … , ≝ ( )) =1

.

Enquanto a integral de Choquet é definida por

1 , 2 , … , ≝ − −1 . ( ) =1

,

onde corresponde ao conjunto das últimas – + 1 fontes em que pode ser denotado por = , +1 ,… , e a medida Fuzzy ( ) é obtida utilizando a seguinte con- dição

= + + , > −1, , ∈ 2 ,

Sendo que é determinado pela equação abaixo, selecionando o único valor que satisfaz > −1 e ≠ 0

(1 + (

=1

)) = + 1.

Para essas integrais, as melhores medidas são as de maior valor. Assim, um valor de integral para cada classe conhecida é obtido e são selecionados o maior d2 e o segundo maior valor d1 para calcular a medida de contraste1. Se o valor dado pela medida de contraste for maior que o valor de um limiar, esse vetor de teste é classificado como pertencente à classe que gerou o maior valor de integral (d2). Caso contrário, é rejeitado. O valor do limiar é dado pela maximização da seguinte equação

1 A definição da medida de contraste contempla as menores distâncias – que são as melhores – mas agora é adap-

= 1− 1 −

2 + 2

2 .

São verificados dois esquemas: o esquema 1 é o apresentado acima, que utiliza o con- junto de treinamento para obter o mapeamento para o espaço LDA e o de teste para obter tan- to as densidades de medida Fuzzy quanto para testar o método e o esquema 2 consiste em utilizar o conjunto de teste para obter o mapeamento para o espaço LDA, obter as densidades de medida Fuzzy e testar o método. Entretanto, na fase de testes o mapeamento LDA utilizado é obtido do conjunto de treinamento, ou seja, antes da etapa de teste existe uma nova etapa de treinamento do mapeamento LDA. É importante notar que em ambos teremos algum bias adicionado, pois “o treinamento ou fornecerá conhecimento adicional das faces conhecidas ou da distribuição das faces desconhecidas” (ARBUCKLE, LANGE et al., 1995).

Para avaliação do resultado foi utilizado um banco de dados de imagens de face pró- prio com 11.600 imagens de face frontais em tons de cinza de tamanho 160 x 120 pixels, sen- do 100 imagens para cada um dos 116 indivíduos e com pequenas variações de pose (cerca de 15º). O conjunto foi dividido igualmente entre amostras de treinamento e teste, porém somen- te as amostras dos primeiros 60 indivíduos foram utilizadas para o treinamento. Alguns e- xemplos de indivíduos e variações de um mesmo indivíduo desse banco de dados são apresen- tados na Figura 3.17. E os melhores resultados obtidos nesse banco de dados foram 98,4% e 97,9 % de taxa de acerto, utilizando os esquemas 1 e 2, respectivamente e Integral de Sugeno. Essa técnica mostrou-se robusta a deslocamentos.

(a) (b)

Figura 3.17. Exemplos de imagens no banco de dados: a) individuos diferentes; b) mesmo indivíduo. Extraído de (ARBUCKLE, LANGE et al., 1995).

Em (ACHERMANN e BUNKE, 1996a) e (ACHERMANN e BUNKE, 1996b), diver- sas combinações de eigenfaces e Modelos Ocultos de Markov (HMM) são relatadas. Para permitir a aplicação do HMM, uma etapa de pré-processamento consistindo de equalização de histograma e normalização da largura é necessária. Além disso, como o HMM normalmente trabalha com sinais unidimensionais, a extração de atributos é feita por uma janela deslizante (sentido vertical) que cobre toda a largura da imagem e contém alguma sobreposição (para manter alguma informação contextual e evitar o corte de atributos de face significativos), sen- do que o vetor de atributos corresponde aos valores de intensidade na janela deslizante. A idéia por trás disso é aproveitar a propriedade de que regiões faciais (testa, olhos, boca) são “identificáveis por um humano mesmo quando a imagem da face é dividida em janelas desli- zantes como descrito acima”. Dessa forma, uma face humana pode ser representada por um modelo linear consistindo de cinco estados correspondendo a componentes faciais (1 = testa, 2 = olhos, 3 = nariz, 4 = boca e 5 = queixo) como mostrados na Figura 3.18. Finalmente, para a combinação foram analisados os seguintes combinadores: Votação por Maioria, Votação Consensual, Votação por Maioria Ponderada, Regra da Soma para Score e Rank e Regra do Produto. Antes de combinar os scores obtidos dos dois classificadores (distância Euclidiana e probabilidades para eigenfaces e HMM, respectivamente), eles precisam ser normalizados para um mesmo domínio. Para isso, foram analisadas quatro transformações: linear, logarít- mica, exponencial e logística. Para a avaliação dos resultados um banco de dados próprio con- tendo 10 imagens em tons de cinza de cada um dos 30 indivíduos com variações de pose e dimensão de 512 x 342 pixels. Como exemplo, as amostras de um indivíduo do banco de da- dos são mostradas na Figura 3.19. O conjunto foi dividido ao meio em conjunto de teste e treinamento, ou seja, 5 imagens de cada indivíduo para treinamento e outras 5 para teste. O melhor resultado relatado foi 98,7% (considerando o primeiro rank) obtido pela utilização da Regra da Soma do Score e transformação logarítmica.

Figura 3.18. Modelo Esquerda-Direita de Face Humana Linear, onde representa a probabilidade de transição do estado ao e representa a probabilidade de emissão de saída num estado . Extraído de (ACHERMANN

Figura 3.19. Exemplos de um indíviduo no banco de dados. Adaptado de (ACHERMANN e BUNKE, 1996a).

Em (TOLBA e ABU-REZQ, 2000), um combinador baseado em regras é desenvolvido para combinar duas redes neurais: um classificador de Quantização Vetorial por Aprendizado (LVQ) e um classificador de Função de Base Radial (RBF). O conjunto de treinamento é dividido entre os classificadores neurais após treinar o LVQ (foi escolhido por apresentar maior taxa de classificação correta se comparado ao RBF) com todo o conjunto de treinamento e testá-lo no conjunto de teste, a fim de determinar quais classes são influenciadas por outras e quais não. Dessa forma, o conjunto de treinamento pode ser separado no grupo classificado corretamente (DC) e no grupo classificado erroneamente (FC), juntando-se a esse último as classes familiares e que interferiram na classificação. Ao grupo FC são incluídas um conjunto de amostras sintetizadas aplicando o LVQ (com 1 neurônio na camada escondida e 1 neurônio na camada de saída) entre as amostras das classes familiares a fim de aumentar a robustez do sistema. Alguns exemplos de faces sintetizadas pela técnica acima são mostradas na Figura 3.20. O grupo FC final é utilizado para treinar uma rede RBF e o DC é utilizado para treinar uma nova rede LVQ. Para combinar a saída dessas duas redes, são utilizadas as seguintes regras: 1) Rejeitar o padrão quando o LVQ rejeitá-lo; 2) Associar o padrão à classe determinada pelo LVQ quando a saída do RBF associá-lo à mesma classe ou o RBF rejeitá-lo; 3) Associar o padrão à classe determinada pelo RBF quando o LVQ associá-lo a uma classe diferente. Utilizando o banco de dados ORL dividido igualmente em conjunto de treinamento e teste, com as faces interpoladas utilizando o interpolador de vizinho mais próximo para um tamanho de 32 x 32 pixels aplicando-se antes um filtro passa-baixas (a idéia é “reduzir o efeito dos padrões de Moiré e os padrões ripple que resultam do aliasing durante a reamostragem”), e arquiteturas 1024-1200-40 e 1024-200-40, respectivamente para LVQ (com taxa de aprendizado de 0,5 e 8000 épocas de treinamento) e RBF (com constante spread igual 5) obteve uma taxa de classificação correta de 99,5% e 0,5% de rejeição. Foi relatado também, que utilizando de 6 a 8 amostras por classe no treinamento a taxa de classificação

correta foi de 100%, entretanto, o classificador individual LVQ já atingia essa taxa. Essa técnica apresentou-se bastante robusta a variações na pose e em expressões faciais.

Figura 3.20. Exemplo de faces geradas artificialmente usando uma rede LVQ. Retirado de (TOLBA e ABU- REZQ, 2000).

Marcialis e Roli propuseram combinar as técnicas estatísticas bem-conhecidas

eigenfaces e fisherfaces (MARCIALIS e ROLI, 2002; MARCIALIS e ROLI, 2003). Como

apresentado na Figura 3.21, as faces do banco de dados são projetadas nos espaços LDA e PCA. Para a combinação foram propostas duas abordagens KNN e Média Mais Próxima (NM). A geração dos vetores de distância e depende da regra de combinação a ser utilizada. Para o KNN, as distâncias são calculadas para cada amostra no conjunto de treinamento em seu respectivo espaço, ou seja, (como mostrado na Figura 3.21) é igual ao número de amostras no conjunto de treinamento. Caso a combinação utilizada seja o NM, a distância é calculada com relação aos vetores média de cada classe no seu respectivo espaço, ou seja, N é igual a C, onde C é o número classes. Antes de realizar a combinação, todas as distâncias são normalizadas para [0, 1]. A combinação é dividida em duas etapas: 1) geração de um vetor de distância combinado que deverá conter as informações de ambos os espaços e 2) aplicação do KNN ou NM. Para gerar o vetor de distância são utilizados um dos dois modos seguintes: a) Média: = 1 + 1 2 ,… , + 2 ; b) União (Append): = 1 ,… , , 1 ,… , .

Dessa forma, temos 4 combinações diferentes denominadas M-KNN, A-KNN, M-NM, A-NM. Essas combinações foram testadas com as bases de faces ORL e Yale. Para o ORL, utilizando metade do conjunto para treinamento e metade para teste foi obtida uma taxa de reconhecimento médio de 97,25% usando o esquema M-KNN com 119 componentes principais e 39 para o LDA. Já para a base Yale, foi relatada uma taxa de reconhecimento médio de 84,22% usando o esquema A-KNN com 33 componentes principais e 14 para o LDA, sendo que para treinamento e teste foram utilizados 5 e 6 imagens por classe, respectivamente. As taxas de reconhecimento relatadas correspondem à média de 10 repetições do experimento, cada uma com uma partição aleatória do conjunto de teste.

Figura 3.21. Metodologia de fusão proposta por Marcialis e Roli. Adaptado de (MARCIALIS e ROLI, 2002).

Em (MARCIALIS e ROLI, 2004), o algoritmo acima foi também aplicado à base de dados do MIT, obtendo uma taxa de reconhecimento médio de aproximamente 79% com o esquema A-KNN. O conjunto de treinamento era constituído das imagens mais próximas e mais distantes da câmera e o de teste pelas intermediárias.

Ryu e Oh (RYU e OH, 2002) propusem uma abordagem em regras para combinar um classificador de Ângulo de Atributos Mais Próximo (NFA) e um ensemble de redes neurais MLP treinadas pelo algoritmo Resilient Backpropagation (ERN), com ambos os classificadores aplicados no espaço PCA. A medida de similaridade utilizada em todo o sistema é uma medida de ângulo de atributos e é definida como

, , = cos � = . , �� �,… , � � � � � �,… , � � � Representação PCA Representação LDA Ba nc o de d ad os d e im ag en s n os espa ço s LDA e PCA CO MBINA DO R

onde = − e = − . A classificação por NFA é dada pela classe da amostra que maximiza a medida de similaridade acima e pode ser denotada como

, ∗ ∗

, = max

1 max+ ( , , ) ,

onde é a face de teste, é o número de classes, é o número de amostras da classe , é o número de amostras virtuais da classe , é o vetor nulo, são os protótipos da classe e ∗

é o protótipo mais similar a . Essas amostras virtuais são geradas com a finalidade de contemplar mais variações da face e, em consequência, ampliar a robustez contra variações e aumentar o desempenho da classificação. Para gerar essas amostras virtuais, considere a Figura 3.22. São considerados dois tipos de regiões A e B, esparsa e densa, respectivamente. Para uma região esparsa A, onde 1, 2, , uma amostra virtual 1 pode ser gerada

como

1 = 1+ 2− 1 ,

e para uma região densa B, onde 3, 4, > , uma amostra virtual 2 pode ser gerada

seguindo

2 = 4+ ( − 4)

= 2+ ( 3− 2),

onde 1, 2, 3 e 4 são amostras do conjunto de treinamento de uma determinada classe, é igual a 0,5. Uma outra forma de gerar amostras virtuais é simplesmente espelhando a amostra da classe.

O classificador ERN é composto por redes MLP (FRN) (como pode ser visto na Fi- gura 3.23). Cada rede é treinada individualmente, sendo que a face mais frontal é selecionada como a face desejada (ou alvo), ou seja,

≅ , = ( ),

onde = 1, 2, . . . , , é o número de FRNs e i = 1, 2, . . . , + e (. ) é a função de mapeamento da -ésima FRN. A respostas das FRN podem ser fundidas calculando-se a média, isto é,

≅ = 1 , =1

.

Figura 3.22. Exemplo de distribuição do conjunto de treinamento e geração de amostras virtuais. Retirado de (RYU e OH, 2002).

E finalmente, a classificação realizada pela ERN é dada por

, ∗ , = max1 ( , , ),

onde é a amostra de teste aplicada à ERN, é a média das faces frontais frontais , ∗ é a amostra frontal da classe que maximiza a equação acima e fornecerá, portanto, o seu rótulo a . Enfim, para combinar a saída das duas fontes utiliza-se a seguinte regra de combinação ∗ = , se = ∗ ∗ , se , , , ∗ ∗ , , ∗ ≠ ∗ ∗ , se , , < , ∗ ∗ , , ∗ ≠ ∗

Essa técnica foi aplicada ao banco de dados ORL, sendo dividido ao meio entre amostras de teste e treinamento (sendo que a amostra frontal e uma semi-frontal devem ser garantidas no conjunto de treinamento). Dessa forma, foi atingida uma taxa de reconhecimento de 96,33%, com = 0,5, sendo 5 FRNs ( = 5) com 2 camadas escondidas cada e configurações nas camadas escondidas 150-150, 80-80, 50-200, 150-200 e 80-100,

respectivamente. Além disso, a taxa de aprendizado das FRNs foi 0,2, 50 componentes principais foram utilizados e foi tentado restringir o tamanho máximo de cada classe a 40 amostras por classe (ou seja, foram geradas no máximo 30 amostras virtuais por classe).

Figura 3.23. Arquitetura da ERN. Retirado de (RYU e OH, 2002).

Um novo esquema de combinação baseado em algoritmo genético foi apresentado em (JING e ZHANG, 2003). A fim de aumentar o desempenho da combinação são utilizadas diferentes fontes de informação. Para isso, às imagens é aplicada a Transformada Wavelet Ortogonal de Daubechies, o que resulta em 4 sub-imagens diferentes descorrelacionadas. Em seguida, são extraídas Fisherfaces separadamente considerando cada subimagem e, finalmente, um classificador NN é utilizado. O combinador proposto para fundir a saída desses 4 classificadores é denominado Critério Máximo de Complementaridade (MCC). Esse combinador utiliza uma medida de correlação , entre dois classificadores e como

, = = − − =1 = 1− =1 − =1 =1 + =1 ,

onde , denotam o -ésimo e o -ésimo componente de , , são o -ésimo e o - ésimo componente de , é o número de classes, sendo que e são ordenados em ordem decrescente de similaridade, ou seja, as mínimas distâncias primeiro. Para o cálculo da correlação, caso os primeiros componentes de e fossem de classes diferentes, esses componentes não eram utilizados no seu cálculo, pois é dada mais importância a eles (veja o cálculo do peso ) e o seu valor de seria 0. O critério de combinação final (MCC) será utilizado em um algoritmo genético para determinar os pesos para os classificadores e é calculado pelas seguintes equações

= max =1 = max ( • ) =1 = 0− 0 = 1,2, 1,3,… , 1, , 2,3, 2,4,… , 2, ,… , −2, −1, −2, , −1, = 1− 2 1− ,

onde é o número de amostras de treinamento, é a i-ésima amostra de treinamento, é a complementaridade entre os classificadores, é o grau de correção do resultado combinado, é o grau total de descorrelacionamento dos classificadores, é o número de classificadores, 1, 2, são os 2 componentes mais prováveis e a média de um resultado

combinado correto (vide referência para maiores detalhes) e foi definido experimentalmente como 0,5. Um dos bancos de dados de imagens faciais NUST603 foi utilizado. Ele contém 18 indivíduos com 12 imagens faciais de 64x64 pixels por indivíduo (algumas amostras são exibidas na Figura 3.24). Foram realizadas seleções aleatórias de 3 amostras por classe para treinar os classificadores, outras 3 por classe para calcular o MMC e os pesos para os classificadores usando algoritmos genéticos e o restante para calcular a taxa de reconhecimento. Executando cada experimento 10 vezes, foi obtida uma taxa de reconhecimento de 96,4%. Foi relatada também a comparação com os combinadores de Votação por Maioria e a Regra de Taxa de Erro Mínimo, porém estas com taxas de reconhecimento menores.

Lu e seus colaboradores (LU, WANG et al., 2003) utilizaram a Regra da Soma e a uma rede neural RBF para combinar 3 classificadores de face baseados nas técnicas de extração de atributos PCA, ICA e LDA. Para comparar duas faces, a medida de similaridade

utilizada é a distância do cosseno. Foi gerado um banco de dados próprio coletando imagens de face de outros 4 bancos de dados públicos: ORL, Yale, AR e NLPR+MSU. Essa base é composta por 206 indivíduos com 10 amostras cada e as imagens tem tamanho 42 x 42 pixels. Alguns exemplos de imagens faciais são apresentados na Figura 3.25. Foram utilizadas 9 amostras para treinamento e 1 para teste, sendo executados 10 experimentos trocando-se a partição de forma que toda amostra tenha sido utilizada para teste. Assim, a melhor taxa de reconhecimento média relatada foi 90,2% utilizando a RBF como combinador.

Figura 3.24. Algumas amostras de um indivíduo do banco de dados NUST603. Retirado de (JING e ZHANG, 2003).

a) b) c) d)

Figura 3.25. Exemplos de imagens faciais na base de dados: a) ORL, b) Yale, c) AR e d) NLPR+MSU. Retirado de (LU, WANG et al., 2003).

Kim e Kittler investigaram algumas técnicas a fim de fornecer um reconhecimento de face invariante à pose (KIM e KITTLER, 2004; 2006). Segundo eles, os “métodos de reconhecimento de face invariante à visão existentes podem ser geralmente decompostos em três passos sequenciais: representação, transformação de visão e função de discriminação”. A fim de satisfazer esses passos, foram propostos 4 classificadores base. O primeiro deles utilizava PCA para representação, uma técnica de Matriz Linear (LM) para aprender uma função de transferência entre faces rotacionadas e face frontal e que minimiza o MSE e, finalmente, o LDA é escolhido como função discriminante. Esse método é chamado PCA- LM-LDA. O segundo, denominado Análise de Discriminante Linear Localmente (LLDA), foi

proposto de forma a suprir o problema de suboptimalidade do primeiro, causado pela realização dos 3 passos individualmente. O LLDA consiste de um framework unificado para os 3 estágios. Ele “encontra concorrentemente o conjunto de transformações lineares localmente a fim de obter classes de face transformadas linearmente e localmente que maximizam a covariância entre classes enquanto minimiza a covariância dentro da classe”, como é exibido na Figura 3.26. O terceiro classificador proposto difere do primeiro por aplicar uma função de kernel que transforma o espaço de entrada num de mais alta dimensão de tal modo que nessa nova dimensão os dados possam ser separados linearmente. Essa técnica é denominada Análise de Discriminante Generalizado (GDA) e um kernel RBF foi utilizado como função de transformação. E por último, uma técnica baseada em Look-Up

Table (LUT) é proposta para gerar imagens virtuais rotacionadas a partir da imagem original

como mostrado na Figura 3.27. LDA é utilizado como função discriminante. Todos esses classificadores base possuem ao final vetores de atributos no espaço Euclidiano e devem ser normalizados para o intervalo [0, 1]. Esses classificadores foram combinados utilizando 6 combinadores: Regra do Produto, Regra da Soma, Regra da Soma Ponderada, Regra do Máximo, Regra do Mínimo e Regra da Mediana. Aplicando-os sobre a base de dados XM2VTS, foi obtida uma taxa média de reconhecimento correto (considerando as diferentes visões) de 73,2% para faces da mesma sessão e 54,4% (KIM e KITTLER, 2004) para sessões diferentes com as Regras da Soma e Soma Ponderada. As imagens foram redimensionadas para 46 x 56 pixels e a base de dados foi dividida em 125 pessoas, 45 pessoas e 125 pessoas para conjuntos de treinamento, avaliação e teste respectivamente. Para o conjunto de teste a face frontal F-S1 foi utilizada como galeria e as restantes como consulta. Em (KIM e KITTLER, 2006) foram relatados 70% e 42% para faces da mesma sessão e sessões diferentes sobre classes de face rotacionadas por mais de 30º da imagem frontal, respectivamente.

Figura 3.26. Classificação de face usando o LLDA. A distribuição original dos dados e a distribuição transformada são exibidas do lado esquerdo e direito, respectivamente. Retirado de (KIM e KITTLER, 2004).

Figura 3.27. Geração de Visão Virtual Rotacionada usando LUT 3D. Adaptado de (KIM e KITTLER, 2004).

Em (ZHANG, SHAN et al., 2004) são propostos dois esquemas de fusão de nível de atributos e uma fusão em nível de decisão. Para todas as fusões são utilizadas imagens de