• Sonuç bulunamadı

V. 2 1 Seleukeia ad Kalykadnos (Silifke)

V.2.14. Sol(o)i-Pompeipolis

A LDA é uma técnica de extração de características que objetiva encontrar um pequeno conjunto de vetores de projeção que reduza a dispersão dos objetos de cada classe enquanto maximiza a separação entre elas. Dessa forma, os métodos de classificação conseguem obter taxas de reconhecimento maio- res. A Análise de Discriminantes Lineares de Duas Classes foi proposta para suprir algumas deficiências da LDA, uma vez que a ausência de amostras adequadas pode levar o algoritmo à perda de eficiência e, se novas classes forem adicionadas ao processo, todo o cálculo deve ser refeito [3]. A principal diferença entre a LDA e a 2C-LDA é a formulação da matriz Sb, matriz que representa a dispersão entre as classes. A 2C- LDA é composta pelas classes C1 e C2, que são definidas a cada momento para cada um dos M indivíduos, de modo que C1 seja formada pelas imagens de treino de um dos indivíduos e C2 seja formada pelo restante das imagens de treino, formando assim um conjunto S = {S1, S2, S3, ..., SM} com M pares de classes Si= (C1i, C2i).

Pelo fato de existirem somente duas classes, o cálculo da matriz Sb pode ser dado como:

Sb= M X i=1 (µ1i− µ2i)(µ1i− µ2i) T , (1)

onde µ1i e µ2i assumem as médias das classes C1 e C2, respectivamente, para cada par Si do conjunto S e M é a quantidade de pares de classes. O cálculo da matriz de dispersão interna das classes, Sw, se mantém como na LDA e pode ser obtido da forma:

Sw= M X i=1 Mi X j=1 (Γij− µi)(Γij− µi) T , (2) onde Γi

j é a j-ésima imagem de treino do i-ésimo indivíduo, µié a média da i-ésima classe, Mié a quantidade de imagens de treino do i-ésimo indivíduo e M é o número de classes.

A representação dos indivíduos do conjunto de entrada é feita através de vetores de projeção, obtidos da forma:

Ui= Sw−1(µ1i− µ2i). (3) Como cada indivíduo i possui seu próprio vetor U de pro- jeção que o discrimina do restante dos indivíduos, algumas vantagens podem ser observadas em relação à LDA:

• O cálculo desses vetores é bem mais simples que o dos vetores de projeção da LDA;

• Não há razão para recálculo, dado que cada indivíduo possui o seu próprio vetor de projeção;

• O cálculo de projeções errôneas devido à baixa quanti- dade de imagens de treino é menos provável de acontecer, uma vez que pelo menos uma das classes possui quanti- dade suficiente de amostras.

Ao se considerar uma nova imagem de teste x, ela é projetada no espaço de decisão de cada indivíduo e sua classificação ocorre calculando-se a distância entre o vetor projetado e as médias µ1e µ2de cada um dos pares de classes. Três situações podem ser observadas:

1) O vetor projetado está mais próximo da classe C1 do que da classe C2 em um único espaço de decisão. Nesse caso, simplesmente assume-se que a identidade do indivíduo testado é a mesma do indivíduo da classe C1.

2) O vetor projetado está mais próximo da classe C1 em mais de um espaço de decisão. Nesse caso, escolhe-se o indivíduo que gera uma maior taxa de confiança de acordo com a equação:

conf (i) = | µ2i− x | | µ1i− x |

, (4)

onde x é a imagem de teste e µ1i e µ2i são as médias µ1 e µ2 do i-ésimo par do subconjunto de S que se enquadrou no caso.

3) O vetor projetado está mais próximo da classe C2 em todos os espaços de decisão. Nesse caso, novamente escolhe-se o indivíduo que gera uma maior taxa de confiança, apesar de isso significar que o indivíduo testado não se pareça com nenhum dos indivíduos. IV. MÉTODOS PROPOSTOS E ARQUITETURA DO SISTEMA

Este trabalho foi motivado pela eficiência das técnicas de pré-processamento utilizadas em [13] e [15], aplicadas antes da extração de características da PCA e da LDA, respectivamente. As técnicas foram adaptadas para sua utilização na 2C-LDA de forma a viabilizar sua execução. Os dois métodos propostos podem ser divididos em etapas, conforme apresentado na

Figura 1. Etapas do processo de reconhecimento

Figura 1. A primeira etapa é o pré-processamento das imagens, no qual são utilizadas as técnicas de Projeção Combinada e Decomposição de Valores Singulares. Na primeira proposta, a Análise de Discriminantes Lineares de Duas Classes com Projeção Combinada (PC-2C-LDA), a imagem criada a partir da projeção combinada é agrupada junto com a imagem de treino original, gerando assim um conjunto com duas imagens que servem de entrada para o extrator de características. Na segunda proposta, a Análise de Discriminantes Lineares de Duas Classes com SVD (SVD-2C-LDA), as imagens obtidas a partir da decomposição de valores singulares compõem um novo conjunto de entrada.

A segunda etapa é a extração de características, onde a 2C- LDA é utilizada para esse fim. Na fase de treino, os vetores de características extraídos são armazenados, enquanto na fase de reconhecimento eles são comparados, através do classifica- dor, aos vetores previamente armazenados. A classificação é efetuada através da distância Euclidiana entre os vetores.

V. EXPERIMENTOS ERESULTADOS

Nesta seção, é avaliada a performance dos métodos propos- tos aplicados ao banco de faces da AT&T [18], ao banco de faces Yale (Yale Face Database) [2] e ao banco de faces Yale B (Yale Face Database B) [19]. Os métodos propostos são comparados com os métodos (PC)2A e SVD-LDA, propostos em [13] e [15], respectivamente.

A. Bancos de Faces

O banco de faces da AT&T, anteriormente conhecido como ORL (Olivetti Research Laboratory) Database of Faces, con- tém um conjunto de imagens adquiridas entre abril de 1992 e abril de 1994. Existem 10 imagens de cada um dos 40 indivíduos. As imagens variam em termos da época em que foram adquiridas, iluminação, expressões faciais (olhos aber- tos/fechados, com/sem sorriso) e detalhes no rosto (com/sem óculos). As imagens possuem tamanho de 92×112 pixels com 256 níveis de cinza. Exemplos de imagens são apresentados na Figura 2.

Figura 2. Exemplos de imagens presentes no banco de faces da AT&T

O banco de faces Yale, da Universidade da Califórnia, San Diego, contém 165 imagens de 320×243 pixels em 256 níveis de cinza obtidas de 15 indivíduos distintos. São 11 imagens por indivíduo contendo expressões faciais (felicidade, tristeza, surpresa, entre outras), iluminação (iluminação central/lateral direita/lateral esquerda) e em detalhes (com/sem óculos). Para os experimentos, as imagens foram rotacionadas, alinhadas pelos olhos e recortadas de modo a conterem 64 pixels de largura por 64 pixels de altura. Exemplos das imagens utilizadas podem ser vistos através da Figura 3.

Figura 3. Exemplos de imagens presentes no banco de faces Yale

O banco de faces Yale B, também da Universidade da Ca- lifórnia, San Diego, contém 16128 imagens de 28 indivíduos sob 9 poses e 64 condições de iluminação diferentes. O banco foi expandido para ser utilizado no trabalho de Lee, Ho e Kriegman [20]. A expansão do banco contém 10 indivíduos

e todas as imagens do banco Yale B foram manualmente alinhadas, recortadas e redimensionadas para 168x192 pixels, totalizando 38 sujeitos. Neste trabalho foram utilizadas so- mente as imagens frontais de cada sujeito, com todas as 64 condições de iluminação, totalizando 2432 imagens. Exemplos das imagens utilizadas nos experimentos são apresentados na Figura 4, onde podem ser verificadas 21 condições de iluminação diferentes para um mesmo indivíduo.

Figura 4. Exemplos de imagens presentes no banco de faces Yale Face Database B

Fonte: Adaptada de [20]

B. Configuração dos Experimentos

Os testes foram conduzidos realizando-se 30 execuções de cada um dos métodos em cada banco de faces, onde foram obtidas aleatoriamente uma amostra por pessoa para constituírem o conjunto de entrada, ficando o conjunto de teste constituído pelas imagens restantes. Nos experimentos, a imagem de entrada foi adicionada também ao conjunto em que foi realizada a extração de características do método SVD- 2C-LDA, gerando o método SVD-2C-LDA+. Essa alternativa é utilizada para verificar a importância da imagem original no processo de reconhecimento. A seguir pode-se verificar os parâmetros definidos neste trabalho para a realização dos experimentos:

• o método (PC)2A possui um parâmetro de combinação α e uma quantidade de eigenfaces M0 a serem defini- dos. Neste trabalho, os parâmetros utilizados foram os recomendados na literatura, α = 0, 25 [13] e M0 uma quantidade tal que capture pelo menos 95% de energia dos eigenfaces [21], ou seja:

M0 X i=1 λi/ M X i=1 λi>95%, (5)

onde λi é o autovalor correspondente ao i-ésimo eigen- face;

• nos métodos SVD-LDA e SVD-2C-LDA é necessário definir a quantidade de fisherfaces a ser utilizada. A quantidade de fisherfaces utilizada é descrita pela Equa- ção 5, de forma similar ao realizado com o (PC)2A. Outro parâmetro a ser configurado é a quantidade de amostras virtuais a serem geradas. Para os experimentos, a quantidade variou de 2 a 5 amostras;

• os parâmetros definidos no SVD-2C-LDA+ são os mes- mos definidos para o SVD-LDA e o SVD-2C-LDA. Entretanto, como a amostra original é acrescentada ao conjunto de treino, a quantidade de amostras virtuais escolhidas para serem geradas variou de 1 a 4;

• o único parâmetro que foi definido para o método PC-2C- LDA foi o parâmetro de combinação α. O valor de α foi definido de forma similar ao realizado para o (PC)2A. A imagem original foi acrescentada à imagem gerada pela Projeção Combinada para compor o conjunto de entrada para a 2C-LDA.

A avaliação dos métodos se baseou na taxa de acerto média e no tempo de execução médio dos algoritmos. A máquina utilizada foi um Notebook com processador Intel Core i5- 3337U 1,8 GHz e 3 MB de memória cache L1, memória RAM DDR3 1333 MHz de 4 GB, 32 GB de SSD e 500 GB de HD funcionando a 7200 rpm sob sistema operacional Windows 8 Pro.

C. Resultados

A Figura 5 ilustra a taxa de acerto média obtida pelos métodos implementados. Para os métodos (PC)2A e PC-2C- LDA, não há variação na quantidade de amostras, portanto, o valor médio apresentado na figura é o valor médio das 30 execuções realizadas. Para os métodos SVD-LDA, SVD-2C- LDA e SVD-2C-LDA+ o valor médio apresentado é o maior valor médio dentre os obtidos ao definir diferentes quantidades de amostras geradas. É possível observar que os métodos propostos lidam bem com variações diversificadas, ficando com taxas de acerto bem próximas (como no banco da AT&T) ou superiores (como no banco Yale) às dos métodos (PC)2A e SVD-LDA.

Figura 5. Taxa de acerto média dos métodos nos bancos de faces

Os resultados são mais expressivos nos experimentos reali- zados com imagens contendo somente variação na iluminação, como as imagens do banco Yale B. Neste caso, os métodos propostos atingem taxas de acerto de 26,42% (SVD-2C-LDA),

28,16% (SVD-2C-LDA+) e 32,47% (PC-2C-LDA), enquanto os métodos tradicionais alcançam somente 8,23% ((PC)2A) e 9,88% (SVD-LDA). Acredita-se que tais resultados se devam ao fato de a 2C-LDA possuir um alto poder de discriminação em relação à LDA, principalmente quando o número de classes é grande [3], o que não é o caso do banco da AT&T e nem do banco Yale. O acrécimo da imagem original ao conjunto de treino foi de fato uma forma de melhoria significativa para o método SVD-2C-LDA, uma vez que em todos os casos o método SVD-2C-LDA+ obteve taxas de reconhecimento maiores.

Na Tabela I podem ser observados os resultados relacio- nados ao tempo de processamento médio dos métodos. Pela tabela, percebe-se que, o tempo de execução dos métodos presentes na literatura e dos métodos propostos são similares para qualquer um dos bancos. Era esperado que o algoritmo (PC)2A que é baseado na PCA fosse mais rápido que os baseados na LDA, pois, para sua execução a LDA utiliza pre- viamente a PCA para reduzir a dimensionalidade das imagens. A decomposição de valores singulares é uma tarefa de custo computacional mais alto que a projeção combinada e, esse é o motivo de os tempos de execução dos métodos com SVD no pré-processamento serem mais altos.

As Figuras 6 a 9 representam o resultado de execução dos métodos implementados, onde a imagem da esquerda sempre representa a imagem de teste e a imagem da direita sempre representa o resultado da classificação. Para as Figuras 8 e 9, as imagens superiores representam o resultado dos métodos presentes na literatura e as inferiores representam o resultado dos métodos propostos neste trabalho.

Na Figura 6 pode-se verificar que, para imagens com pouca variação, todos os métodos classificam corretamente a imagem de teste.

Figura 6. Exemplo de execução onde todos os métodos comparados classificam corretamente a imagem de teste (esquerda) como sendo da classe da imagem à direita.

Na Figura 7, pode-se verificar que, para imagens com va- riações drásticas de iluminação, todos os métodos classificam erroneamente a imagem de teste.

As Figuras 8 e 9 mostram exemplos de variação de ilumi- nação onde os métodos propostos obtêm melhores resultados que os disponíveis na literatura.

De modo geral, os métodos propostos são superiores em cenários onde a variação de iluminação é mediana, apresen- tando sombras resultantes de iluminação direcionada. Esses resultados são relevantes, uma vez que cenas com iluminação direcionada são comuns em diversas aplicações reais.

Figura 7. Exemplo de execução onde todos os métodos comparados classificam incorretamente a imagem de teste (esquerda) como sendo da classe da imagem à direita.

Figura 8. Exemplo de execução com divergência de resultados. Na linha superior é mostrado o resultado da execução do método (PC)2A que classifica

incorretamente a imagem de teste (esquerda) como sendo da classe da imagem à direita. A linha inferior mostra o resultado da execução do método proposto PC-2C-LDA que classifica corretamente a imagem de teste (esquerda) como sendo da classe da imagem à direita.

VI. CONCLUSÕES

Neste trabalho foram apresentados dois novos métodos, o PC-2C-LDA e o SVD-2C-LDA, com o objetivo de se contornar o problema da limitação de imagens disponíveis para treino, nas técnicas existentes de reconhecimento de faces. Os métodos propostos foram comparados a outros já conhecidos na literatura para resolução do problema. Pôde-se verificar que a taxa de acerto dos métodos propostos foi superior às dos métodos tradicionais, principalmente quando foram realizados testes com variações de iluminação. Embora um maior número de experimentos seja necessário para se comprovar a eficiência do método, os resultados alcançados com a base de dados pública Yale B são animadores, uma vez que as diferenças de iluminação são uns dos principais fatores que reduzem as taxas de acerto dos reconhecedores de faces disponíveis na literatura.

Tabela I

TEMPO DE EXECUÇÃO MÉDIO DOS MÉTODOS(EM SEGUNDOS)EM CADA BANCO DE FACES

Banco/Método (PC)2A SVD-LDA SVD-2C-LDA SVD-2C-LDA+ PC-2C-LDA

AT&T 5,47 3,49 3,48 3,75 1,66

Yale 0,76 0,40 0,41 0,41 0,23

Yale B 7,69 23,40 24,13 24,61 12,50

Figura 9. Exemplo de execução com divergência de resultados. Na linha superior é mostrado o resultado da execução do método SVD-LDA que classifica incorretamente a imagem de teste (esquerda) como sendo da classe da imagem à direita. A linha inferior mostra o resultado da execução do método proposto SVD-2C-LDA que classifica corretamente a imagem de teste (esquerda) como sendo da classe da imagem à direita.

ACKNOWLEDGMENT

Gostaríamos de agradecer às instituições financiadoras dessa pesquisa: o Fundo de Incentivo à Pesquisa (FIP/PUC-Minas) e; o Fundação de Amparo à Pesquisa de Minas Gerais (FA- PEMIG/CNPq).

REFERÊNCIAS

[1] X. Tan, S. Chen, Z.-H. Zhou, and F. Zhang, “Face recognition from a single image per person: A survey,” Pattern Recognition, vol. 39, no. 9, pp. 1725–1745, september 2006.

[2] P. Belhumeur, J. Hespanha, and D. Kriegman, “Eigenfaces vs. fisherfa- ces: recognition using class specific linear projection,” Pattern Analysis and Machine Intelligence, IEEE Transactions, vol. 19, no. 7, pp. 711– 720, july 1997.

[3] H. K. Ekenel and R. Stiefelhagen, “Two-class linear discriminant analysis for face recognition,” Signal Processing and Communications Applications, 2007. SIU 2007. IEEE 15th, pp. 1–4, june 11-13 2007. [4] R. Brunelli and T. Poggio, “Face recognition: features versus templates,”

Pattern Analysis and Machine Intelligence, IEEE Transactions, vol. 15, no. 10, pp. 1042–1052, october 1993.

[5] W. W. Bledsoe and H. Chan, “A man-machine facial recognition system-some preliminary results,” Panoramic Research, Inc., Palo Alto, California, Tech. Rep. pri 19a, 1965.

[6] W. W. Bledsoe, “Man-machine facial recognition: Report on a large- scale experiment,” Panoramic Research, Inc., Palo Alto, California, Tech. Rep. pri 22, 1966.

[7] ——, “Semiautomatic facial recognition,” Stanford Research Institute, Menlo Park, California, Tech. Rep. sri project 6693, 1968.

[8] L. Wiskott, J.-M. Fellous, N. Kruger, and C. Von der Malsburg, “Face recognition by elastic bunch graph matching,” Image Processing, 1997. Proceedings., International Conference, vol. 1, pp. 129–132, october 26-29 1997.

[9] M. A. Turk and A. P. Pentland, “Eigenfaces for recognition,” J. Cognitive Neuroscience, vol. 3, no. 1, pp. 71–86, Jan. 1991. [Online]. Available: http://dx.doi.org/10.1162/jocn.1991.3.1.71

[10] T. Ahonen, A. Hadid, and M. Pietikainen, “Face recognition with local binary patterns,” in Computer Vision - ECCV 2004, ser. Lecture Notes in Computer Science, T. Pajdla and J. Matas, Eds. Springer Berlin Heidelberg, 2004, vol. 3021, pp. 469–481. [Online]. Available: http://dx.doi.org/10.1007/978-3-540-24670-1_36

[11] M. Agarwal, H. Agrawal, N. Jain, and M. Kumar, “Face recognition using principle component analysis, eigenface and neural network,” Signal Acquisition and Processing, 2010. ICSAP ’10. International Conference, pp. 310–314, february 9-10 2010.

[12] J. Li-Li, L. Kun, and Y. Shuang, “Face recognition based on support vector machines,” Computational Intelligence and Design (ISCID), 2012 Fifth International Symposium, vol. 1, pp. 115–119, october 28-29 2012. [13] J. Wu and Z.-H. Zhou, “Face recognition with one training image per person,” Pattern Recognition Letters, vol. 23, no. 14, pp. 1711–1719, december 2002.

[14] S. Chen, D. Zhang, and Z.-H. Zhou, “Enhanced (pc)2 a for face recognition with one training image per person,” Pattern Recognition Letters, vol. 25, pp. 1173–1181, july 10 2004.

[15] Q.-X. Gao, L. Zhang, and D. Zhang, “Face recognition using flda with single training image per person,” Applied Mathematics and Computation, vol. 205, no. 2, pp. 726 – 734, 2008, <ce:title>Special Issue on Advanced Intelligent Computing Theory and Methodology in Applied Mathematics and Computation</ce:title>. [Online]. Available: http://www.sciencedirect.com/science/article/pii/S0096300308003512 [16] D. Zhang, S. Chen, and Z.-H. Zhou, “A new face recognition method

based on svd perturbation for single example image per person,” Applied Mathematics and Computation, vol. 163, no. 2, pp. 895 – 907, 2005. [Online]. Available: http://www.sciencedirect.com/science/article/ pii/S0096300304002681

[17] M. Kirby and L. Sirovich, “Application of the karhunen-loeve procedure for the characterization of human faces,” Pattern Analysis and Machine Intelligence, IEEE Transactions on, vol. 12, no. 1, pp. 103–108, 1990. [18] F. S. Samaria, F. S. S. *t, A. Harter, and O. A. Site, “Parameterisation

of a stochastic model for human face identification,” 1994.

[19] A. Georghiades, P. Belhumeur, and D. Kriegman, “From few to many: Illumination cone models for face recognition under variable lighting and pose,” IEEE Trans. Pattern Anal. Mach. Intelligence, vol. 23, no. 6, pp. 643–660, 2001.

[20] K. Lee, J. Ho, and D. Kriegman, “Acquiring linear subspaces for face recognition under variable lighting,” IEEE Trans. Pattern Anal. Mach. Intelligence, vol. 27, no. 5, pp. 684–698, 2005.

[21] S. Gong, S. J. McKenna, and A. Psarrou, Dynamic Vision: From IImage to Face Recognition. Imperial College Press, 2000.

Efficent rendering approach for visualization of large

Benzer Belgeler