Wang e Bovik (2002b) reportam que a principal função do olho humano é extrair informação estrutural e as imagens degradadas comprometem a capacidade do HVS interpretar corretamente a cena registrada.
Em geral, as imagens digitais estão sujeitas a degradações durante sua aquisição, processamento, armazenamento, transmissão e reprodução. Como pode ser observado no detalhe da Figura 2.2 (b), a proximidade entre os valores de intensidade de pixels vizinhos permite a percepção de estruturas circulares que definem os componentes elementares de um olho humano, das extremidades para o centro: globo ocular, íris e pupila. As imagens das Figuras 2.2 (c) e (d) ilustram como a degradação por ruído gaussiano de média µ e desvio padrão σ é capaz de modificar as estruturas de uma imagem, neste caso, podendo torná-la incompreensível. Percebe-se que o ruído altera a relação entre as intensidades das estruturas vizinhas, que antes formavam um arranjo estrutural homogêneo. A compreensão do objeto fica bastante prejudicada conforme aumenta o grau de degradação, ilustrado na Figura 2.2 (d). Neste exemplo, os valores de EQM e pico da relação sinal-ruído (PSNR, do inglês peak signal-to-noise ratio) foram utilizados para fornecer uma medida da degradação.
(a) (b) (c) (d)
Figura 2.2: Exemplo de degradação estrutural causada pela contaminação por ruído gaussiano. (a) Região em destaque. (b) Sem ruído. (c) µ = 0, σ = 0,002, PSNR = 30,3, EQM = 60,8. (d) µ = 0, σ = 0,02, PSNR = 19,9, EQM = 655,4.
A classificação da informação observada em “ruído” ou detalhe “relevante” depende da interpretação do observador. As técnicas de filtragem e análise de imagens devem, em algum nível, corresponder a essa subjetividade (SETHIAN, 1999). O desenvolvimento ou escolha da técnica de filtragem mais adequada pode ser positivamente influenciada por uma análise prévia da imagem, principalmente quando há disponível algum método computacional de avaliação capaz de aproximar-se da avaliação subjetiva da visão.
O reconhecimento de objetos é outro importante aspecto da percepção visual (ULLMAN, 1996). Segundo Haralick e Shapiro (1992), reconhecer um objeto em uma imagem significa conhecê-lo quando é visto de uma orientação particular. Uma
das etapas da tarefa de reconhecer objetos consiste em conseguir interpretá-los no todo ou em partes. Por isso, a segmentação automática, também possui fundamental importância para a análise de uma imagem por meio de visão computacional. Zhang (1996) afirma que muitos autores concordam que o desempenho do processo de segmentação possui influência direta no resultado de um sistema de visão.
O reconhecimento de objetos e a interpretação de cenas por meio da visão computacional apresenta inúmeros desafios. Fatores adversos da aquisição de imagens digitais influenciam negativamente no desempenho dos sistemas de visão computacional. Dependendo da aplicação, é possível obter excelentes resultados incorporando algum nível de conhecimento prévio do problema à tarefa de segmentação. A dependência desse conhecimento prévio, contudo, torna o projeto dos sistemas de visão computacional susceptíveis a diferentes interpretações e os resultados podem variar significativamente dentro de um mesmo escopo (SETHIAN, 1999). Isto sugere que, uma técnica de análise de imagens desenvolvida com vistas em uma aplicação específica pode não ser capaz de generalização, ou seja, ser empregada em problemas diversos.
Duas técnicas de processamento de imagens merecem destaque pela sua capacidade de generalização para diferentes problemas. Dentre os métodos espaciais de análise de imagens, vale destacar a análise de textura por meio da estatística de coocorrência e a análise multiescala, ou granulometria por meio de operações morfológicas.
A matriz de coocorrência de níveis de cinza (GLCM, do inglês gray level cooccurence matrix) baseia-se na estatística de coocorrência e é amplamente empregado na extração de descritores de textura de uma imagem, por exemplo para fins de classificação como sugerem Bevk e Kononenko (2002) e Cai-xiang e Shu-bo (2009). A GLCM, apresentado originalmente por Haralick (1979), utiliza o conceito de dependência espacial dos níveis de cinza de uma imagem para produzir uma matriz que incorpora informação de vizinhança entre pixels. Haralick e Shapiro (1992) e Haralick (1979) descrevem diversas abordagens baseadas na análise estrutural. As informações extraídas dessa matriz são utilizadas para descrever uma imagem em função da textura de seus componentes. Contudo, a utilização da estatística de coocorrência é ainda mais abrangente, dado que os atributos extraídos da GLCM podem ser utilizados para criar imagens descritivas e também com o objetivo de segmentar imagens para identificar objetos presentes na cena.
ou granulometria, encontra suas bases na teoria da Morfologia Matemática (MM) (SOILLE, 2002; SERRA, 1982). Essa teoria matemática apresenta ferramentas para a decomposição de formas, filtragem e realce. A MM é um arcabouço poderoso na análise de imagens, mas que pode ser compreendido por duas operações elementares: erosão e dilatação. Diversos operadores morfológicos são derivados dessas operações, destacando-se aqueles que aparecem em métodos de análise encontrados na literatura, a saber, as operações de abertura, fechamento e top hat. Esses operadores morfológicos utilizam estruturas elementares para detetar ou remover estruturas similares na imagem, destacando assim os objetos de interesse (ZANA; KLEIN, 2001; HU; TIAN, 2006; MENDONCA; CAMPILHO, 2006). Hu e Tian (2006) desenvolveram uma metodologia baseada em MM para extração de contorno de objetos. Essa metodologia adota a superposição de efeitos com elementos estruturantes direcionais nebulosos para realçar e detetar o contorno de formas. Esse tipo de segmentação é importante para a análise de imagens, porque incorpora um conjunto de conhecimentos em um algoritmo computacional. Os autores basearam-se na suposição de que os elementos estruturantes lineares não detetam estruturas pontuais e, por isso, o método proposto é robusto à presença de ruído.