A maioria dos sistemas CBIR utiliza características primárias para descrever elementos relevantes da imagem e proporcionar a recuperação baseada em conteúdo, como já discutido, as características primitivas são derivadas de três elementos fundamentais da imagem: cor, textura e forma.
5.1.1 COR
Uma imagem pode ser representada em níveis de cinza em um espaço de uma dimensão, ou colorida em um sistema de coordenadas tridimensionais. O descritor de cor é muito poderoso, pois simplifica a identificação de um determinado objeto e a extração de uma cena. As imagens médicas são geradas em escala de níveis de cinza ou pseudocores, por isso nessa seção será enfatizado apenas o histograma de cor em níveis de cinza.
O histograma de cor ou em níveis de cinza calcula e apresenta o número de pixels de uma imagem para cada cor ou nível de cinza. Os histogramas são invariantes à translação e rotação das imagens, ou seja, não indicam a localização espacial dos pixels na imagem.
Muitas operações podem ser realizadas nos histogramas para melhorar a definição da imagem como, por exemplo, a equalização de histograma. Porém, é importante ressaltar que
não é possível reconhecer uma imagem utilizando apenas o histograma de cor ou níveis de cinza, pois duas ou mais imagens diferentes podem ter histogramas similares.
É possível comparar dois histogramas através do somatório de diferenças absolutas ou quadráticas sobre o número de pixels de cada cor, sendo um esquema bem simples e tolerante as pequenas alterações na imagem. Portanto, é natural que os histogramas de cores venham sendo estudados e implementados em sistemas de recuperação de imagens baseada em conteúdo, tanto acadêmicos, quanto comerciais. Segundo Pass, Zabih e Miller (1996) a popularidade do uso de histogramas de cores em sistemas de recuperação de imagens baseada em conteúdo se deve principalmente a três fatores:
• O cálculo de histogramas de cores é computacionalmente simples e barato; • Pequenas alterações de movimentação na imagem pouco afetam os histogramas; • Objetos distintos freqüentemente possuem histogramas diferentes.
Existem alguns problemas a serem considerados no uso de histogramas:
• Seu caráter ambíguo: apenas o uso de histograma de cores das imagens não é suficiente para separar ou reconhecer imagens, pois duas ou mais imagens bem diferentes podem ter histogramas semelhantes, ou seja, não há uma correspondência biunívoca entre a imagem e seu histograma, o que leva ao problema de ambigüidade, e à necessidade do uso de conjunto de outros métodos. Na Figura 5.2 é demonstrada tal situação, onde as quatro imagens (a), (b), (c) e (d) possuem o mesmo histograma associado, o qual é apresentado em (e)
• Grande número de cores: geralmente o número de cores ou níveis de cinza tem mais de 100 níveis, tornando-se problemático indexar vetores dessa dimensão, pois o histograma para 100 cores distintas pode ser visto como um ponto 100- dimensional, e para valores dessa ordem, a maior parte das estruturas de índices espaciais colapsa.
Figura 5.2 – Mesmo histograma de cores (dois níveis de cinza) associado a quatro imagens distintas 5.1.2 TEXTURA
O descritor de textura fornece medidas de propriedades como suavidade, rugosidade e regularidade (Figura 5.3). Textura provê informações importantes para segmentação das imagens em objetos ou regiões distintas, como também para classificação ou reconhecimento de materiais de superfície. Mas, devido à diversidade de texturas naturais e artificiais, não existe uma definição formal para textura (GONZALEZ; WOODS, 2000).
Existem três abordagens principais para a descrição de textura: a estática, estrutural e espectral. As abordagens estáticas caracterizam a textura das imagens como suave, áspera, granular, entre outras. As abordagens estruturais tratam de arranjos de primitivas de imagem, como linhas paralelas regularmente espaçadas. As técnicas espectrais utilizam a freqüência da imagem para classificar a textura (GONZALEZ; WOODS, 2000).
Segundo Gonzalez e Woods (2000), as abordagens estáticas são utilizadas em texturas pequenas e não muito regulares. As medidas de contraste, anti-simetria, achatamento ou planaridade e outros, são calculadas através de momentos do histograma de níveis de cinza de uma imagem ou de uma região. Estas medidas calculadas através do histograma não possuem informações relativas à posição dos pixels. Para obter a informação de posição dos pixels e a
distribuição de intensidade na análise de textura utiliza-se a chamada matriz de co-ocorrência de níveis de cinza. Através desta matriz é possível analisar os seguintes descritores: probabilidade máxima, momento de diferença de elementos de ordem k, momento inverso de diferença de elementos de ordem k, entropia e uniformidade.
As abordagens estruturais definem elementos de textura de uma imagem, determinando seus formatos e impondo regras de posicionamento. Estas regras estabelecem o relacionamento de vizinhança, a densidade e a regularidade dos elementos de textura (GONZALEZ; WOODS, 2000).
Nas abordagens espectrais, utiliza-se a análise de freqüência da imagem para classificar a textura, sendo que o espectro de Fourier é bastante utilizado nessa abordagem; assim, esse espectro é idealmente adaptado para a descrição de padrões periódicos ou quase periódicos em uma imagem (GONZALEZ; WOODS, 2000).
(a) (b) (c) Figura 5.3 – Exemplos de textura (a) suave, (b) áspera, (c) regular
Fonte: GONZALEZ, R.C.; WOODS, R. E (2000, p. 362)
Para Müller et al. (2004), algumas das medidas mais comuns para capturar a textura de imagens são Wavelets e filtros Gabor, sendo que os filtros Gabor parecem ter uma melhor performance e correspondem as propriedades do córtex visual humano para detecção de borda. Outros descritores populares de textura contêm características derivadas de matriz de co-ocorrência, características baseadas nos fatores da transformada de Fourier.
Ambas características de cor e textura podem ser usadas sobre um nível de imagem global ou local em partes da imagem. Um método de usar características de região de forma fácil é utilizar blocos de tamanho fixo e localizado, chamados particionamento da imagem para extração de característica local. Estes blocos não contam semântica alguma para a própria imagem (MÜLLER et al., 2004).
Quando permitido, o usuário escolhe regiões da imagem (regiões de interesse – ROI) para delinear objetos na imagem ou quando segmenta a imagem em áreas com propriedades similares, as características extraídas localmente contêm mais informações sobre objetos da imagem ou estruturas fundamentais (MÜLLER et al., 2004).
5.1.3 FORMA
Diferentemente de textura, forma é um conceito muito bem definido, é a evidência considerável de que os objetos naturais são reconhecidos na imagem. Contudo, a recuperação de imagens baseada em forma é uma tarefa árdua, pois é necessário segmentar e conhecer o tamanho dos objetos contidos na imagem.
Para encontrar a borda dos objetos em uma imagem, deve-se realizar um pré- processamento na mesma e esta etapa depende fortemente da aplicação, ou seja, os algoritmos devem ser adaptados de acordo com o domínio dos objetos. Por exemplo, o modo de se obter a forma de um carro é diferente do modo de se obter a forma de uma folha. Após encontrar a borda, deve-se aplicar uma outra etapa para obter o contorno (GONZALEZ; WOODS, 2000).
Segundo Gonzalez e Woods (2000), a análise de forma é baseada no contorno dos objetos, sendo que os principais atributos para a análise de forma são área e perímetro, coeficiente de compacidade e deficiência convexa.