• Sonuç bulunamadı

KENDĠNE ZARAR VERME DAVRANIġINA ĠLĠġKĠN BETĠMLEYĠCĠ VERĠLER VE ARAġTIRMA DEĞĠġKENLERĠ ĠLE OLAN ĠLĠġKĠSĠ

BULGULAR VE YORUM

4.2 KENDĠNE ZARAR VERME DAVRANIġINA ĠLĠġKĠN BETĠMLEYĠCĠ VERĠLER VE ARAġTIRMA DEĞĠġKENLERĠ ĠLE OLAN ĠLĠġKĠSĠ

Uma observa¸c˜ao cuidadosa do resultado da decomposi¸c˜ao wavelet (Figura 3.5) indica que existe uma rela¸c˜ao hier´arquica entre os distintos subespa¸cos gerados. ´E formada uma estru- tura piramidal de sub-imagens com v´arias resolu¸c˜oes correspondentes `as diferentes etapas da decomposi¸c˜ao. Por exemplo, o subespa¸co Hx1 tem informa¸c˜ao similar ao subespa¸co Hx2,

porque ambos os subespa¸cos expressam elementos de alta freq¨uˆencia na dire¸c˜ao horizontal, mas em escalas distintas da imagem.

T´ecnicas de extra¸c˜ao de caracter´ısticas de imagens 35 O c´alculo dos vetores de caracter´ısticas est´a baseado em medidas dos subespa¸cos da decomposi¸c˜ao wavelet. Diversas medidas podem ser obtidas desses espa¸cos. Na maioria dos estudos que utilizam a transformada de wavelet para extra¸c˜ao de caracter´ısticas da imagem, calcula-se o valor de energia para cada subespa¸co da transformada, obtendo-se um vetor de caracter´ısticas com N medidas correspondentes a cada subespa¸co [84, 85, 3]. Tamb´em ´e poss´ıvel considerar outras medidas, tamb´em para cada subespa¸co, tais como os primeiros momentos estat´ısticos (m´edia, variˆancia, inclina¸c˜ao, curtose), e entropia.

Assim como as medidas da transformada bi-dimensional de Fourier, as medidas da trans- formada de wavelet podem ser consideradas caracter´ısticas de textura da imagem. Por exemplo, valores altos de energia nos subespa¸cos de altas freq¨uˆencias nas dire¸c˜oes horizontal e vertical, separadamente, exprimem caracter´ısticas de direcionalidade da textura enquanto as medidas dos subespa¸cos de altas freq¨uˆencias em ambas as dire¸c˜oes representam a no¸c˜ao de espessura.

3.7

Considera¸c˜oes finais

Neste Cap´ıtulo foi apresentada uma revis˜ao de alguns dos principais m´etodos de extra¸c˜ao de caracter´ısticas de imagens baseados em textura e forma, que est˜ao mais relacionados ao trabalho desenvolvido e apresentado nesta tese.

Em especial, as propriedades de ortogonalidade e invariˆancia `as transforma¸c˜oes geom´etricas dos momentos de Zernike fazem deles uma t´ecnica robusta de caracteriza¸c˜ao da imagem, que ´e empregada em muitos trabalhos de CBIR [86, 87, 88, 89]. Por esse motivo essa t´ecnica foi escolhida para fazer parte de um estudo comparativo envolvendo a nova t´ecnica de extra¸c˜ao de caracter´ısticas de imagens m´edicas desenvolvida e apresentada no Cap´ıtulo 5.

Cap´ıtulo

4

Segmenta¸c˜ao de imagens

A segmenta¸c˜ao ´e um processo que consiste na subdivis˜ao de uma imagem em regi˜oes distin- tas, levando-se em considera¸c˜ao duas propriedades b´asicas das imagens: descontinuidade e homogeneidade. A segmenta¸c˜ao ´e a principal etapa para a an´alise autom´atica de imagens. A partir dela s˜ao delimitados objetos que podem ser utilizados em processos subseq¨uentes, tal como classifica¸c˜ao, descri¸c˜ao, contagem, reconhecimento, entre outros.

O princ´ıpio da segmenta¸c˜ao foi introduzido no in´ıcio do s´eculo XX por alguns psic´ologos alem˜aes (Khler, Wertheimer e Kofftka) [90]. Eles mostraram que o sistema de vis˜ao hu- mana realiza agrupamentos baseados na proximidade, similaridade e continuidade das ima- gens captadas. Tais agrupamentos s˜ao utilizados na classifica¸c˜ao e an´alise semˆantica dos objetos percebidos. Esta id´eia foi estendida para o contexto computacional e deu origem aos primeiros algoritmos de segmenta¸c˜ao de imagens.

O ideal da segmenta¸c˜ao ´e que cada regi˜ao obtida no resultado esteja diretamente rela- cionada com um objeto real contido na imagem, como por exemplo um autom´ovel ou uma pessoa; e que tamb´em se possa fazer distin¸c˜ao do plano de fundo (background) da mesma.

Existem na literatura diversas taxonomias para classifica¸c˜ao dos m´etodos de segmenta¸c˜ao de imagem. Neste Cap´ıtulo ser´a considerada a mesma taxonomia adotada por Gonzales [77] que classifica os m´etodos de segmenta¸c˜ao em trˆes categorias b´asicas: limiariza¸c˜ao (threshol-

ding); segmenta¸c˜ao baseada em bordas; e segmenta¸c˜ao baseada em regi˜oes. Recentemente

v´arias outras categorias s˜ao levadas em considera¸c˜ao.

Dentre elas est˜ao os m´etodos baseados em cores [91, 92, 93], os que utilizam t´ecnica de classifica¸c˜ao e de agrupamento de dados [94, 95, 96] e algoritmos gen´eticos [97, 98, 99, 100, 101].

Neste Cap´ıtulo s˜ao apresentados alguns dos principais m´etodos de segmenta¸c˜ao de ima- gens encontrados na literatura, incluindo os m´etodos cujos conceitos s˜ao utilizados direta- mente na realiza¸c˜ao deste trabalho, em especial a segmenta¸c˜ao pela transformada de wa-

tershed e o m´etodo EM/MPM baseado nos modelos de Markov.

38 Cap´ıtulo 4

4.1

Limiariza¸c˜ao (Thresholding)

A limiariza¸c˜ao ´e o m´etodo mais simples e intuitivo de segmenta¸c˜ao de imagens. Basica- mente, todos os pixels que est˜ao dentro de uma faixa de intensidade s˜ao classificados como pertencentes a uma mesma regi˜ao. Em sua forma mais geral a limiariza¸c˜ao pode ser descrita matematicamente como:

S(i, j) = k se Tk−1 ≤ f(i, j) < Tk para k = 1, 2, ..., m

onde S(i, j) ´e a fun¸c˜ao resultante, f (i, j) ´e a fun¸c˜ao original (imagem), T0, ..., Tm s˜ao os

valores de limiariza¸c˜ao (thresholding) e m ´e o n´umero de classes distintas a serem aplicadas `a imagem.

Se m = 2, o m´etodo de limiariza¸c˜ao ´e denominado limiariza¸c˜ao bin´aria. Para m > 2 o m´etodo ´e descrito como limiariza¸c˜ao multi-modal.

A limiariza¸c˜ao ´e geralmente aplicada a imagens que possuem ´areas homogˆeneas sobre um plano de fundo uniforme. Uma aplica¸c˜ao comum para a limiariza¸c˜ao bin´aria ´e a extra¸c˜ao de texto da imagem digitalizada de uma p´agina.

Existem v´arias t´ecnicas para se determinar os valores de corte T0, ..., Tm. Uma delas ´e a

pr´opria sele¸c˜ao manual, baseada no melhor resultado obtido ap´os o teste com v´arios valores por parte do usu´ario. Dentre as t´ecnicas autom´aticas, a mais tradicional, e tamb´em a mais intuitiva, baseia-se na detec¸c˜ao dos pontos de m´ınimo do histograma da imagem (vales) [102]. O histograma ´e uma fun¸c˜ao que indica o n´ıvel de ocorrˆencia de um determinado n´ıvel de cinza dentro da imagem ou, para imagens coloridas, o n´ıvel de ocorrˆencia de cada cor. ´E coerente pensar que nas regi˜oes de m´ınimo local do histograma, h´a uma barreira que separa objetos. Sendo assim, os valores e limiar T0, ..., Tmser˜ao os pontos de m´ınimo do histograma.

Um problema desta t´ecnica est´a no fato de que muitas vezes os vales s˜ao longos e planos, tornando a escolha do limiar uma busca arbitr´aria. Tamb´em, ´e poss´ıvel que os vales assumam valores muito baixos, o que proporciona ao m´etodo uma sensibilidade maior aos ru´ıdos.

A Figura 4.1 ilustra um t´ıpico histograma bimodal (histograma que possui apenas um ponto de m´ınimo local e dois picos). O limiar T1 foi selecionado a partir do ´unico ponto de

m´ınimo da fun¸c˜ao. T0 e T2 correspondem, respectivamente, `a m´ınima e `a m´axima intensidade

do histograma.

A maioria das t´ecnicas autom´aticas para escolha dos n´ıveis de corte se baseiam no histo- grama. A tradicional t´ecnica de Otsu [77], por exemplo, ´e reconhecida por ser bem eficiente. Ela se baseia na escolha do valor de corte que maximiza a medida de variˆancia entre duas partes do histograma, ou seja, o objetivo ´e encontrar T que minimize a fun¸c˜ao:

u(T ) = q1(T )σ12(T ) + q2(T )σ22(T )

onde:

Segmenta¸c˜ao de imagens 39 • q2(T ) o n´umero de pixels com intensidade superior a T ;

• σ2

1(T ) variˆancia dos pixels cuja intensidade ´e menor que T ;

• σ2

2(T ) variˆancia dos pixels cuja intensidade ´e maior que T .

intensidade qua nt ida de limiar T1

Figura 4.1: Sele¸c˜ao do limiar (threshold) ´otimo para um histograma bimodal.