• Sonuç bulunamadı

O método proposto é um algoritmo de agrupamento que procura os neurônios que são passíveis de funcionar como marcadores, isto é, uma referência para a comparação entre as propriedades de todos os outros neurônios do mapa auto-organizável. A propriedade em questão é a força de sua conexão (vide capítulo 4). A fim de encontrar tais neurônios, o seguinte vetor de características 2-D foi definido: fiestá associado com cada neurônio

i, juntamente com o seu vetor de pesos de n-dimensional wi(vide capítulo 6):

fi= [ f11i f21i ] (8.1) Os componentes (Figura 8.1) do vetor de características consistem em:

1. Um componentes de densidade local de padrões ( fi

11): Este componente é formado

O raio da hiperesfera é definido como o raio mínimo para o qual cada neurônio tem pelo menos um padrão na sua hiperesfera. Este conceito refere-se àqueles envolvidos na geração do matriz P.

2. Um componente de distância local entre neurônios ( fi

21): este componente repre-

senta a distância Euclidiana locais entre os neurônios. O seu valor é extraído a partir da posição correspondente rido neurônio i na matriz U, que é em seguida negado

de modo a tornar-se uma medida de similaridade, em vez de dissimilaridade:

f21i = 1 −U(ri) (8.2)

A força de ligação entre dois neurônios adjacentes i e j na grade (Figura 8.2) é definido como:

s(i, j) = JC(i, j) + I(i, j) − 2d(i, j) (8.3)

d(i, j) = ||wi− wj|| (8.4)

onde || · || é a norma Euclidiana.

O parâmetro de JC(i, j) é o coeficiente de Jaccard definido como a razão entre as cardinalidades da interseção e da união dos conjuntos que contêm os padrões de dentro

!"#

""#

Neurônio i

Figura 8.1: Ilustração da formação do vetor de características fipara o neurônio i no grid

da rede SOM. O componente fi

11 é obtido a partir da matriz H que transporta informação

de densidade, enquanto fi

21é obtido a partir da matriz U que transporta informação sobre

8.2. MÉTODO PROPOSTO 83

f adjacent neurons i and j on the

78-"6 4/

B

B

B

j i

Figura 8.2: Ilustração de neurônios adjacentes i e j na rede SOM.

das hiperesferas dos neurônios i e j:

JC(i, j) = |Ai∩ Bj| |Ai∪ Bj|

(8.5) onde | · | é a cardinalidade de conjunto, Aie Bj são os conjuntos formados pelos padrões

dentro das hiperesferas centradas nos neurônios i e j, respectivamente. O parâmetro I(i, j) é o coeficiente de interseção definido pela cardinalidade conjunto interseção entre Aie Bj:

I(i, j) = |Ai∩ Bj| (8.6)

Os parâmetros de JC(i, j) e I(i, j) dão uma medida relativa e absoluta de força de ligação através de uma métrica de densidade, respectivamente. Os valores de JC(i, j),

I(i, j) e d(i, j) são normalizados no intervalo [0,1], antes de calcular s(i, j), a fim de evitar problemas de escala. Após o cálculo de todas as forças de ligação, s(i, j) é também normalizada no intervalo [0,1]. Nesta fase, um grafo similar ao da grade SOM é gerado onde cada nó representa um neurônio no espaço de saída e cada aresta consiste na força de ligação negada entre os neurônios i e j (Equação 8.7), de modo que se torne uma medida de dissimilaridade. Em seguida, os valores das arestas são normalizados no intervalo [1,2], de modo que se tornem todos não-nulos.

e(i, j) = 1 − s(i, j) (8.7)

O próximo passo consiste em calcular para cada neurônio i o caminho mais curto para todos os outros neurônios através do algoritmo de Dijkstra [Dijkstra 1959], e a re- compensa para aquele neurônio se ele se mover de um nó para outro. O caminho que um neurônio pode seguir depende se uma vizinhança-4 ou vizinhança-8 é definida (Fi- gura 8.3). Um neurônio se move de sua posição i para a posição de outro neurônio j se e somente se a atração é máxima (em relação a todos os outros neurônios) e positiva (Equações 8.8 a 8.10 ):

custo(i, j) =

f im= j

X

inicio=i

ecaminho (8.9)

atrac˜ao(i, j) = recompensa(i, j) − custo(i, j) (8.10)

caso contrário, o neurônio permanece na sua posição atual, cujo custo é zero, bem como a sua recompensa. Este processo continua até que seja atingido um critério de parada.

Figura 8.3: Ilustração de (a) vizinhança-4 e (b) vizinhança-8 para o neurônio na grade SOM que está representado como um ponto vermelho.

O critério de parada utilizado neste trabalho baseia-se no pressuposto de regime per- manente. Quando o sistema atinge um estado estacionário, os neurônios permanecem em suas posições de uma iteração para outra: haverá nós vazios e nós para onde os neurônios convergiram. Estes nós atratores são os neurônios que correspondem aos marcadores uti- lizados no segundo passo do método proposto. O primeiro passo é resumida no Algoritmo 8.1:

Na segunda etapa, são analisadas as ligações s(i, j) entre o conjunto de marcadores neuronais

M

, e o valor mínimo é extraído para ser utilizada como limiar:

limiar= min

(i, j)(s(i, j)) , i e j ∈

M

(8.11)

Algoritmo 8.1 Geração de marcadores de neurônios

1: Gerar o vetor de características fiassociado a cada neurônio i.

2: Calcular a intensidade da conexão s(i, j) entre cada par de neurônios adjacentes i e j (de acordo com uma vizinhança-4 ou vizinhança-8).

3: Gerar o novo grafo e calcular as arestas de acordo com a Equação 8.7.

4: Para cada neurônio i

Calcular o custo e recompensa se ele se move de sua posição atual ripara qualquer

outra posição rj(rj6= ri). Em seguida, calcule sua atração.

Se a atração máxima é positiva, mova o neurônio para a posição correspondente, caso contrário, ele permanece em sua posição atual.

8.2. MÉTODO PROPOSTO 85 Todas as ligações menores do que o mínimo são podadas e “pseudo-agrupamentos” são formados através de componentes conectados. Se um pseudo-agrupamento não tem pelo menos uma determinada percentagem α de marcadores de neurônios, ele não é con- siderado um agrupamento. Os valores de α utilizados nas experiências são geralmente de 1% e 5% dos marcadores. O objetivo deste procedimento é tentar eliminar atratores es- púrios e grupos muito pequenos de neurônios conectados (“ilhas”) que não correspondem aos agrupamentos reais. Portanto, os pseudo-agrupamentos restantes formam o núcleo das regiões neurais (Algoritmo 8.2).

Algoritmo 8.2 Poda de conexão

1: Avaliar todas as ligações s(i, j) entre os marcadores (neurônios) e definir um nível de

limiar em seu mínimo.

2: Remover todas as ligações abaixo desse limiar.

3: Avaliar a quantidade de todos os marcadores nos pseudo-agrupamentos, se for inferior

a α então desconsiderar a agrupamento.

A terceira e última etapa consiste em classificar gradualmente os neurônios restan- tes nos núcleos dos agrupamentos encontrados. A classificação é feita em sequência de acordo com a sua força de ligação aos neurônios que pertencem a um dado grupo (Algo- ritmo 8.3).

Algoritmo 8.3 Rotulação dos neurônios remanescentes

1: Para cada neurônio i, i /

M

(a) Se está em uma vizinhança-4 de qualquer neurônio j que pertence ao conjunto de

M

, armazenar a conexão s(i, j) que é máxima. Caso contrário, pule para o

próximo neurônio.

2: Inclua o neurônio com máxima conectividade armazenada no conjunto

M

.

3: Se ainda existem neurônios não-rotulados, voltar ao passo 1. Caso contrário parar.

Todo este processo pode ser repetido de forma hierárquica, a parte dos dados que é classificada num dado agrupamento de acordo com um mapa pai pode ser alimentada a um mapa filho para um segundo nível de segmentação dos dados. Nas experiências este processo foi aplicado ao conjunto de dados D4. Os parâmetros de um nível de partição para o próximo são mantidos constantes, exceto o tamanho do mapa filho [Costa 2001], que é dado por:

So f f spring= |

C

|

|

U

|

β

Sparent (8.12)

em que S é o tamanho de um mapa, | · | representa a cardinalidade de conjunto,

U

o

conjunto de dados,

C

(C ∈ D) é o conjunto formado por uma partição do conjunto de

Benzer Belgeler