O método proposto é um algoritmo de agrupamento que procura os neurônios que são passíveis de funcionar como marcadores, isto é, uma referência para a comparação entre as propriedades de todos os outros neurônios do mapa auto-organizável. A propriedade em questão é a força de sua conexão (vide capítulo 4). A fim de encontrar tais neurônios, o seguinte vetor de características 2-D foi definido: fiestá associado com cada neurônio
i, juntamente com o seu vetor de pesos de n-dimensional wi(vide capítulo 6):
fi= [ f11i f21i ] (8.1) Os componentes (Figura 8.1) do vetor de características consistem em:
1. Um componentes de densidade local de padrões ( fi
11): Este componente é formado
O raio da hiperesfera é definido como o raio mínimo para o qual cada neurônio tem pelo menos um padrão na sua hiperesfera. Este conceito refere-se àqueles envolvidos na geração do matriz P.
2. Um componente de distância local entre neurônios ( fi
21): este componente repre-
senta a distância Euclidiana locais entre os neurônios. O seu valor é extraído a partir da posição correspondente rido neurônio i na matriz U, que é em seguida negado
de modo a tornar-se uma medida de similaridade, em vez de dissimilaridade:
f21i = 1 −U(ri) (8.2)
A força de ligação entre dois neurônios adjacentes i e j na grade (Figura 8.2) é definido como:
s(i, j) = JC(i, j) + I(i, j) − 2d(i, j) (8.3)
d(i, j) = ||wi− wj|| (8.4)
onde || · || é a norma Euclidiana.
O parâmetro de JC(i, j) é o coeficiente de Jaccard definido como a razão entre as cardinalidades da interseção e da união dos conjuntos que contêm os padrões de dentro
!"#
""#
Neurônio i
Figura 8.1: Ilustração da formação do vetor de características fipara o neurônio i no grid
da rede SOM. O componente fi
11 é obtido a partir da matriz H que transporta informação
de densidade, enquanto fi
21é obtido a partir da matriz U que transporta informação sobre
8.2. MÉTODO PROPOSTO 83
f adjacent neurons i and j on the
78-"6 4/
B
B
B
j iFigura 8.2: Ilustração de neurônios adjacentes i e j na rede SOM.
das hiperesferas dos neurônios i e j:
JC(i, j) = |Ai∩ Bj| |Ai∪ Bj|
(8.5) onde | · | é a cardinalidade de conjunto, Aie Bj são os conjuntos formados pelos padrões
dentro das hiperesferas centradas nos neurônios i e j, respectivamente. O parâmetro I(i, j) é o coeficiente de interseção definido pela cardinalidade conjunto interseção entre Aie Bj:
I(i, j) = |Ai∩ Bj| (8.6)
Os parâmetros de JC(i, j) e I(i, j) dão uma medida relativa e absoluta de força de ligação através de uma métrica de densidade, respectivamente. Os valores de JC(i, j),
I(i, j) e d(i, j) são normalizados no intervalo [0,1], antes de calcular s(i, j), a fim de evitar problemas de escala. Após o cálculo de todas as forças de ligação, s(i, j) é também normalizada no intervalo [0,1]. Nesta fase, um grafo similar ao da grade SOM é gerado onde cada nó representa um neurônio no espaço de saída e cada aresta consiste na força de ligação negada entre os neurônios i e j (Equação 8.7), de modo que se torne uma medida de dissimilaridade. Em seguida, os valores das arestas são normalizados no intervalo [1,2], de modo que se tornem todos não-nulos.
e(i, j) = 1 − s(i, j) (8.7)
O próximo passo consiste em calcular para cada neurônio i o caminho mais curto para todos os outros neurônios através do algoritmo de Dijkstra [Dijkstra 1959], e a re- compensa para aquele neurônio se ele se mover de um nó para outro. O caminho que um neurônio pode seguir depende se uma vizinhança-4 ou vizinhança-8 é definida (Fi- gura 8.3). Um neurônio se move de sua posição i para a posição de outro neurônio j se e somente se a atração é máxima (em relação a todos os outros neurônios) e positiva (Equações 8.8 a 8.10 ):
custo(i, j) =
f im= j
X
inicio=i
ecaminho (8.9)
atrac˜ao(i, j) = recompensa(i, j) − custo(i, j) (8.10)
caso contrário, o neurônio permanece na sua posição atual, cujo custo é zero, bem como a sua recompensa. Este processo continua até que seja atingido um critério de parada.
Figura 8.3: Ilustração de (a) vizinhança-4 e (b) vizinhança-8 para o neurônio na grade SOM que está representado como um ponto vermelho.
O critério de parada utilizado neste trabalho baseia-se no pressuposto de regime per- manente. Quando o sistema atinge um estado estacionário, os neurônios permanecem em suas posições de uma iteração para outra: haverá nós vazios e nós para onde os neurônios convergiram. Estes nós atratores são os neurônios que correspondem aos marcadores uti- lizados no segundo passo do método proposto. O primeiro passo é resumida no Algoritmo 8.1:
Na segunda etapa, são analisadas as ligações s(i, j) entre o conjunto de marcadores neuronais
M
, e o valor mínimo é extraído para ser utilizada como limiar:limiar= min
(i, j)(s(i, j)) , i e j ∈
M
(8.11)Algoritmo 8.1 Geração de marcadores de neurônios
1: Gerar o vetor de características fiassociado a cada neurônio i.
2: Calcular a intensidade da conexão s(i, j) entre cada par de neurônios adjacentes i e j (de acordo com uma vizinhança-4 ou vizinhança-8).
3: Gerar o novo grafo e calcular as arestas de acordo com a Equação 8.7.
4: Para cada neurônio i
Calcular o custo e recompensa se ele se move de sua posição atual ripara qualquer
outra posição rj(rj6= ri). Em seguida, calcule sua atração.
Se a atração máxima é positiva, mova o neurônio para a posição correspondente, caso contrário, ele permanece em sua posição atual.
8.2. MÉTODO PROPOSTO 85 Todas as ligações menores do que o mínimo são podadas e “pseudo-agrupamentos” são formados através de componentes conectados. Se um pseudo-agrupamento não tem pelo menos uma determinada percentagem α de marcadores de neurônios, ele não é con- siderado um agrupamento. Os valores de α utilizados nas experiências são geralmente de 1% e 5% dos marcadores. O objetivo deste procedimento é tentar eliminar atratores es- púrios e grupos muito pequenos de neurônios conectados (“ilhas”) que não correspondem aos agrupamentos reais. Portanto, os pseudo-agrupamentos restantes formam o núcleo das regiões neurais (Algoritmo 8.2).
Algoritmo 8.2 Poda de conexão
1: Avaliar todas as ligações s(i, j) entre os marcadores (neurônios) e definir um nível de
limiar em seu mínimo.
2: Remover todas as ligações abaixo desse limiar.
3: Avaliar a quantidade de todos os marcadores nos pseudo-agrupamentos, se for inferior
a α então desconsiderar a agrupamento.
A terceira e última etapa consiste em classificar gradualmente os neurônios restan- tes nos núcleos dos agrupamentos encontrados. A classificação é feita em sequência de acordo com a sua força de ligação aos neurônios que pertencem a um dado grupo (Algo- ritmo 8.3).
Algoritmo 8.3 Rotulação dos neurônios remanescentes
1: Para cada neurônio i, i /∈
M
(a) Se está em uma vizinhança-4 de qualquer neurônio j que pertence ao conjunto de
M
, armazenar a conexão s(i, j) que é máxima. Caso contrário, pule para opróximo neurônio.
2: Inclua o neurônio com máxima conectividade armazenada no conjunto
M
.3: Se ainda existem neurônios não-rotulados, voltar ao passo 1. Caso contrário parar.
Todo este processo pode ser repetido de forma hierárquica, a parte dos dados que é classificada num dado agrupamento de acordo com um mapa pai pode ser alimentada a um mapa filho para um segundo nível de segmentação dos dados. Nas experiências este processo foi aplicado ao conjunto de dados D4. Os parâmetros de um nível de partição para o próximo são mantidos constantes, exceto o tamanho do mapa filho [Costa 2001], que é dado por:
So f f spring= |
C
||
U
|β
Sparent (8.12)
em que S é o tamanho de um mapa, | · | representa a cardinalidade de conjunto,
U
oconjunto de dados,