As imagens pertencentes `as bases utilizadas foram processadas, extraindo suas carac- ter´ısticas gerando os respectivos vetores de caracter´ısticas de cada imagem, os vetores obtidos foram indexados utilizando o M´etodo de Acesso M´etrico (MAM) Slim-tree. Ap´os a indexa¸c˜ao dos vetores de caracter´ısticas foram realizadas consultas por similaridade aos k -vizinhos mais pr´oximos, mais especificamente aos 80-vizinhos mais pr´oximos e considerando 3 ciclos de realimenta¸c˜ao para a constru¸c˜ao incremental do conjunto de treinamento. Nessa fase de treinamento do m´etodo proposto, foi empregada a t´ecnica de Rocchio fixando a constante de realimenta¸c˜ao positiva como β = 1.0 e a de realimenta¸c˜ao negativa como γ = 0.5.
J´a para a gera¸c˜ao dos gr´aficos de precis˜ao e revoca¸c˜ao da fase de teste foram realizadas consultas por similaridade aos k -vizinhos mais pr´oximos, utilizando todas as imagens de cada classe como centro de consulta. Dessa forma os gr´aficos de curvas de precis˜ao e revoca¸c˜ao elucidam a m´edia dos resultados obtidos.
Com o intuito de popular de maneira incremental o conjunto de treinamento a partir das itera¸c˜oes do processo de realimenta¸c˜ao de relevˆancia, adotou-se uma estrat´egia par- ticular descrita pelo Algoritmo 2. A cada ciclo de realimenta¸c˜ao o usu´ario foi indagado
1
http://archive.ics.uci.edu/ml/datasets.html
2
a selecionar um n´umero fixo de imagens relevantes (NR′), bem como um n´umero fixo de imagens irrelevantes (NN′).
Por exemplo, considerando o primeiro ciclo de realimenta¸c˜ao (Ciclo1), foi requisitado ao usu´ario selecionar as 5 imagens mais relevantes (imagens pertencentes `a mesma classe da imagem de consulta - NR′ = 5) e 1 imagem irrelevante (imagem pertencente a classe distinta da imagem de consulta - NN′
i = 1, onde i ´e a i-´esima classe da base de dados). Vale ressaltar que o usu´ario analisou as 20 primeiras imagens retornadas.
Uma vez que ´e constru´ıdo um conjunto de treinamento balanceado, quando o usu´ario realiza suas escolhas, ou seja, rotula as imagens como relevantes e irrelevantes e reali- menta o sistema com tais escolhas, a imagem rotulada como irrelevante ´e utilizada para selecionar, do conjunto resultante de k imagens, as irrelevantes restantes (e.g. 4 imagens) de mesma classe da rotulada para ent˜ao compor o conjunto de treinamento. Tal sele¸c˜ao ´e realizada em ordem inversa da similaridade em rela¸c˜ao `a imagem de consulta, uma vez que quanto mais distintas as imagens em rela¸c˜ao `a imagem de consulta maior ser˜ao suas distˆancias.
Dessa forma, constr´oi-se um conjunto de treinamento com o mesmo n´umero de tuplas de imagens rotuladas como relevantes e irrelevantes. Esse processo ´e extrapolado para as diferentes imagens irrelevantes pertencentes `as i classes da base de imagens.
Por exemplo, considerando a base de imagens CTROIsPulm˜ao (ver Se¸c˜ao 4.4.1) caso a imagem selecionada como irrelevante perten¸ca `a classe “Favo de Mel”, ser˜ao selecionadas outras 4 imagens de mesma classe para compor o conjunto de treinamento.
No entanto, como pode-se perceber, existem algumas situa¸c˜oes a serem consideradas com rela¸c˜ao `a cria¸c˜ao incremental do conjunto de treinamento. Supondo que n˜ao existam imagens suficientes pertencentes `a mesma classe das imagens rotuladas como irrelevantes no conjunto resultante para completar o n´umero de imagens requeridas (NR′− NN′
i) para constru¸c˜ao de um conjunto de treinamento balanceado. Nesse caso, as imagens perten- centes `a mesma classe das irrelevantes selecionadas s˜ao selecionadas randomicamente da base de imagens.
O mesmo caso pode ocorrer com rela¸c˜ao `a imagem de consulta, ou seja, n˜ao haver um n´umero suficiente de imagens no conjunto resultante a serem selecionadas como relevantes pelo usu´ario. Dessa forma, o mesmo procedimento descrito para as imagens irrelevantes ´e aplicado. No entanto, tal caso poder´a ter maior ou menor probabilidade de ocorrˆencia de acordo com o valor especificado ao parˆametro NR′ e k, uma vez que quanto menor NR′ e maior k, menor a probabilidade de tal ocorrˆencia. Como o conjunto de treinamento ´e inicialmente vazio e constru´ıdo de maneira incremental a partir das realimenta¸c˜oes realizadas, o valor inicial de NR′ no caso em quest˜ao ´e baixo, no entanto isso n˜ao elimina outras varia¸c˜oes do m´etodo proposto.
Outra situa¸c˜ao pass´ıvel de ocorrˆencia ´e quando o n´umero de classes de imagens
4.4 Experimentos 59 distintas selecionadas (NN′distinta). Nesse caso, as classes de imagens que n˜ao foram seleci- onadas pelo usu´ario s˜ao selecionadas randomicamente do conjunto resultante de k imagens at´e que seja alcan¸cado o n´umero requerido (i.e. NR′ − NN′
i). Caso o n´umero requerido n˜ao seja atingido, as imagens restantes para atingi-lo s˜ao selecionadas randomicamente da base de imagens. Por exemplo, considerando a base de imagens CTROIsPulm˜ao, apenas uma imagem da classe “Favo de Mel” tenha sido selecionada como irrelevante, as outras imagens irrelevantes pertencentes `as outras classes ser˜ao selecionadas de acordo com o processo descrito.
Nos experimentos realizados, na fase de treinamento, no primeiro, segundo e terceiro ciclos de realimenta¸c˜ao foram selecionadas, 5, 10 e 15 imagens relevantes respectivamente. Para fins de compara¸c˜ao sempre foram realizados exatamente 3 ciclos de realimenta¸c˜ao.
Dessa forma, o primeiro ciclo de realimenta¸c˜ao ir´a gerar sempre um conjunto de trei- namento com 5 × nclasses, onde nclasses ´e o n´umero de classes da base de imagens. O
segundo ciclo ir´a gerar um conjunto de treinamento com 15 × nclasses, visto que este foi
incrementado com 10 novas imagens. Por fim, o terceiro ciclo de realimenta¸c˜ao ir´a gerar um conjunto de treinamento com 30 × nclasses imagens, uma vez que foi incrementado
em 15 novas imagens. ´E importante ressaltar que para os experimentos, foi atribu´ıdo um peso w = −0.5 `as imagens irrelevantes.