• Sonuç bulunamadı

Optimal Portföy Modellemesi

O presente cap´ıtulo, introduziu o conceito de fun¸c˜oes de distˆancia, bem como seu estado da arte, visando consultas por similaridade.

Existem diversas fun¸c˜oes de distˆancia com o intuito de realizar a mensura¸c˜ao da si- milaridade entre as caracter´ısticas inerentes `as imagens. O presente cap´ıtulo al´em dos

3.5 Considera¸c˜oes Finais 45 conceitos primordiais ao entendimento e aprecia¸c˜ao de fun¸c˜oes de distˆancia e suas peculi- aridades, tamb´em apresentou algumas fun¸c˜oes cl´assicas incluindo a distˆancia Minkowski, distˆancia Mahalanobis, distˆancia Quadr´atica, entre outras, bem como novas fun¸c˜oes de distˆancia encontradas na literatura. Por´em, at´e o momento as distˆancias pertencentes `a Minkowski s˜ao as mais comumente utilizadas para a recupera¸c˜ao de imagens, princi- palmente a distˆancia Euclidiana.

Por existir uma gama t˜ao ampla de fun¸c˜oes de distˆancia na literatura a utiliza¸c˜ao dessas deve ser analisada e especificamente ajustada para o contexto (e.g. tipos de caracter´ısticas extra´ıdas) em que o usu´ario est´a inserido e a percep¸c˜ao do mesmo. Como explicitado, algumas das fun¸c˜oes de distˆancias podem ser derivadas a partir de outras. No entanto, cada uma dessas deriva¸c˜oes possuem propriedades espec´ıficas que podem ser proveitosas a determinados contextos, melhorando assim consideravelmente a precis˜ao das consultas por similaridade.

Al´em disso, como discutido, a abrangˆencia de fun¸c˜oes de distˆancia demonstra qu˜ao gen´ericas elas s˜ao. Dessa forma, identificando a correla¸c˜ao entre as fun¸c˜oes pode-se men- surar casos em que uma fun¸c˜ao ser´a mais abrangente que a outra, e assim, responder quais fun¸c˜oes aumentariam ou diminuiriam a generalidade da consulta, ou seja, retornariam um n´umero maior ou menor de elementos.

Cap´ıtulo

4

Sele¸c˜ao de Caracter´ısticas por Demanda

Guiada pela Percep¸c˜ao do Usu´ario

4.1

Introdu¸c˜ao

A

tualmente, com o crescimento exponencial de reposit´orios de imagens, as t´ec-nicas de recupera¸c˜ao de imagens baseada em conte´udo tˆem sido intensamente pesquisadas. Geralmente as t´ecnicas CBIR utilizam caracter´ısticas visuais in- tr´ınsecas das imagens (cor, textura e forma), produzindo vetores de caracter´ısticas com centenas ou at´e mesmo milhares de caracter´ısticas. Esta elevada cardinalidade das carac- ter´ısticas representa um grande problema, pois leva `a chamada maldi¸c˜ao da alta dimen- sionalidade (Hsu & Chen, 2009), onde as estruturas de indexa¸c˜ao degradam-se e o poder de representatividade de cada caracter´ıstica diminui consideravelmente, tornando os pro- cessos de indexa¸c˜ao e recupera¸c˜ao das imagens muito mais lentos e insatisfat´orios. Al´em disso, freq¨uentemente muitas caracter´ısticas s˜ao correlacionadas entre si, trazendo, desse modo, informa¸c˜ao redundante, n˜ao adicionando nenhuma informa¸c˜ao consider´avel sobre as imagens, deteriorando a habilidade do sistema em disting¨ui-las de maneira fidedigna.

Com o intuito de evitar o problema da maldi¸c˜ao da alta dimensionalidade, as t´ecnicas de sele¸c˜ao de caracter´ısticas podem ser empregadas visando a redu¸c˜ao do tamanho dos vetores de caracter´ısticas. Assim, um dos principais desafios de um sistema CBIR ´e justamente determinar um subconjunto m´ınimo de caracter´ısticas que melhor representa as imagens. ´E nessa dire¸c˜ao que a presente t´ecnica atua.

Outro problema considerado ´e o j´a citado gap semˆantico, onde as caracter´ısticas de baixo n´ıvel extra´ıdas automaticamente das imagens n˜ao representam de maneira satisfat´o- ria a interpreta¸c˜ao semˆantica destas. Os seres humanos apresentam diferentes percep¸c˜oes com rela¸c˜ao `a similaridade entre imagens, fato que acarreta a insatisfa¸c˜ao destes com os resultados retornados pelo sistema CBIR, diminuindo assim muitas vezes a aceita¸c˜ao e posterior inclus˜ao de tais sistemas em ambientes reais, como por exemplo na pr´atica m´edica. De fato, existe uma disparidade entre as caracter´ısticas de baixo n´ıvel extra´ıdas das imagens e a percep¸c˜ao do usu´ario.

Outro desafio para um sistema CBIR ´e desenvolver m´etodos de representa¸c˜ao de ima- gens que estejam em uniformidade com a subjetividade humana. Para captar tal subjeti- vidade ´e extremamente importante inserir o usu´ario no processo e, para tanto, in´umeros pesquisadores tˆem considerado e empregado t´ecnicas de realimenta¸c˜ao de relevˆancia (Re- levance Feedback - RF) para tornar a recupera¸c˜ao de imagens mais fidedigna em rela¸c˜ao `a expectativa do usu´ario.

A realimenta¸c˜ao de relevˆancia apresenta uma estrat´egia de aprendizado em tempo real (on the fly) adaptando a resposta do sistema CBIR por meio das intera¸c˜oes com o usu´ario. O usu´ario pode interagir com o sistema selecionando as imagens mais rele- vantes (realimenta¸c˜ao positiva) e as menos relevantes (realimenta¸c˜ao negativa) para um determinado contexto. Portanto ´e um processo que realiza um ajuste “autom´atico” de uma consulta existente por meio de informa¸c˜oes que s˜ao realimentadas ao sistema com rela¸c˜ao `as respostas retornadas previamente e assim, realizando o ajuste da consulta, ob- jetivando diminuir o gap existente entre o que o usu´ario deseja e a informa¸c˜ao que foi de fato retornada (Deselaers et al., 2008b).

O presente cap´ıtulo apresenta um m´etodo o qual prop˜oe-se justamente lidar com os dois principais empecilhos encontrados por um sistema CBIR que s˜ao a maldi¸c˜ao da alta dimensionalidade e o gap semˆantico. Para tratar tais empecilhos o m´etodo utiliza o pro- cesso de realimenta¸c˜ao de relevˆancia para refinar iterativamente a sele¸c˜ao de caracter´ısti- cas realizada pela minera¸c˜ao de regras de associa¸c˜ao estat´ısticas. Para tanto, o conjunto de treinamento inicial empregado para realizar a minera¸c˜ao de regras de associa¸c˜ao ´e incrementado de acordo com as itera¸c˜oes de realimenta¸c˜ao de relevˆancia realizadas pelo usu´ario, calibrando em tempo de execu¸c˜ao o processo de minera¸c˜ao segundo a expectativa do usu´ario.

Os conceitos necess´arios para o entendimento da t´ecnica desenvolvida ser˜ao apresenta- dos nas pr´oximas se¸c˜oes. Vale ressaltar que a t´ecnica apresentada no presente cap´ıtulo foi publicada na forma de artigo cient´ıfico no IEEE International Conference on Healthcare Informatics, Imaging and Systems Biology (Bugatti et al., 2011b).

Benzer Belgeler