B. U YUŞUMCULUK (C OMPATİBİLİSM ) VE U YUŞMAZCILIK (I NCOMPATİBİLİSM ) Ç ERÇEVESİNDE N T OPÇU ’ NUN E LEŞTİRİLERİ
1. İNDETERMİNİZMDEN HAREKETLE ÖZGÜRLÜK SAVUNULABİLİR Mİ?
1.2. NURETTİN TOPÇU’NUN “YARATICILIK” İLE İLGİLİ ELEŞTİRİLERİ
Al-Kofahi, 2007)
Custis e Al-Kofahi (2007) não apresentam exatamente um método de EC, mas sim uma proposta para a avaliação da expansão de consultas utilizando a combinação dos termos da consulta efetuada pelos usuários e os termos presentes nos documentos em uma coleção de um domínio específico. Os termos utilizados na consulta são retirados dos documentos julgados relevantes um a um, possibilitando com isso determinar a eficiência de diferentes sistemas de recuperação de informação no que diz respeito à perda desses termos.
Para a validação da proposta apresentada pelos autores, foram realizados quatro experimen- tos: (i) dois experimentos com a utilização da fórmula OKAPI para o cálculo dos pesos dos termos (Huang et al., 2006) (com e sem o uso de pseudo realimentação de relevantes para a expansão de consulta); (ii) um experimento fazendo uso do mecanismo de busca proprietário TCS, Thomson Concept Search; e (iii) um experimento utilizando o modelo de linguagem de consulta probabilística (Query Likelihood )(Zhou & Croft, 2005). O TCS utiliza um corpus externo como fonte de conhecimento tematicamente relacionado à coleção de documentos que será pesquisada.
Para a validação dos experimentos foram utilizadas duas coleções de teste para os quatro sis- temas de recuperação de informação já mencionados. As duas coleções de teste utilizadas são: o TREC AP89 (TIPSTER disco 1), que é uma coleção de textos da Text Retrieval Conference, e a coleção proprietária de documentos de casos legais chamada FSupp.
Nos experimentos realizados, a estratégia escolhida de remoção dos termos da consulta para toda a coleção de documentos fez uso do Inverse Document Frequence (IDF) (Salton & Mac- Gill, 1983). Termos com alto valor para o IDF influenciam a classificação dos documentos. Termos com alto valor para IDF geralmente são termos do domínio específico, que são menos comuns, sendo difícil para uma pessoa não especialista reconhecê-los. Por esse motivo a remo- ção desses termos com alto valor para o IDF são removidos em primeiro lugar. Para comparar
a eficiência de cada sistema de recuperação de informação foram utilizadas MAP com precisão para dez documentos (P@10) (Turpin & Scholer, 2006), e abrangência para mil documentos.
Os autores concluem que a sua proposta de avaliação de sistemas de recuperação de infor- mação permite medir o grau de melhoria (ou não) da combinação de termos entre a consulta e documentos considerados relevantes. A avaliação dos sistemas de recuperação de informação é realizada utilizando somente coleções inteiras de documentos evitando, com isso o uso na expansão de consulta de uma combinação de termos que não resulte em uma recuperação de documentos eficiente para as necessidades dos usuários. Outra contribuição importante é que os resultados podem ser avaliados independentemente das métricas escolhida para tal. Tam- bém, os autores mostram que é possível modelar o comportamento de usuários analisando a combinação de termos que estes utilizam na consulta em dois grupos: usuários especialistas e usuários iniciantes.
Com o estudo do trabalho realizado por Custis e Al-Kofahi (2007), identificamos a impor- tância e viabilidade de uso da técnica de EC Pseudo Feedback para a aplicação em conjunto com o Modelo TR+ na recuperação de informação. Unido a isso,outra importante contribuição do trabalho apresentado por Custis e Al-Kofahi (2007) foi trazer a oportunidade de um melhor conhecimento de uma situação de uso da fórmula OKAPI.
5.2 Expansão de Consulta com termos selecionados usando análise da co-
esão lexical dos documentos (Vechtomova & Karamuftuoglu, 2007)
Vechtomova e Karamuftuoglu (2007) apresentam uma proposta para expansão de consultas utilizando ligações lexicais coesivas entre os termos da consulta e os termos dos documentos vizinhos aos termos da consulta no documento. Partes do texto (Snippets) vizinhas ao termo da consulta dentro do documento são avaliadas para expansão de consultas de forma automática.No trabalho apresentado é explorada a eficácia da utilização de snippets para se expandir consultas de forma interativa com o usuário. Os autores comparam expansão de consulta utili- zando snippets do texto e expansão de consulta com o uso de documentos inteiros. Também é mencionada no trabalho uma comparação de expansão de consultas utilizando partes do texto selecionado pelo usuário versus a expansão de consulta com utilização de documentos inteiros julgados relevantes pelo usuário.
A avaliação foi conduzida no TREC 2005 (Text Retrieval Conference), considerando o uso de termos de ligação e termos vizinhos de partes do texto em comparação com termos selecio- nados de textos inteiros. A proposta apresentada pelos autores foi comparada com a expansão de consulta utilizando a freqüência dos termos no documento como peso, onde todos os termos são extraídos de um texto completo de um documento reconhecidamente relevante, e ordenado. Os autores apresentaram experimentos com expansão de consultas utilizando pseudo reali-
mentação de relevantes para avaliar a proposta de expansão de consulta sem retorno de relevân- cia. Ao término dos estudos concluem que ao apresentarem aos usuários os termos de partes do texto dentro do contexto como auxílio para a expansão da consulta, os usuários selecionam termos mais eficientes, em contrapartida ao que ocorre quando expõem aos usuários termos fora desse contexto.
Os autores ainda finalizam constatando que existe uma significativa diferença no número de ligações lexicais entre termos de consultas distintas em conjuntos de documentos relevantes quando compardados a um conjunto de documentos não relevantes.
O trabalho apresentado por Vechtomova e Karamuftuoglu (2007) foi de grande valor para a formulação de nossa proposta, pois ofereceu uma visão prática da utilização da técnica de EC pseudo realimentação de relevantes, chamada neste trabalho por Vechtomova e Karamuftuoglu