4. DEPREM NEDENİYLE ORTAYA ÇIKABİLECEK FİZİKSEL VE SOSYAL
4.5 Etkilenebilirlik Seviyelerinin Belirlenmesi
Nossa estratégia de bus a baseiase na expansão de onsultas e pode ser explorada
porvirtualmentequalquer máquinade bus a onven ional,quefun ioneporpalavras
have. Ela se apóia em pequenas modi ações nas fases de indexação e pesquisa de
do umentoserequerintervençõespou osigni ativasnasestruturasdedadosinternas,
porém deixaoalgoritmode ranking into ado.
Durante a fase de indexação, o parser (analisador sintáti o) deve ser modi ado
para in luir uma rotina de identi ação de expressões de posi ionamento. Tal rotina,
omoobservadonaSeção3.3, podeser implementadaporumprograma deextraçãode
informações, omo oGATE (Cunningham etal.,2002),queutilizaumasérie de regras
para asamentos de adeias de ara teres para identi ar tokens de interesse eextrair
a informaçãodesejada, no aso, as expressões de posi ionamento.
A lista de expressões de posi ionamento obtida para um dado do umento pre isa
então ser pro essada. Em ada expressão de posi ionamento as palavras ompondo
o nome do ponto de referên ia devem ser tratadas omo um úni o termo e inseridas
na lista invertida da máquina de bus a, da mesma forma que qualquer outro termo
en ontrado no orpo de um do umento seria. Op ionalmente, poderia ser inserido
em uma lista invertida separada, dedi ada apenas a pontos de referên ia. A relação
espa ial deve ser onvertida para um valor quantitativo, omo a distân ia média em
metros que ela representa, e armazenado omo uma informação adi ional no registro
orrespondenteà o orrên ia doponto de referên ia aoqual elaserefere. A esse valor,
daremos onome de distân ia.
AFigura4.1exibeoestado deuma listainvertidaimaginárialogoapósopro essa-
mento das expressões de posi ionamento`a 10 minutos do Expominas' no do umento
A
, `próximo ao Minas entro' e `perto do Mer ado Central' no do umentoB
, e `em frenteaoMinas entro' nodo umentoC
. Oregistropara ada o orrên ia de umponto de referên ia é representado por uma tripla ontendo o identi ador do do umento,Tabela3.8. No aso da relação espa ial métri a `a 10minutos de', o valor em metros
para `a 1 minuto de' foi multipli adopor10.
Como visto na Seção 3.3, as expressões de posi ionamento o orrem em er a de
3,6% dos do umentos da WBR05, om uma média de 1,6 expressões por do umento.
Com base nesse padrão de o orrên ia é possível dizer, grosso modo, que os pontos
de referên ia serão en ontrados em uma quantidade duas ordens de grandeza menor
do que as demais palavras have. Como onsequên ia, podemos esperar um impa to
muito pequeno no tamanho e no pro essamento de uma lista invertida que armazene
pontosde referên ia.
As adaptações ne essárias na fase de pro essamento de onsultas podem ser divi-
didas em dois passos. Primeiramente, a onsulta do usuário deve ser avaliada, para
tentaren ontrar um dos nomesde pontos de referên iaexistentes nalistainvertida. A
avaliação pode ser feita, no aso de uma máquinade bus a onven ional, pelo mesmo
módulo responsável por produzir re omendações, omo orreções ortográ as e exibi-
ção de links patro inados, a partir de uma análise sintáti a da onsulta. Nesse aso,
para a onsulta`hotel aeroporto dapampulha', omódulo poderia retornar o seguinte:
`Pro urando por hotel próximo ao Aeroporto da Pampulha?'. Oponto de referên-
ia poderia ainda ser informado em separado, o que restringiria a análise apenas às
palavrasdigitadasna aixade texto reservadaaesse m. Op ionalmente, osigni ado
semânti o em termos de distân ia determinado pela relação espa ial `próximo ao' na
onsulta sugerida, poderia ser espe i ado pelo usuário, que es olheria uma distân ia
adequadaàsua ne essidadede informação(ex: 800m,5km,et .) ouum valorpadrão
pode ser atribuído pelo sistema, omo, por exemplo, `3 km'. Esse valor, denominado
raio de bus a, juntamente om o ponto de referên ia denem o es opo geográ o da
onsulta.
Emseguida, os do umentos ontendo as palavras have da onsultadevemser se-
le ionados. Portanto, para a onsulta do exemplo a ima, devese sele ionar todos os
do umentos ontendoaspalavras have`hotel'e`aeroporto dapampulha',essa última
identi ada omo um ponto de referên ia e portanto tratada omo um úni o termo.
Além disso, existe uma restrição adi ional que deve ser respeitada: o es opo geográ-
o da onsulta, denido pela expressão de posi ionamento `próximoao aeroporto da
pampulha', deve ser ompatível om as expressões de posi ionamentoen ontradas no
texto do do umento ujo ponto de referên ia é o `aeroporto da pampulha'. Para isso,
omparamosovalordoraiodebus a(ex.: 3.000metros) omainformaçãodedistân ia
armazenada na listainvertida de termos nos registrosde ada o orrên ia do ponto de
referên ia `aeroporto dapampulha' no texto dos do umentos. Dessa forma, épossível
Figura4.2: Apli ação de bus a na Web
interpretação das relações espa iais omo se estivéssemos sele ionando sinnimos
para uma expressão de posi ionamento.
Para on luiraetapade pro essamento,osdo umentossele ionadossãoordenados
e exibidos ao usuário, ou seja, seguem o uxo normal de uma máquina de bus a.
Op ionalmente, o algoritmo de ranking pode ser modi ado para in luir o valor da
distân ia nos ál ulos de pesos dos do umentos. Dessa forma, se os do umentos