• Sonuç bulunamadı

4. DEPREM NEDENİYLE ORTAYA ÇIKABİLECEK FİZİKSEL VE SOSYAL

4.5 Etkilenebilirlik Seviyelerinin Belirlenmesi

Nossa estratégia de bus a baseiase na expansão de onsultas e pode ser explorada

porvirtualmentequalquer máquinade bus a onven ional,quefun ioneporpalavras

have. Ela se apóia em pequenas modi ações nas fases de indexação e pesquisa de

do umentoserequerintervençõespou osigni ativasnasestruturasdedadosinternas,

porém deixaoalgoritmode ranking into ado.

Durante a fase de indexação, o parser (analisador sintáti o) deve ser modi ado

para in luir uma rotina de identi ação de expressões de posi ionamento. Tal rotina,

omoobservadonaSeção3.3, podeser implementadaporumprograma deextraçãode

informações, omo oGATE (Cunningham etal.,2002),queutilizaumasérie de regras

para asamentos de adeias de ara teres para identi ar tokens de interesse eextrair

a informaçãodesejada, no aso, as expressões de posi ionamento.

A lista de expressões de posi ionamento obtida para um dado do umento pre isa

então ser pro essada. Em ada expressão de posi ionamento as palavras ompondo

o nome do ponto de referên ia devem ser tratadas omo um úni o termo e inseridas

na lista invertida da máquina de bus a, da mesma forma que qualquer outro termo

en ontrado no orpo de um do umento seria. Op ionalmente, poderia ser inserido

em uma lista invertida separada, dedi ada apenas a pontos de referên ia. A relação

espa ial deve ser onvertida para um valor quantitativo, omo a distân ia média em

metros que ela representa, e armazenado omo uma informação adi ional no registro

orrespondenteà o orrên ia doponto de referên ia aoqual elaserefere. A esse valor,

daremos onome de distân ia.

AFigura4.1exibeoestado deuma listainvertidaimaginárialogoapósopro essa-

mento das expressões de posi ionamento`a 10 minutos do Expominas' no do umento

A

, `próximo ao Minas entro' e `perto do Mer ado Central' no do umento

B

, e `em frenteaoMinas entro' nodo umento

C

. Oregistropara ada o orrên ia de umponto de referên ia é representado por uma tripla ontendo o identi ador do do umento,

Tabela3.8. No aso da relação espa ial métri a `a 10minutos de', o valor em metros

para `a 1 minuto de' foi multipli adopor10.

Como visto na Seção 3.3, as expressões de posi ionamento o orrem em er a de

3,6% dos do umentos da WBR05, om uma média de 1,6 expressões por do umento.

Com base nesse padrão de o orrên ia é possível dizer, grosso modo, que os pontos

de referên ia serão en ontrados em uma quantidade duas ordens de grandeza menor

do que as demais palavras have. Como onsequên ia, podemos esperar um impa to

muito pequeno no tamanho e no pro essamento de uma lista invertida que armazene

pontosde referên ia.

As adaptações ne essárias na fase de pro essamento de onsultas podem ser divi-

didas em dois passos. Primeiramente, a onsulta do usuário deve ser avaliada, para

tentaren ontrar um dos nomesde pontos de referên iaexistentes nalistainvertida. A

avaliação pode ser feita, no aso de uma máquinade bus a onven ional, pelo mesmo

módulo responsável por produzir re omendações, omo orreções ortográ as e exibi-

ção de links patro inados, a partir de uma análise sintáti a da onsulta. Nesse aso,

para a onsulta`hotel aeroporto dapampulha', omódulo poderia retornar o seguinte:

`Pro urando por hotel próximo ao Aeroporto da Pampulha?'. Oponto de referên-

ia poderia ainda ser informado em separado, o que restringiria a análise apenas às

palavrasdigitadasna aixade texto reservadaaesse m. Op ionalmente, osigni ado

semânti o em termos de distân ia determinado pela relação espa ial `próximo ao' na

onsulta sugerida, poderia ser espe i ado pelo usuário, que es olheria uma distân ia

adequadaàsua ne essidadede informação(ex: 800m,5km,et .) ouum valorpadrão

pode ser atribuído pelo sistema, omo, por exemplo, `3 km'. Esse valor, denominado

raio de bus a, juntamente om o ponto de referên ia denem o es opo geográ o da

onsulta.

Emseguida, os do umentos ontendo as palavras have da onsultadevemser se-

le ionados. Portanto, para a onsulta do exemplo a ima, devese sele ionar todos os

do umentos ontendoaspalavras have`hotel'e`aeroporto dapampulha',essa última

identi ada omo um ponto de referên ia e portanto tratada omo um úni o termo.

Além disso, existe uma restrição adi ional que deve ser respeitada: o es opo geográ-

 o da onsulta, denido pela expressão de posi ionamento `próximoao aeroporto da

pampulha', deve ser ompatível om as expressões de posi ionamentoen ontradas no

texto do do umento ujo ponto de referên ia é o `aeroporto da pampulha'. Para isso,

omparamosovalordoraiodebus a(ex.: 3.000metros) omainformaçãodedistân ia

armazenada na listainvertida de termos nos registrosde ada o orrên ia do ponto de

referên ia `aeroporto dapampulha' no texto dos do umentos. Dessa forma, épossível

Figura4.2: Apli ação de bus a na Web

interpretação das relações espa iais  omo se estivéssemos sele ionando sinnimos

para uma expressão de posi ionamento.

Para on luiraetapade pro essamento,osdo umentossele ionadossãoordenados

e exibidos ao usuário, ou seja, seguem o uxo normal de uma máquina de bus a.

Op ionalmente, o algoritmo de ranking pode ser modi ado para in luir o valor da

distân ia nos ál ulos de pesos dos do umentos. Dessa forma, se os do umentos

d

1

e

d

2

possuírem pesos semelhantes, mas a distân ia do ponto de referên ia em questão orrespondea3.342metrosnodo umento

d

1

e589metrosnodo umento

d

2

,

d

2

poderia ser melhor lassi ado do que

d

1

.