• Sonuç bulunamadı

KURAMSAL VE KAVRAMSAL ÇERÇEVE

3. Örgütsel Faktörler:

2.3. Sağlık Anksiyetesi

Uma anotação semântica permite que computadores possam entender a semântica de um conjunto de dados. Esse processo é mais usado na área da web semântica, uma iniciativa promovida pelo World Wide Web Consortium (W3C), que visa o processo de adicionar conteúdo e/ou metadados em páginas da web para oferecer automação, integração e reutilização de dados entre diversas aplicações (Agosti et al., 2007). Para cumprir estas exigências, uma anotação deve ser

baseada em um modelo de domínio formal (por exemplo, uma ontologia).

Para o desenvolvimento dessa tese, especialistas da área médica serão responsáveis por anotar semanticamente os termos mais usados na área que estão armazenados no banco de dados. A seguir, serão definidas entidades mapeadas que são conectadas as descrições semânticas da ontologia. O resultado desse processo de associação é gravado em um repositório de índice semântico. Esse repositório utiliza ponteiros para referenciar os termos da ontologia e as entidades nomeadas no texto.

O repositório semântico (exemplificado na Figura 12) constitui de uma base de dados contendo informações de diferentes fontes que mantém os índices múltiplos para diferentes tipos de conteúdo e permite executar diferentes tipos de pesquisas. São similares aos tradicionais sistemas de gerenciamento de banco de dados, mas permitem o armazenamento, consulta e administração de dados estruturados ou semi7estruturados. Os repositórios semânticos oferecem fácil integração de dados diversos e mais poder de análise desses dados (Kiryakov et al., 2003a).

Figura 12: Anotação semântica utilizado por Kiryakov et al. (2003). Fonte: (Kiryakov et al., 2003b)

O repositório semântico desenvolvido para esse trabalho constitui de um backbone contendo informações das bases de dados de pacientes, laudos, exames, artigos científicos, toxicologia clinica, dicionários semânticos e ontologias médicas. O resultado da utilização de anotações semânticas juntamente com repositórios semânticos, consiste em basicamente um documento enriquecido com conhecimento compartilhado e maior liberdade de reutilizar em diversas pesquisas.

Uma anotação semântica fornece uma união entre os dados contidos em um documento e uma ontologia. Normalmente uma anotação semântica é uma referencia para um ou mais termos formalmente definidos em uma ontologia. Esse processo de anotar semanticamente um documento vem sendo estudado por várias iniciativas com o objetivo de tornar tal processo o mais automático possível, uma vez que realizar anotações semânticas de forma manual é muito trabalhoso (Kiryakov et al., 2003a; Reeve e Han, 2005; Embley et al., 2006). O processo de anotação semântica é definido pela criação de entidades nomeadas no texto, como por exemplo, nome, cargo, especialidade.

Como descrito anteriormente, o repositório semântico é responsável pelo armazenamento de informações médicas de diferentes tipos de bases de dados, que permite ao usuário executar tarefas e criar novas informações.

O trabalho aqui apresentado defende a utilização da técnica de expansão de pesquisa, juntamente com detecção de expressões negativas e anotação semântica de textos a fim de melhorar os índices de precisão nos procedimentos de busca em documentos médicos. Nesse sentido, serão apresentados os trabalhos relacionados ao tema dessa tese.

Foram utilizados os portais de pesquisa da IEEEXplore, ACM Digital Library, ScienceDirect, para recuperar os trabalhos correlatos a essa tese. A pesquisa dividiu7se em três categorias de busca por palavras chaves em cada uma dos portais:

1) Expansão de pesquisas. Nessa categoria foram pesquisadas nos portais as seguintes expressões: Query expansion, medical databases, ontology, indexing. Essa pesquisa retornou no ScienceDirect 66 artigos, no IEEEXplore, 132 artigos e no ACM Digital Library, 8 artigos. Nesse último portal de pesquisa, foram utilizados outros conjuntos de palavras chaves, mas a maioria já continha os mesmos trabalhos encontrados nos outros dois portais de pesquisa. Dessa forma, continuou7se com os mesmos critérios para os três portais de pesquisa. Desse conjunto de artigos encontrados (206), foram selecionados cinco mais importantes que tratavam somente sobre pesquisas em bases de dados biomédicos e que continham pesquisas referente à ontologias e indexação de dados usando ferramentas de buscas.

2) Detecção de expressões negativas. Aqui foram pesquisadas nos portais de buscas as expressões: negation detection, natural language processing, information retrieval e clinical data mining. Essa pesquisa retornou no ScienceDirect 51 artigos, no IEEEXplore, 48 artigos e no ACM Digital Library, 53 artigos. No portal de pesquisa IEEEXplore, foram utilizados outros conjuntos de palavras chaves, concatenadas com operadores OR e AND, mas a maioria já continha os mesmos trabalhos encontrados nos outros dois portais de pesquisa. Dessa forma, continuou7se com os mesmos critérios para os três portais de pesquisa. Desse conjunto de artigos encontrados (153), foram selecionados dez mais importantes que tratavam somente sobre técnicas de extração de termos em bases de dados médicas e que tinham relação direta com informações de saúde. Houve casos onde dois ou mais artigos

selecionados referenciavam a um mesmo estudo. Nesse caso somente um dos artigos foi selecionado. Ao final foram detalhados somente os três mais relevantes ao objetivo dessa pesquisa;

3) Anotação semântica de textos. Nessa última categoria de pesquisa foram executadas as seguintes expressões: Semantic Annotation, Medical Databases, Indexing, Medical Ontology, Knowledge, Semantic Search. Essa pesquisa retornou no ScienceDirect 141 artigos. Utilizando os mesmos critérios de buscas no IEEEXplore, foram encontrados somente 2 (dois) artigos que satisfaziam a busca. Nesse caso foram incluídos o operador OR à expressões para expandir o universo de pesquisa. Com a nova expressão (Semantic OR Annotation OR Database OR Medical OR Ontology OR Knowledge OR Semantic OR Search) foram encontrados 9(nove) artigos e no ACM Digital Library,foram encontrados somente 9 (nove) artigos. Nesse último portal de pesquisa, foram utilizados outros conjuntos de palavras chaves juntamente com o operador lógico OR para compor a nova pesquisa (semantic annotation, indexing medical data, OR medical ontology). Nesse cenário, foram encontrados 121 artigos. Do total de artigos encontrados (271), foram selecionados cinco mais importantes que objetivam anotar semanticamente os termos e criar as anotações semânticas (entidades nomeadas) em bases de dados médicas baseadas em ontologias.

Ao final da revisão sistemática, foram selecionados 11 (onze) artigos (apresentados em resumo no N $' 5 O$ % $#

$ $' 0), que satisfizeram todos os critérios de inclusão e exclusão descritos acima e, que serão de base referencial ao desenvolvimento dessa tese.

Para cada um dos artigos estudados será apresentado um pequeno resumo, os resultados positivos e negativos encontrados e uma justificativa sobre como ele é importante para o desenvolvimento desse trabalho. O N $' 5 O$ % $# $ $' 0 mostra um resumo dos artigos encontrados e quais os parâmetros que foram utilizados em cada um dos portais pesquisados.

$ , F ' ( !'% %C ( '%B (

' $ (

, $(# (D!%( (

ScienceDirect Query expansion, medical

databases, ontology, indexing.

66

IEEEXplore Query expansion, medical

databases, ontology, indexing.

132

ACM Digital

Library

Query expansion, medical

databases, ontology, indexing.

8

' "# , ((6 ( $ B '%= (

ScienceDirect negation detection, natural

language processing,

information retrieval e clinical data mining

51

IEEEXplore negation AND detection, OR

natural AND language AND

processing, OR information

AND retrieval AND clinical data mining.

48

ACM Digital

Library

negation detection, natural

language processing,

information retrieval e clinical data mining.

53

$ ' "# ( F$'% ' ,' (

ScienceDirect Semantic Annotation, Medical

Databases, Indexing, Medical Ontology, Knowledge, Semantic Search

141

IEEEXplore Semantic OR Annotation OR

Database OR Medical OR Ontology OR Knowledge OR Semantic OR Search. 9 ACM Digital Library

semantic annotation, indexing

medical data, OR medical

ontology

121

E78 Quadro 1 Parâmetros utilizados para pesquisa para as três categorias

Benzer Belgeler