De acordo com Davis, Shrobe e Szolovits (1993), a principal preocupação do campo de representação do conhecimento é o entendimento e descrição da riqueza do mundo. Três técnicas são encontradas em Inteligência Artificial para construção de sistemas: (i) separar o conhecimento dos programas através de uma linguagem de representação declarativa; (ii) identificar classes gerais e suas relações, organizando o conhecimento para possibilitar herança e reutilização; (iii) caracterizar o problema de forma geral, projetando métodos e algoritmos de resolução de tarefas e deduções (GRUBER, 1991).
A importância da separação do conhecimento já havia sido reconhecida por Allen Newell, em 1982, com a proposta de inserção de um novo nível de sistemas – chamado nível de conhecimento. Segundo Newell (1982), os níveis existentes eram insuficientes para a operacionalização da lógica nos sistemas computacionais. Sua hipótese levou em consideração a existência de um nível de sistema computacional distinto, imediatamente acima do nível simbólico, caracterizado pelo conhecimento. Na visão do autor, o conhecimento é "aquilo que pode ser atribuído a um agente, de tal forma que seu comportamento possa ser calculado de acordo com o princípio da racionalidade " (NEWELL, 1982, p. 9).
Entretanto, Guarino (1995) vai além e contrapõe esta definição, apresentando a contribuição
de Clancey, que dizia que “a preocupação principal da engenharia de conhecimento seria
4 As expressões “modelo de informação” e “modelo de referência” são utilizadas nesta pesquisa em um mesmo
modelar sistemas no mundo, e não apenas replicar a forma como as pessoas pensam” (CLANCEY, 1993 apud GUARINO, 1995, p. 2). Com efeito, o autor afirma que o conhecimento está mais relacionado com a clássica noção de verdade da filosofia – em relação à leitura do mundo real – do que dependente do modo particular com que um agente inteligente persegue seus objetivos (resolve suas tarefas e realiza deduções).
Brachman (1979 apud GUARINO, 1994) definiu uma classificação para vários tipos de primitivas usadas por sistemas de representação do conhecimento. Como resultado, propôs uma classificação de cinco níveis, do homem para a máquina: Linguístico, Conceitual, Epistemológico, Lógico e Implementacional. Em sua consideração, a propósito dos ganhos do uso de ontologias para a área de representação do conhecimento, Guarino (1994) propôs a inserção de mais um nível a essa classificação. Posicionado entre o nível conceitual e o epistemológico, ele sugeriu inserir o nível Ontológico. Ou seja, para o autor é necessário a inserção de um nível onde o significado, associado a uma linguagem de representação do conhecimento, poderia ser restringido formalmente por aquilo que realmente há no mundo (do ponto de vista metafísico).
2.3.1. Ontologias
No contexto das Ciências de Computação e de Informação, Gruber (2009) define uma ontologia como um conjunto de primitivas de representação com o qual se modela um domínio de conhecimento ou discurso. Essas primitivas são tipicamente classes (conjuntos), atributos (propriedades) e relacionamentos. As definições das primitivas incluem informação sobre significado dos objetos e restrições para a aplicação consistente dos mesmos. Podem ser consideradas artefatos semânticos, pois, segundo o autor, as ontologias são especificadas em linguagens que permitem a abstração das estruturas de dados e estratégias de implementação. Essa independência do nível de modelo de dados lhes permite serem utilizadas na integração de bases de dados, criando ambiente favorável para a interoperabilidade entre sistemas de informação e especificando interfaces para serviços de conhecimento.
Gruber apresentou uma das mais citadas definições do termo ontologia, do ponto de vista de sistemas de informação, não da filosofia: “uma ontologia é uma especificação explícita de uma conceitualização” (GRUBER, 1993, p. 1). Para o autor, todo conhecimento, formalmente representado, é baseado em uma conceitualização: uma estrutura de conceitos e seus
(supostos) relacionamentos. Uma conceitualização é, assim, uma visão simplificada e abstrata do mundo que se deseja representar.
Guarino e Giaretta (1995, p. 7) criticam a visão assumida por Gruber, e apresentam outra definição de ontologia: “uma teoria lógica que explica de forma explícita e parcial uma
conceitualização”. Na visão dos autores, uma conceitualização não pode ser representada por
completo, dentre outros fatores, pois depende da percepção dos observadores (a verdade última sobre o que há no mundo seria inacessível ao homem).
Na concepção de Chandrasekaran, Josephson e Benjamins (1999), dois níveis de ontologia podem ser identificados: ontologias de núcleo e periféricas. Identificam-se, em um primeiro nível, os termos e as conceitualizações básicas necessárias sobre as instâncias de um modelo estabelecido, na forma de conceitos. No segundo nível, são nomeados diferentes tipos de instâncias, contendo restrições adicionais para os conceitos definidos no modelo existente no primeiro nível. Assim, conceitos e conceitualizações seriam partes de uma ontologia de núcleo, e os tipos de instâncias com suas respectivas restrições seriam uma ontologia periférica. Esta última incompleta, podendo receber novos tipos a qualquer momento.
Existe uma diferença ontológica entre “termos em uma linguagem” (conceitualização) e “objetos universais na realidade” (o que realmente há no mundo), e uma ontologia se
preocupa com esses últimos. 2.3.2. Terminologias
Diferentemente das ontologias, as terminologias lidam com o uso da linguagem, mostrando como esta é usada em um campo científico específico, e como seus termos são relacionados. Por se basearem em conceitos, podem diferir em função do ponto de vista de seus criadores. A explicação é que existem diferentes formas de se entender um conceito: podem ser entendidos como uma entidade mental, uma entidade teórica compartilhada, ou uma entidade linguística. Tal situação é característica do trabalho de Wüster e seus seguidores (BERZELL, 2010; SMITH, CEUSTERS e TEMMERMAN, 2005).
2.3.3. Terminologias vs. ontologias
Uma terminologia é projetada para prover delimitações claras de conceitos via definições, enquanto uma ontologia é um artefato representacional, cujas unidades são intencionadas para representar objetos universais na realidade e suas relações.
Uma ontologia requer um vocabulário específico (terminologia) que descreva um domínio e um conjunto de axiomas lógicos que garantirão o significado que se deseja para os termos do vocabulário. Isso implica que duas ontologias podem ser diferentes em termos de seus vocabulários e referirem-se à mesma conceitualização, ou seja, ao mesmo domínio de conhecimento. Nessa linha de pensamento, um compromisso ontológico pode ser definido como um acordo para a utilização de um vocabulário de uma forma consistente com a teoria especificada pela ontologia (GRUBER, 1993).
A comunidade internacional vem discutindo a utilização de terminologias como auxílio na obtenção de um sistema de RES compartilhável. Nesta discussão, inserem-se as terminologias SNOMED-CT e LOINC, dentre outras. Assim, o conteúdo dos sistemas de RES, muitas vezes em texto livre, torna-se menos ambíguo, contribuindo para a interoperabilidade semântica. Porém, a aplicação de ontologias para o domínio de RES pode tornar as terminologias logicamente mais coerentes e compatíveis com as intuições de senso comum (SMITH, CEUSTERS e TEMMERMAN, 2005).
Neste trabalho de pesquisa, assume-se a definição de ontologia como “uma teoria lógica que
explica de forma explícita e parcial uma conceitualização”, conforme Guarino e Giaretta
(1995, p. 7). Além disso, considera-se a importância de se formalizar o conhecimento em um nível separado, de forma que possa ser submetido a regras de restrição, conforme proposto por Guarino (1994). Também se considera a importância das terminologias para o processo de interoperabilidade semântica de sistemas de RES.
Relacionam-se os compromissos ontológicos definidos por Gruber (1993, 2009) com as estruturas de dados clínicos mencionadas por Kalra (2007), pois ambos aplicam restrições sobre instâncias de classes definidas em um modelo de informação estabelecido. As ontologias de núcleo e periféricas, como proposto por Chandrasekaran, Josephson e Benjamins (1999), seguem ideia semelhante. Ou seja, em um primeiro nível, representa-se um modelo de informação com classes estáveis, e em um segundo, define-se um modelo de conhecimento com regras de restrição. Essas últimas são utilizadas para a geração de instâncias válidas do modelo de informação (BEALE, GOODCHILD e HEARD, 2001). 2.3.4. Modelo de informação e conhecimento no sistema de RES compartilhável
A definição de sistema de RES compartilhável (cf. Seção 2.2.4), se alinha com essa perspectiva de separação do modelo de informação e modelo de conhecimento. O modelo de
referência e as estruturas de dados clínicos deveriam operar de forma semelhante ao que é preconizado pela relação entre ontologia e seus compromissos ontológicos; e também aos contextos em que se utiliza uma ontologia de núcleo e ontologias periféricas.
Neste ponto é relevante discutir o conceito de sistema de RES federado.