Considerando-se as peculiaridades dos campos que têm as ontologias como objeto de estudo, as diversas definições do termo apresentam características próprias.
Serão apresentados a seguir, conceitos de ontologias nos três campos citados (Filosofia, Ciência da Informação, Ciência da Computação), começando pela Filosofia. Segundo o Dicionário Oxford de Filosofia, Ontologia é um “termo derivado da palavra grega que significa ‘ser’, usado desde o século XVII para denominar o ramo da metafísica que diz respeito àquilo que existe”. Especificamente na filosofia, a vogal inicial maiúscula é utilizada por muitos autores na grafia da palavra.
Entre os autores, oriundos dos três campos acima citados, cujos trabalhos tiveram como foco estabelecer conceitos a respeito do termo ontologia, tem-se, na ordem cronológica dos trabalhos publicados: GRUBER (1993), GUARINO e GIARETTA (1995), USCHOLD e GRÜNINGER (1996), VICKERY (1997), CHANDRASEKARAN et al (1999), SOERGEL (1999), SOWA (2000), CORAZZON (2002), GILCHRIST (2003) e POLI (2003).
A Ciência da Computação, conforme mencionado anteriormente tem feito uso de ontologias buscando a construção de Sistemas Baseados em Conhecimento. Tem-se entre as definições clássicas de ontologia, a de Tom Gruber, para quem “uma ontologia é uma especificação explícita de uma conceitualização compartilhada”. É importante entender o contexto em que se enuncia este conceito, pois em Gruber (1991) fica clara a preocupação da época da comunidade de pesquisadores da IA, que perceberam o árduo trabalho que requeria a criação de bases de conhecimento sempre que se desenvolviam sistemas baseados em conhecimento. Buscando uma nova abordagem para este processo, enxergou-se a necessidade de as pesquisas apontarem na direção do desenvolvimento de bases de conhecimento reutilizáveis e que pudessem ao mesmo tempo interoperar com outras bases de conhecimento, o que equivale a dizer, compartilhar conhecimento.
A definição de Gruber encerra vários aspectos que devem ser analisados. O vocábulo “especificação”, refere-se à descrição formal dos conceitos de forma a permitir sua manipulação computacional, e ao mapeamento lógico que permite estabelecer as relações entre estes conceitos. Quanto ao termo “conceitualização”, Gruber se refere ao universo de objetos, conceitos e outras entidades que se supõe existir dentro de uma área de conhecimento, incluindo também as relações entre eles.
Ao citar “entidades que se supõe existir”, a definição acima se vê diante do dilema de abordar uma profunda questão filosófica no que diz respeito à existência, no entanto, este dilema é resolvido de uma forma bastante pragmática pelos pesquisadores da inteligência artificial que
definem “o que existe” como aquilo que pode ser representado. Sendo que para representar “o que existe” a Ciência da Computação lança mão da lógica formal, e através de axiomas e regras de inferência chegam à representação formal e explícita das entidades e dos seus relacionamentos.
Em uma outra definição clássica da área, Nicola Guarino (1996), pesquisador da Universidade de Padova na Itália, também com interesses na área de inteligência artificial, afirma que ”uma ontologia é uma teoria lógica para relacionar o significado pretendido de um vocabulário formal, isto é, seu comprometimento com uma conceitualização particular do mundo”. Vale ressaltar nas duas definições anteriores (Gruber e Guarino) que o termo “conceitualização” mesmo não possuindo tradução no português pode ser entendido como o processo de abstração e simplificação do mundo que se deseja modelar, ou em outras palavras, trata-se dos conceitos sobre a realidade que se deseja representar.
É importante ressaltar que o termo conceitualização foi inicialmente definido por Nilsson (1991) e é com esta conotação que o termo é utilizado na definição de ontologias apresentada por Gruber. No entanto, Guarino & Giaretta (1995) destacam que a conceitualização enunciada por Nilsson, considera aspectos extensionais dos objetos e suas relações, sendo que uma ontologia deve considerar aspectos intensionais. O que é questionado aqui é a necessidade de a ontologia lidar com definições precisas dos conceitos (objetos) e suas relações, o que não é possível ser feito a partir de uma análise extensional, que trata de objetos e as relações existentes em dadas circunstâncias, que evidentemente podem ser mutáveis ao longo do tempo. Em outras palavras, ontologias precisam ser modeladas a partir de conceitos e relações duradouras, isto é, que sejam válidas independentemente do estado de coisas ou circunstâncias, permitindo agregar através da estruturação destes conceitos um maior conteúdo semântico.
Podemos ilustrar as diferenças acima citadas, exemplificando através de uma definição para os elementos químicos que fazem parte do grupo dos gases nobres. Utilizando uma definição intensional, ter-se-ia: elementos não metálicos, muito estáveis do grupo 18 da tabela periódica. Com exceção do hélio, todos apresentam oito elétrons no último nível, o mais externo. Já no caso de uma definição extensional, ter-se-ia: hélio, neônio, argônio, criptônio, xenônio e radônio.
Para Uschold (1996), uma ontologia é o termo que designa o entendimento compartilhado de algum domínio de interesse. Ela funciona como um arcabouço unificado, reduzindo ou eliminando confusões terminológicas ou conceituais que possam surgir entre indivíduos com diferentes pontos de vista dentro de uma comunidade específica. A definição proposta por Uschold vai um pouco além da de Gruber, ao afirmar que ontologias melhoram não apenas a comunicação entre humanos, mas também são instrumentos que facilitam a comunicação entres sistemas construídos a partir de modelagens, linguagens e ferramentas diferentes, garantindo portanto, a interoperabilidade. Esta comunicação entre sistemas e a possibilidade de comunicação em ambientes digitais é justamente o que torna uma ontologia em instrumento adequado e de grande importância para lidar com os mecanismos existentes na web.
Guarino (1998, p. 5) destaca a importância das pesquisas em ontologias para a engenharia do conhecimento, representação do conhecimento, projetos de integração de banco de dados, modelagem da informação, análise orientada a objetos e recuperação da informação. Guarino apresenta o termo Ontologia (com O maiúsculo) para se referir a uma disciplina particular da Filosofia, enquanto ontologia (com o minúsculo) é o artefato ou ferramenta utilizada na Ciência da Computação para construção de sistemas de informação. Segundo ele, uma ontologia é uma teoria lógica que esclarece o significado pretendido de um vocabulário formal, isto é, seu comprometimento ontológico com uma conceitualização particular do mundo.
Percebe-se que o conceito de ontologias na Ciência da Computação veio evoluindo ao longo dos anos, desde que o conceito começou a ser formulado no início da década de 90. Podemos afirmar que atualmente o conceito já se encontra mais solidificado e estável, assim como a compreensão do universo de aplicações possíveis.
Foi mencionado anteriormente que o interesse da Ciência da Computação pelo estudo de ontologias foi anterior ao da Ciência da Informação, sendo que um dos primeiros artigos que abordaram esta temática foi o de VICKERY (1997). No artigo, Vickery discute o conceito de ontologias dado pelo campo da engenharia do conhecimento e retoma as definições dadas por Gruber e Guarino (acima citadas). Baseado no trabalho de Guarino, Vickery faz um importante esclarecimento a respeito da granularidade das ontologias, se referindo, ao nível de especificidade que a hierarquia de conceitos deve atingir, ressaltando que ontologias devem possuir alta granularidade, de forma a incluir todos os conceitos específicos que ocorrem em
um dado domínio.
Vickery destaca que os primeiros trabalhos científicos tendo ontologias como tema central foram apresentados por pesquisadores da Ciência da Informação em 1996 na conferência da Informatics in the Scientific Knowledge – ISK.
Por outro lado, GILCHRIST (2003) publicou um trabalhou que apresenta como contribuição relevante o fato de buscar esclarecer a confusão terminológica que vinha se estabelecendo à época na comunidade científica da Inteligência Artificial, estudiosos da web semântica e os próprios cientistas da informação, a respeito dos termos tesauros, taxonomias e ontologias. Em comum pode-se afirmar que estes três instrumentos são utilizados para organização e recuperação da informação. A respeito das definições dos termos tesauros e ontologias, a pesquisa desenvolvida por MOREIRA (2003, p. 23-54) é bastante esclarecedora.
O termo taxonomia esteve durante muito tempo ligado ao campo das ciências naturais, em particular à Biologia (Botânica e Zoologia), que a utilizou para fazer a classificação dos seres vivos utilizando critérios que claramente revelam a influência do pensamento Aristotélico de classificação, ao estabelecer “differentias” para propriedades que distinguem diferentes espécies do mesmo gênero. Taxonomia é definida como ciência da classificação, ao olharmos retrospectivamente as origens e evolução das teorias classificatórias, pode-se afirmar que as taxonomias se apóiam em fundamentos teóricos da classificação que cronologicamente são anteriores aos tesauros e às ontologias. É importante destacar que a construção de ontologias passa necessariamente pela organização de conceitos em taxonomias, porém esta é apenas uma das etapas do processo.
Enfatiza-se que ainda hoje é comum perceber esta confusão terminológica, inclusive no seio da comunidade da Ciência da Informação, onde algumas vezes os termos tesauros e ontologias são utilizados indistintamente como se os mesmos fossem equivalentes. O objetivo da pesquisa de Gilchrist foi tentar delinear claramente as semelhanças e diferenças existentes entre os três termos. Ele inicia dando as definições dadas pelo Dicionário Inglês Oxford, incluindo na sua análise outros dicionários da área de biblioteconomia e Ciência da Informação. Fazendo um levantamento estatístico nos registros do LISA - Library and Information Science Abstracts, verifica que o termo tesauro aparece 2.313 vezes, taxonomia, 285 vezes e ontologias apenas 163.
A partir do levantamento realizado no LISA, Gilchrist afirma que a literatura não vem acompanhando as novas aplicações que taxonomias vêm experimentando ao longo do tempo (uso em diretórios web, portais corporativos, categorização automática). Quanto ao termo tesauro, este parece estar sendo utilizado de forma mais apropriada tanto quanto no seu sentido clássico quanto no mais atual. Por outro lado o termo ontologia quando citado na literatura não segue o significado ancorado na Filosofia (usado pelo dicionário Oxford), e nem o uso atual corrente do termo. Neste ponto, o autor cita a definição clássica de Gruber, já mencionada anteriormente, e dá destaque a ontologias largamente conhecidas como a desenvolvida no projeto CYC.
Quanto à Ciência da Informação, já foi mencionado que por serem estruturas informacionais, as ontologias têm despertado grande interesse nesta comunidade científica, uma vez que a construção das mesmas demanda conhecimentos específicos, tais como teoria da classificação, teoria do conceito, taxonomias que fazem parte do expertise da área. Fica evidente também que o alto potencial semântico que as ontologias incorporam, tem sido percebido e utilizado pelos estudiosos da área interessados na organização e representação do conhecimento.
Diante do exposto, observa-se que há fortes nuances nos conceitos acima apresentados, situação de certo modo compreensível, se considerarmos os olhares e prismas diferenciados sob o qual o assunto é analisado, e que não podem ser ignorados, uma vez que dizem respeito às bases epistemológicas sobre as quais repousa cada uma das ciências acima.
Baseado nos diversos conceitos apresentados e buscando atender aos propósitos deste trabalho, o autor da presente pesquisa propõe a enunciação do seguinte conceito:
“Uma ontologia representa a modelagem de um ser específico ou área de conhecimento específica, que ao ser analisada e estudada nos leva a compreender a essência do Ser, permitindo relacionar de maneira inequívoca, precisa e organizada as suas propriedades, características, e o seu comportamento”.
Vale esclarecer na definição acima que o conjunto de dados que define o ser na sua essência e acidentes prescinde do uso de um vocabulário único baseado em termos e conceitos que gozem do maior consenso possível entre os membros da comunidade. Estes dados devem estar rigidamente estruturados, sendo esta estrutura construída a partir de técnicas
classificatórias, e os seus conceitos fundamentados em assertivas e axiomas baseados em lógica formal. Somente desta forma a modelagem possibilitará que ontologias sejam manuseadas tanto pelo ser humano como por máquinas.