• Sonuç bulunamadı

Turing Testi

Belgede Sinemada Yapay Zeka (sayfa 37-42)

Os esquemas conceituais podem ser vistos como modelos de dados com uma definição formal de classes (entidades), suas características (atributos) e como estas classes se relacionam umas com as outras (relacionamento). Eles podem ser usados para o desenho de banco de dados, modelagem de classes e troca de dados, mas para as redes de dados sobre biodiversidade, eles também permitem que os provedores heterogêneos sejam vistos como um único e extenso banco de dados (Copp; De Giovanni, 2008).

50 Os esquemas federados controlam essa heterogeneidade entre os participantes ao definir uma semântica para a rede, ou seja, eles definem os tipos de dados (conceitos) trocados na rede, independente do protocolo de mensagens.

Esta semântica é realmente aplicada quando os provedores mapeiam os conceitos do esquema federado no banco de dados local. A partir daí, quando um provedor recebe uma consulta, ele a transforma para o padrão do gerenciador de banco de dados local, analisa o mapeamento de campos, para então executar a consulta. Depois, o caminho inverso é feito, e a resposta à consulta é formatada de acordo com um modelo de saída antes de ser enviada.

É possível que o modelo de saída (output model) coincida com o esquema conceitual e, neste caso, diz-se que o modelo canônico foi adotado. Isto acontece quando o esquema (que define os conceitos) foi escrito em XML Schema, que é a linguagem utilizada para descrever o output model. Todavia, é importante considerar a possibilidade de ter diferentes modelos de saídas a partir de um mesmo esquema conceitual (Copp; De Giovanni, 2008).

No caso das redes DiGIR e BioCASE, apenas um esquema canônico é suportado, o Darwin Core e o ABCD, respectivamente (Canhos et al., 2004 ) (Copp; De Giovanni, 2008). Já o TAPIR, pode trabalhar com qualquer esquema federado (TDWG, 2007).

3.4.2.1. Darwin Core

O esquema conceitual Darwin Core (DwC) foi originalmente criado para ser usado pelo protocolo DiGIR (Copp; De Giovanni, 2008). Ele foi projetado para facilitar a troca de informações sobre ocorrências geográficas de organismos e a existência física de espécimes em coleções (TDWG, 2007). Ele é um XML Schema simples com um número pequeno de elementos que cobrem as informações básicas de registros biológicos de todos os grupos taxonômicos (Canhos et al., 2004, Johnson, 2007). Os elementos da versão 1.4 do esquema contêm informações sobre a taxonomia do espécime, a localização geográfica da ocorrência e os elementos de referência (TDWG, 2007). Esta versão não é a recomendada para uso

51 pelo TDWG, pois está em validação, no entanto, ela já é usada pelo GBIF em seu portal.

Atualmente, o Darwin Core é tratado como um vocabulário de termos, que podem ser referenciados para compor esquema, tais como o Simple Darwin Core, que é uma versão que engloba os 45 elementos do DwC. Não existe uma estrutura de agregação entre os elementos do Simple Darwin Core, todos os elementos estão no mesmo nível hierárquico. Efetivamente, como XML Schema, ele não pode ser usado como estrutura de troca de dados, porque apenas um elemento raiz é permitido em uma instância XML. Por isso, é preciso definir outro XML Schema (application schema) referenciando os elementos do Darwin Core dentro de um ou mais grupo de elementos (Copp; De Giovanni, 2008).

Extensões

Um esquema Darwin Core permite a extensão do seu esquema para usos específicos, não tratados naturalmente pelo esquema padrão (TDWG, 2007). Nesta extensão, ele é acrescido de novos elementos (Cartolano-Júnior et al., 2007). Para serem consideradas extensões oficiais, as novas propostas devem ser submetidas ao TDWG (item 3.2.5) para validação da comunidade científica.

A criação de extensões para o DwC deve seguir recomendações e procedimentos definidos no Darwin Core Namespace Policy (TDWG, 2007) que, basicamente, instrui o desenvolvedor a considerar se os novos termos podem ser acomodados com uma simples revisão da descrição ou comentário de um termo já existente, antes de criar um novo termo.

3.4.2.2. ABCD

O Access to Biological Collection Data - ABCD é um esquema complexo para acesso e troca de dados sobre espécimes e observações (ou seja, dados primários de biodiversidade) (ABCD, 2008). O ABCD é mantido por um grupo do TDWG que

52 trabalha em conjunto com o Committee on Data for Science and Technology – CODATA e é utilizado principalmente na Europa, em conjunto com o protocolo BioCASE (Copp; De Giovanni, 2008, Canhos et al., 2004). A versão atual do esquema (v2.06) contém tipos de dados reutilizáveis e elementos específicos de cada disciplina da biologia, que vão desde coleções paleontológicas até coleções de organismos vivos (ABCD, 2008).

O ABCD é um esquema complexo, que comparado com o Darwin Core, agrega outros dados relevantes ao estudo da biodiversidade, tais como biologia, comportamento, literatura, produtos de análises, ou arquivos multimídia, por exemplo.

Ambas as abordagens têm as suas vantagens e desvantagens: os esquemas normalizados oferecem as vantagens da abrangência, flexibilidade e integridade, enquanto podem ser penalizados pela dificuldade de serem manipulados, criados, consultados e enviados, comprometendo o desempenho e os custos; por outro lado, os esquemas simples são facilmente manipulados (até mesmo em uma planilha de dados), mas deixam a desejar quanto à integridade e qualidade dos dados (Johnson, 2007).

3.4.2.3. Plinian Core e SPM

O Plinian Core (PliC) é um conjunto de conceitos que definem atributos para integrar e recuperar informações sobre espécies (Plinian Core, 2007). Ele é um esquema conceitual extenso que carrega diversos tipos de dados: identificação do registro, taxonomia da espécie, ciclo de vida, comportamento, conservação e demografia, distribuição, uso, referências e até folclore (Cartolano-Júnior et al., 2007).

O PliC, entre outros esquemas de dados de espécies, é base para a criação de um novo modelo de dados de espécies organizado pelo grupo Species Profile

Model (SPM) do TDWG (TDWG, 2007). Este padrão será complementar aos

esquemas de espécimes ABCD e Darwin Core na identificação das espécies dos indivíduos.

53 O desenvolvimento do Plinian Core é coordenado pelo Instituto Nacional de

Biodiversidad (INBio) da Costa Rica.

Belgede Sinemada Yapay Zeka (sayfa 37-42)