B. Ayıplı Mal ve Hizmet Sebebiyle Halinde Açılabilecek Davalar
4. Tüketicinin Seçimlik Hakları
Pode-se perceber nos modelos descritos anteriormente que os elementos de anotação são fornecidos por usuários em um formato livre, isto é, usando-se de linguagem natural, sem um controle de vocabulário. Neste caso, as anotações ficam sujeitas a problemas de heterogeneidade semântica devido à natureza ambígua da linguagem natural. Bürger et al. (2009) insere três principais questões relacionadas ao processo de anotação:
• Polissemia: os elementos de anotação podem ter interpretação ambígua, por exemplo, o termo “Java” pode ser usado para descrever um recurso sobre a “ilha de Java” ou um recurso sobre a “linguagem de programação Java”; essa situação pode reduzir a precisão na busca em um SRI.
• Sinonímia: os elementos de anotação podem ser sintaticamente diferentes, mas com o mesmo significado, por exemplo, os nomes de atributos “é imagem de” e “é pintura de” podem ser usados alternativamente por usuários e, portanto, deveriam ser ligados como atributos sinônimos.
• Gap na especificidade: os termos usados na anotação e na busca são diferentes em suas especificidades, por exemplo, quando o usuário executa a busca com o termo “queijo”, os recursos anotados com o termo “cheddar” (um tipo de queijo), caso não sejam vinculados, não serão encontrados no sistema.
Os problemas supracitados geralmente são endereçados usando-se de instrumentos como vocabulários controlados (LANCASTER, 1993, ANSI, 2005) para identificar de forma unívoca e não ambíguos recursos ou documentos envolvidos em sistemas de recuperação de informação, conforme foi explanado na seção 3.1.2 sobre representação temática de documentos.
A Figura 14 mostra como os vocabulários controlados podem ser usados em um processo de anotação e de busca de recursos. No processo de anotação, o usuário utiliza elementos do vocabulário controlado (ex. termos, conceitos) como forma de desambiguar termos destinados à descrição do recurso; já no processo de busca, o usuário produz uma consulta buscando desambiguar os termos envolvidos a partir de elementos do vocabulário controlado e, em seguida, submete esta consulta a uma máquina de busca.
102
Figura 14 - Vocabulário controlado como suporte a anotação e busca
Fonte: adaptado de Bürger et al. (2009, p.21).
Ontologias como suporte a anotações podem ser usadas como vocabulários controlados, no entanto numa perspectiva de tratamento semântico, o que permite um usuário descrever e interligar recursos existentes por meio de qualificadores como conceitos, instâncias, propriedades e restrições mantidas entre tais recursos. O modelo é endereçado à anotação semântica de documentos, o que os tornam inteligentes no sentido de possibilitar conhecimento sobre o conteúdo, viabilizando processamento pela máquina (UREN et al, 2005).
Tradicionalmente, o uso de metadados é a forma comumente empregada para gerar conhecimento sobre documentos (conforme foi visto na seção 3.1.1 sobre representação descritiva de documentos), entretanto a Web Semântica propõe anotar conteúdo de documentos usando ontologias de domínio (BERNERS-LEE, HENDLER e LASSILA, 2001). Para tal, padrões internacionais relacionados a marcações de dados, a primitivas de modelagem e a linguagens de representação são promovidos e mantidos pelo W3C para desenvolvimento de ontologias como OWL, além do esquema de anotação RDF. Shadbolt, Hall e Berners-Lee (2006) acrescentam que anotação semântica é uma abordagem subjacente aos conceitos preconizados pela Web Semântica no que tange ao fornecimento de significado à organização da informação por meio de conexões lógicas entre os termos, o que promove interoperabilidade entre sistemas. A seção 3.3.3 contribui na elucidação de conceitos envolvendo a organização da Web Semântica.
Segundo Uren et al (2005), anotação semântica identifica formalmente conceitos e relações entre conceitos em documentos, e vão além de anotações textuais sobre o conteúdo. Ding, Embley e Liddle (2006) complementam afirmando que anotação semântica deve ser explícita, formal e livre de ambiguidade sendo, respectivamente, acessível, entendida e identificável publicamente. A Figura 15 exibe recursos (ou objetos digitais) sendo anotados por elementos de ontologias, promovendo, desse modo, interligações semânticas (Rel 1, Rel 2...) entre os recursos.
Figura 15 - Modelo de anotação por meio de ontologias
Fonte: adaptado de Bürger et al. (2009, p.19).
As ontologias podem ser usadas tanto para anotar recursos, como ilustrado na Figura 15, quanto para auxiliar o processo de anotação. No primeiro caso, usuários (ou grupos de especialistas) constroem ontologias para fornecer seus componentes (ex. classes, instâncias, relações) como elementos de anotação. Por exemplo, para vincular uma página sobre “Napoleão” a uma página sobre “Pessoas” com a relação ontológica is-instance-of (é-instancia-de), o usuário anota a página
sobre Napoleão com um elemento de anotação da ontologia; esses elementos, que possivelmente foram disponibilizados por diferentes usuários, são em seguida agregados a uma ontologia maior que pode ser vista como uma estrutura de anotação complexa usada para descrever os recursos anotados (BÜRGER et al., 2009). Tal cenário faz menção ao paradigma Linked Data (assunto
tratado na seção 3.3.3.5), uma proposta emergente do W3C para expor e compartilhar dados como recursos na Web e interligá-los semanticamente por meio de ontologias construídas e disponibilizadas por comunidades diversas. No segundo caso, usuários fornecem elementos de anotação (de forma simples e transparente) e promovem ligações dessas anotações a fontes de conhecimento subjacentes a ontologias. Por exemplo, para evitar ambiguidade sobre a palavra “Paris” oriunda de um texto, uma anotação semântica poderia relacioná-la a um elemento da ontologia que a identificasse na categoria “Cidade” bem como associá-la à instância “França” pertencente à categoria “País”. Desse modo “Paris” não poderia ser referenciada de outra forma a não ser como uma cidade francesa. O propósito da tese é propor um modelo conceitual baseado em ontologias para descrição de documentos multimídia. Desse modo, o primeiro cenário vai ao encontro da proposta em conceber um modelo com estrutura ontológica precisa do domínio multimídia para fins de anotações semânticas em ambientes digitais.
Algumas vantagens podem ser destacadas no modelo de anotação por meio de ontologias, a saber: i) por ser um modelo conceitual formal, permite relações explícitas e significativas entre dado estruturado (tal como uma ontologia) e não estruturado (um texto, por exemplo). Isso possibilita uma variedade de técnicas de recuperação, que podem ser baseadas em
104 esquema de conhecimento expresso em uma ontologia; ii) beneficia raciocínio automatizado, coocorrência de anotação ou entidades no mesmo recurso ou contexto; e iii) combina tudo isso com tipos específicos de dados não estruturados, como busca em texto completo em um sistema de recuperação da informação. Desvantagens também são desdobradas nesse modelo o qual apresenta novos desafios para anotadores humanos, embora proporcione uma riqueza no processamento automático relacionado às anotações. Duas vertentes estão entre os principais desafios para esse modelo de anotação: (i) usabilidade; e (ii) manutenção dos modelos conceituais. Em (i) o aspecto de usabilidade é a chave para o envolvimento humano na geração de metadados semânticos e a principal barreira a ser enfrentada para permitir formas harmônicas de interação do usuário com o
software e os dados. Uma das razões é a riqueza inerente e dinâmica das ontologias (em oposição a
um esquema pré-definido e fixo) com suas estruturas múltiplas de taxonomias e subsunção sobre o modelo. Um desafio para especialistas em usabilidade e projetistas de interface visual é capacitar um ser humano a encontrar um caminho para uma classe, entidade ou relacionamento que ele queira usar como anotação. Além disso, aplicações do mundo real envolvem múltiplas instâncias e bases de fato, e suas ontologias correspondentes, alinhadas entre si, resultam em milhões ou mesmo bilhões de descrições de entidades individuais, expondo um desafio em termos de escalabilidade, busca intuitiva e métodos completos auto sugestivos. Outra tarefa desafiadora é a (ii) manutenção das ontologias, que envolve a atualização do conhecimento proveniente de fontes externas, além de alinhamento sintático e semântico oriundo de aproveitamento de ontologias existentes (contexto de reúso).
Como exemplo de aplicações citam-se a OntoWiki93, uma wiki semântica de acesso livre e de código aberto que serve como um editor de ontologias e sistema de aquisição de conhecimento; e o sistema Semantic Wikipedia (KRÖTZSCH et al., 2006), uma extensão da
enciclopédia livre Wikipedia94 cuja proposta é reforçar a semântica de seu conteúdo. Neste sistema,
os usuários podem interligar artigos através de suas anotações com links como “autor” ou “nasceu
em”, permitindo consultas e buscas de modos mais específicos.
Finalmente, “ontologias como suporte a anotações semânticas” (espaço de interesse desta pesquisa-tese) tornou-se tema de pesquisa em duas áreas em especial: engenharia de ontologias e ciência da Web. Pesquisas na área de engenharia de ontologias buscam endereçar problemas relacionados ao estabelecimento de padrões sobre modelos, taxonomias, vocabulários e terminologias de forma a se conseguir clareza, coerência e compromisso ontológico sobre um domínio de conhecimento (GRUBER, 1993a; GUARINO, 1998). No que diz respeito à clareza, uma ontologia deve ser capaz de expressar claramente o significado de cada termo; ser coerente
93 http://aksw.org/Projects/OntoWiki.html 94 http://www.wikipedia.org
com as demais definições, isto é, uma sentença inferida não poderia contradizer outra definição; e exigir compromisso ontológico a fim de estabelecer um acordo semântico entre uma comunidade e o que é expresso em uma ontologia. Por outro lado, a ciência da Web intensifica pesquisas na evolução da Web atual, estendendo-a numa perspectiva de agregação de significado à informação para viabilizar leitura e interpretação tanto por computadores quanto por pessoas (SHADBOLT, HALL e BERNERS-LEE, 2006). Tal extensão redundou na denominada Web Semântica, que faz uso de ontologias e é responsável pela compatibilização de conceitos encontrados em bancos de dados dos mais diversos tipos.
A Web Semântica é apresentada na próxima seção juntamente com suas propostas emergentes de Linked Data e Linked Open Data no sentido de fundamentar princípios que regem os
objetos de investigação e análise nesta pesquisa: padrões de metadados, vocabulários controlados e ontologias, concebidos para fins de anotação semântica de recursos multimídia. De modo a facilitar o entendimento do conteúdo informacional inerente a esses objetos, algumas linguagens comumente empregadas na Web para suas representações são descritas buscando-se visualizar evolução e níveis de expressividade em seus construtos. Allemang e Hendler (2008) definem “expressividade” como uma habilidade da linguagem em descrever certos aspectos do mundo, e que quanto mais expressiva for a mesma, mais conseguirá expressar declarações sobre um modelo.