3.4. İdari Vesayet Denetimi
3.4.5. İdari vesayet uygulamaya yetkili organlar
O projeto Boemie175 (Bootstrapping Ontology Evolution with Multimedia Information)
foi organizado e constituído por membros vinculados a Centros de Pesquisa Europeus176 interessados em análise semântica multimídia, a saber: Kalliopi Dalakleidi, Stamatia Dasiopoulou, Giorgos Stoilos, Vassilis Tzouvaras (membro do W3C Multimedia Annotation Interoperability Group) e Yiannis Kompatsiaris. O projeto almejou o desenvolvimento de ontologias multimídia e
de domínios específicos com o propósito de representar semântica multimídia dentro de um cenário de aplicação integrada contemplando representação e aquisição de conhecimento, raciocínio, evolução de ontologia multimídia, recuperação e apresentação. A representação de semântica multimídia endereça características de mídia, tais como estrutura de conteúdo, descritores de baixo nível, e características de um domínio específico. O projeto teve seu início no ano de 2006 e relatório final publicado no ano de 2008 (DASIOPOULOU et al., 2008).
A infraestrutura do projeto Boemie foi desenvolvida para fornecer recursos destinados a gerenciamento e combinação de informações específicas de um domínio e relacionadas à multimídia, permitindo: i) anotação semântica de documentos multimídia após a extração de conteúdo de baixo nível; ii) enriquecimento de anotação de documentos multimídia pelo fornecimento de definições para conceitos complexos (alto nível) utilizados por serviços de raciocínio; iii) apresentação e recuperação de documentos multimídia; e iv) evolução e processo de aprendizagem por meio de uma infraestrutura modular e padronizada baseada em ontologias.
O modelo ontológico desenvolvido para a infraestrutura do projeto Boemie consiste de algumas ontologias inter-relacionadas e interligadas que podem ser classificadas em duas categorias, a saber: i) ontologias multimídia; e ii) ontologias de domínio. Em (i) têm-se a
175 http://www.boemie.org/ (acesso indisponível até o presente momento da pesquisa).
176 National Centre for Scientific Research - Demokritos (NCSR); Fraunhofer-Gesellschaft zur Förderung der
angewandten Forschung e.V.(FHG/IMK); University of Milano (UniMi); Centre for Research and Technology Hellas (CERTH);Hamburg University of Technology (TUHH);Tele Atlas (TA).
Multimedia Content Ontology (MCO) e a Multimedia Descriptors Ontology (MDO). A MCO
representa informação concernente à estrutura de conteúdo e a MDO representa informação numérica de baixo nível extraída por meio de ferramentas de análise e extração. Em (ii) têm-se a
Athletics Events Ontology (AEO) e a Geographic Information Ontology (GIO). A AEO descreve o
domínio de interesse do projeto Boemie relacionado a eventos públicos de atletismo e a GIO descreve informação geográfica. Os arquivos owl referentes às quatro ontologias foram adquiridos no sítio177 do Multimedia Knowledge and Social Media Analytics Laboratory pertencente ao Information Technologies Institute. Num primeiro momento, tentou-se obter acesso às ontologias
pelo sítio oficial do projeto, mas o mesmo até o momento da pesquisa encontrava-se sem acesso e suporte. Em consequência, entrou-se em contato por e-mail com os autores das ontologias e obteve- se êxito no retorno e na orientação de acesso ao material por um de seus desenvolvedores, Yiannis Kompatsiaris.
A arquitetura modular do projeto Boemie traz vantagens ao processo de anotação multimídia pelo fato de as características de estruturação multimídia ser independentes de conteúdo e comuns para documentos desta natureza. Outra vantagem é a interconexão entre as ontologias de mesma categoria bem como entre ontologias multimídia e de domínio. A seguir as características das ontologias multimídia envolvidas no projeto Boemie (DALAKLEIDI, 2011) e de interesse para a pesquisa são apresentadas.
A Multimedia Content Ontology (arquivo mco_v2_15.owl) endereça características
estruturais (ex. decomposição semântica) pertencentes a diferentes tipos de conteúdo multimídia, permitindo embutir anotações em partes específicas da mídia (ex. track de áudio, segmento de
vídeo, imagem), além de manusear semânticas parte-todo, como, por exemplo, a imagem de um atleta (parte) segmentada de uma imagem retratando um torneio olímpico (todo). Desse modo, a MCO fornece meios para capturar e representar conhecimento sobre decomposição multimídia, dando suporte a desambiguação de anotação multimídia, a recuperação, a troca e a compartilhamento de metadados endereçados à mídia, bem como serviços de inferência por meio de sua linguagem de representação formal, a OWL DL. A construção da MCO foi baseada nas seguintes representações:
• Tipos diferentes de conteúdo multimídia: áudio, audiovisual, legenda, imagem legendada, imagem, texto, vídeo e página Web.
• Relações lógicas entre conteúdo multimídia, como, por exemplo, uma página Web é composta de um extrato de texto, duas imagens e uma faixa de áudio. • Semântica na decomposição de tipos de mídia correspondentes em suas partes
constituintes, de acordo com o nível de anotações produzidas como, por
196 exemplo, um vídeo que pode ser decomposto em vários segmentos baseados em cenas, que por sua vez são decompostas em quadros ou regiões em movimento. Neste caso, informações mais detalhadas sobre a localização de mídias são requeridas.
• Relações que associam conteúdo multimídia a entidades semânticas veiculadas, como, por exemplo, um rosto de uma pessoa retratado em uma imagem.
A conceituação da MCO pode ser visualizada na Figura 48 que apresenta as suas principais classes, incluindo: a mco:MultimediaContentItem, que representa em sua especialização
os vários tipos de modalidade de conteúdo único (ex. Audio) e múltiplo (ex. AudioVisual); a
mco:MultimediaSegment, que representa os diferentes tipos de segmentos pelos quais os vários
recursos de mídia podem ser decompostos (espacialmente, temporalmente e espaço temporalmente); e a mco:SegmentLocator, que representa informação sobre os vários meios para
identificar e designar um segmento particular.
Figura 48 - Taxonomia de classes da MCO
Fonte: captura de tela do software Protégé.
A Figura 49 apresenta um exemplo de axiomatização da classe MultimediaContentItem
com as seguintes restrições: todos os itens de conteúdo multimídia são especializações da classe
MCO_Thing; todos os itens de conteúdo multimídia devem ser decompostos (representado pela
propriedade de objeto hasMediaDecomposition) apenas (declaração only) por uma instância
pertencente à classe MultimediaSegment; todos os itens de conteúdo multimídia devem possuir ao
menos (declaração some) uma URL em formato de tipo string (representado pela propriedade de
tipo de dado hasURL); e as instâncias pertencentes à classe MultimediaContentItem não podem
Figura 49 - Axiomatização da classe MultimediaContentItem da MCO
Fonte: captura de tela do software Protégé.
A implementação da MCO é baseada no padrão MPEG-7, especialmente nas especificações advindas da parte 5 (Multimedia Description Schemes), fornecendo uma ampla
cobertura sistemática de esquemas de decomposição de conteúdo multimídia. Entretanto, a MCO enriquece formalmente a sua estrutura por meio de axiomas OWL (conforme ilustrado na Figura 49) a fim de evitar ambiguidades inerentes aos descritores MPEG-7. Por fim, a definição de vários tipos de segmentos e conteúdos é logicamente fundamentada em esquemas de decomposição aplicáveis e informações de localização necessárias para as identificações de fragmentos de mídia.
A Multimedia Descriptors Ontology (arquivo mdo.owl) endereça conhecimento
relacionado à representação de conteúdo multimídia de baixo nível como, por exemplo, características de sinais de áudio ou a cor dominante de um quadro de vídeo. A ontologia de descritores foi projetada baseada em dois princípios, a saber: i) ampla cobertura para as partes 3 e 4 (Visual e de Áudio) do padrão MPEG-7; e ii) apoio para os requisitos específicos do projeto Boemie em relação às modalidades endereçadas e ferramentas utilizadas.
A conceituação da MDO pode ser visualizada na Figura 50 que apresenta as suas principais classes, incluindo: a mdo:MultimediaDescriptor, que especializa diferentes modalidades
representadas pelas classes mdo:Audio_Descriptor (especializada em conceitos de áudio de alto
nível e de baixo nível), mdo:Textual_Descriptor e mdo:Visual_Descriptor (especializada em
conceitos de cor, localização, movimento, forma e textura); e a mdo:Adds, que busca modelar
restrições aplicadas em várias classes especializadas da mdo:Visual_Descriptor, como é o caso das
198
Figura 50 - Taxonomia de classes da MDO
Fonte: captura de tela do software Protégé.
A Figura 51 apresenta um exemplo de axiomatização envolvendo a definição da classe
mdo:DominantColor_Descriptor que possui declarações lógicas em suas propriedades, incluindo
cardinalidade mínima e máxima (ex. hasColorValues_Component max 8 Thing) e quantificador
universal (ex. hasColorSpace_Component only ColorSpace_Descriptor).
Figura 51 - Axiomatização da classe DominantColor_Descriptor da MDO
Fonte: captura de tela do software Protégé.
A integração das duas ontologias multimídia, bem como a integração com (e entre) as ontologias de domínio, foi promovida por um modelo semântico multimídia. O modelo representa uma rede de relações estrutural, espacial e temporal divididas em três categorias, a saber: i) relações
entre conceitos das ontologias multimídia; ii) relações entre conceitos de ontologias de domínio; e iii) relações entre conceitos das ontologias multimídia e das ontologias de domínio.
Em (i) as relações combinam informações sobre aspectos estruturais de documentos multimídia e características de baixo nível envolvendo objetos multimídia. Um exemplo desse tipo de relação é o mdo:isDescriptorOf, que liga instâncias de descritores, definidas na MDO, com
instâncias de segmentos multimídia, definidas em MCO. Em (ii) as relações ligam informações sobre eventos de atletismo com dados de mapa (informações sobre áreas geográficas e geopolíticas) considerados como lugar (ex. aco:takesPlaceIn). E em (iii) as relações ligam aspectos estruturais de
objetos multimídia com seus conteúdos específicos de domínio como, por exemplo, a relação
mco:depicts, que liga instâncias de segmentos multimídia, definidas em MCO, com instâncias de
conceitos definidas nas ontologias AEO ou GIO.
As ontologias multimídia pertencentes ao projeto Boemie possuem uma documentação satisfatória envolvendo suas estruturas de conhecimento ou conceituações. A documentação encontra-se registrada em artigos publicados por seus autores (DALAKLEIDI, 2011), em relatório final de projeto (DASIOPOULOU, 2008), em sítio destinado ao próprio projeto Boemie (já referenciado) e em repositórios envolvendo ontologias que praticam reúso de seus módulos, como é o caso da ontologia M3 multimedia que pratica reúso da MDO. No que diz respeito à disposição de
testes para as ontologias multimídia, não foi encontrado indício na documentação.
Os resultados da análise de conteúdo das ontologias multimídia pertencentes ao projeto Boemie foram obtidos com tranquilidade, porém, pela extensão da lista de requisitos da pesquisa, foram consumidas 24 horas para as tarefas de análise e interpretação dos conceitos multimídia envolvidos. A facilidade em se chegar aos conhecimentos requeridos para análise se deu em decorrência da arquitetura ontológica modularizada do projeto e pelo fato de a nomenclatura conceitual provir do padrão MPEG-7. Nesse sentido, os metadados descritivos de conteúdo foram
pesquisados, em sua maioria, na ontologia MCO; os metadados dependentes de conteúdo
inspecionados na MDO; e somente para os metadados independentes de conteúdo ocorreu certa
dificuldade em explorá-los pelo fato de a documentação não mencionar descritores desta natureza, e, a partir disso, foi necessário inspecionar as duas ontologias a fim de se checar uma possível cobertura. Finalmente, a MCO é a ontologia que cobre de forma mínima os metadados independentes de conteúdo, conforme pode ser evidenciado nos resultados descritos a seguir.
Primeiramente, torna-se importante salientar que a versão da ontologia MCO obtida por orientação de um de seus autores, não corresponde em algumas partes de sua estrutura de conhecimento com a versão elucidada na documentação. A impressão que permanece é de que a documentação datada de 2008 está mais atualizada (portanto, com uma possibilidade de cobertura maior frente aos requisitos) do que a versão analisada nesta pesquisa.
200 As ontologias multimídia do projeto Boemie cobrem parcialmente os requisitos multimídia determinados na pesquisa, isto é, dos 120 requisitos, 42 são cobertos (35%). Os metadados independentes de conteúdo são os menos representativos (15.6%), contando com um
número mínimo de descritores (5) destinados a informação sobre local de acesso a mídia e arquivo de mídia. Os metadados descritivos de conteúdo tiveram um índice de cobertura de 34.1% (15),
com representação satisfatória nas características de segmentação multimídia advindas da ontologia MCO. Apesar de a ontologia do domínio de eventos de atletismo (Athletics Events Ontology)
possuir algumas classes relacionadas a metadados para semântica de conteúdo, a análise desta ontologia não foi considerada no escopo metodológico desta tese. O motivo seria pelo fato de a análise ser direcionada no âmbito de uma ontologia multimídia que possua, em sua própria estrutura, uma estratégia de modelagem endereçada à representação descritiva de conteúdo semântico multimídia. Características de navegação e acesso, organização de conteúdo e interação de usuário (metadados para personalização de conteúdo) não são cobertas pelo projeto Boemie. Apesar de a taxonomia da ontologia MDO ter sido projetada para comportar descritores endereçados a características de alto nível envolvendo áudio (ver Figura 51), não houve ocorrência de elementos na ontologia que pudessem representar os descritores específicos para esta categoria de metadados. E os metadados dependentes de conteúdo tiveram cobertura de 50% (22), sendo bem
representados pelos descritores de cor, textura, forma, movimento, localização e reconhecimento de rosto. Assim como ocorreu na representação de descritores semânticos para áudio, na MDO foi concebida uma estrutura taxonômica para representar características de baixo nível para áudio. Porém, apenas 1 descritor no conjunto de requisitos desta natureza foi identificado nesta taxonomia, dando indícios de que os autores do projeto pensaram apenas nas classes centrais representativas dos descritores de áudio MPEG-7, possibilitando possíveis integrações de descritores em projetos específicos que praticarem reúso desta ontologia.
Finalmente, as ontologias multimídia do projeto Boemie possuem uma rica axiomatização em suas classes e propriedades, sendo 35 axiomas (83.3%) frente a 42 termos compatibilizados com declarações lógicas bem elaboradas, incluindo conectivos lógicos, quantificador existencial e universal, valores específicos, cardinalidade e características transitivas. Em relação às anotações, os 19 comentários evidenciados (45.2%), na maioria dos casos extraídos da norma MPEG-7, são exclusivos da terminologia compatibilizada na MDO. A ontologia MCO não possui comentários em seus elementos, o que dificultou a tarefa de análise semântica (diretamente no código) do conhecimento representado. E as restrições de propriedades apareceram em 16 das 18 propriedades evidenciadas na análise de compatibilidade terminológica, indicando que as ontologias buscam tratar questões associadas à integridade do vocabulário multimídia.