O primeiro passo foi realizar a atividade de aquisição de conhecimento sobre o assunto “descrição documental de conteúdo multimídia”, a qual envolveu um estudo acerca do domínio por meio de fontes documentais, incluindo normas, artigos e bibliotecas de esquemas XML relacionadas a padrões para descrição de documentos multimídia. O período de desenvolvimento desta atividade compreendeu de outubro a dezembro de 2013.
Os procedimentos metodológicos elucidados nesta seção foram fundamentados no Cenário 2 proposto na metodologia NeOn, o qual desmembra-se nas atividades descritas a seguir:
I. Busca por recursos não ontológicos: encontrar recursos não ontológicos em sítios confiáveis, sítios relacionados ao domínio e recursos dentro de Organizações.
II. Avaliação do conjunto de recursos não ontológicos candidatos: avaliar os recursos não ontológicos obtidos em (I). Nesta avaliação, os seguintes critérios são recomendados: cobertura, precisão e consenso sobre o conhecimento e a terminologia usada no recurso.
III. Seleção dos recursos não ontológicos mais apropriados: selecionar os recursos não ontológicos mais apropriados frente aos recursos candidatos avaliados em (II).
IV. Análise dos recursos não ontológicos selecionados para obtenção de níveis de abstração: analisar minunciosamente os recursos não ontológicos obtidos em (III) e identificar seus elementos subjacentes de modo a criar representações em diferentes níveis de abstração (requisitos, conceitos, dentre outros).
V. Representação dos recursos não ontológicos em modelos ou esquemas conceituais: gerar um esquema conceitual para fins de organização do conhecimento adquirido por meio de (IV).
Com o apoio do estudo do estado da arte apresentado no capítulo 2 bem como dos fundamentos teóricos apresentados no capítulo 3, os padrões ISO MPEG-7 e Dublin Core foram selecionados como material de referência para aquisição de conhecimento sobre o domínio de
150 descrição de recursos multimídia. No estado da arte foi possível evidenciar que grande parte das ontologias multimídia é construída com fundamentos advindos do padrão MPEG-7; e, como o padrão Dublin Core constitui-se de 15 elementos reconhecidos, consolidados e amplamente utilizados no contexto de descrição de recursos Web (HUNTER, 2002a) achou-se pertinente considerá-lo no escopo de cobertura de descritores gerais para documentos multimídia.
Para o levantamento de esquemas e descritores audiovisuais do padrão MPEG-7 foram utilizados dois materiais de referência, a saber: i) a especificação de descritores visuais124 e de áudio125, cuja última atualização até o momento da pesquisa data-se de 2008; e ii) o documento ISO/IEC JTC1/SC29/WG11N6828 (MARTÍNEZ, 2004) que especifica os requisitos do padrão. Observaram-se algumas diferenças envolvendo as duas referências no que diz respeito a descritores inclusos ou omitidos. Considerou-se, sempre, a versão mais recente para a apresentação da especificação dos descritores audiovisuais MPEG-7.
Após a atividade de aquisição de conhecimento sobre o domínio, tornou-se possível determinar um conjunto de elementos de parâmetro que serviram como base para identificar, analisar e comparar ontologias multimídia no aspecto de características concernentes a dois padrões de metadados consolidados nas comunidades de biblioteca digital, Web Semântica e multimídia. Torna-se válido comentar nesse ponto que a especificação de requisitos aqui presente não corresponde, ainda, ao documento resultante da fase de especificação de requisitos orientado em metodologias para construção de ontologias (SILVA, 2008; SUÁREZ-FIGUEROA, GÓMEZ- PÉREZ e FERNÁNDEZ-LÓPEZ, 2012), o qual inclui o propósito, o escopo, a linguagem de implementação, a intenção de uso, a identificação de usuários finais, e o conjunto de requisitos não funcionais e funcionais (em formato de questões de competência) para a ontologia de domínio a ser construída. Esta fase em específico é elucidada na seção 4.2.4 em que descreve a proposição do modelo conceitual. Finalmente, o produto a que se refere à atividade de aquisição de conhecimento constitui-se das principais características relativas à descrição de recursos multimídia que devem ser inspecionadas nas ontologias multimídia candidatas a compor o modelo a ser proposto na tese.
Os elementos de parâmetro de caraterísticas multimídia foram determinados pela composição de descritores e esquemas de descrição do MPEG-7126 e elementos do Dublin Core127. A fonte para identificação e seleção de ferramentas atuais que forneceriam apoio para acesso a bibliotecas de esquemas de descrição MPEG-7/XML foi o sítio da IBM128, pelo motivo de ser uma instituição de renome e reconhecida por suas práticas tecnológicas no âmbito da indústria multimídia de software. No processo de identificação, obteve-se acesso à biblioteca do esquema de
124 http://mpeg.chiariglione.org/standards/mpeg-7/visual 125 http://mpeg.chiariglione.org/standards/mpeg-7/audio 126 xmlns:mpeg7=urn:mpeg:mpeg7:schema:2001 127 http://dublincore.org/documents/dces/ 128 https://www.ibm.com/developerworks/br/library/x-xmltools/
descrição MPEG-7 no sítio da Stylus Studio129, um ambiente de desenvolvimento integrado130 com
uma variedade de ferramentas para edição e transformação de documentos XML. Apesar de as licenças de suas ferramentas serem proprietárias (com custo para aquisição permanente do
software), o acesso às bibliotecas de esquemas XML é gratuito.
A organização dos elementos de parâmetro ocorreu em três categorias de tipos de metadados fundamentados na revisão de literatura realizada no capítulo 3. Tais categorias buscam representar características funcionais relacionadas à cobertura de conhecimento sobre descrição de conteúdo multimídia e são descritas a seguir:
• Metadados independentes de conteúdo: os dados não são relacionados diretamente ao conteúdo da mídia, mas associados a esta, como formato, autoria, data, local de acesso, meio de armazenamento, etc.
• Metadados dependentes de conteúdo: os dados possuem características primitivas ou de baixo nível extraídas do próprio conteúdo da mídia, como sinais de áudio, cor, textura, forma, relações espaciais, movimento e combinações destes.
• Metadados descritivos de conteúdo: os dados são relacionados ao conteúdo semântico envolvendo entidades da mídia com entidades do mundo real ou eventos temporais, emoções e significados associados a sinais audiovisuais e de cenas. Dados relacionados à segmentação de conteúdo multimídia também se adentram nesta categoria.
Na atividade de análise de composição dos descritores MPEG-7 e Dublin Core observou-se uma equivalência semântica entre alguns de seus elementos, conforme é indicado no Quadro 8. A proposta de reengenharia para a união de metadados Dublin Core e MPEG-7 em um mesmo esquema de descrição (HUNTER e IANNELLA, 1998; HUNTER, MARTÍNEZ e OLTMANS, 2000; HUNTER, 2002a) possui algumas vantagens, conforme foram apresentadas na seção 3.3.4.2. No entanto, Hunter (2002a) esclarece que o mapeamento131 entre os elementos Dublin Core e descritores MPEG-7 é uma tarefa complexa pelo fato de não haver sempre uma correspondência um para um entre os dados envolvidos nos dois padrões. Muitos dos descritores MPEG-7 encontram-se dispersos, duplicados e em nível baixo (elementos bem detalhados) dentro da estrutura hierárquica dos vários esquemas de descrição pertencentes ao padrão, tornando, portanto, a terminologia não muito intuitiva. No Quadro 8 pode-se perceber que o descritor MPEG- 7 Identifier aparece em mais de um esquema de descrição do padrão. O descritor MPEG-7 Creator
representa ao mesmo tempo os elementos Dublin Core Contributor, Creator e Publisher. O
descritor Language também aparece em várias localizações MPEG-7.
129 http://schemas.stylusstudio.com/mpeg7/frames.html 130 do inglês, Integrated Development Environment - IDE
152
Quadro 8 - Equivalência semântica entre descritores Dublin Core e MPEG-7
Elemento Dublin Core Esquema de Descrição -> Descritor MPEG-7
Contributor CreationInformation/Creation -> Creator Coverage SemanticBase -> Time SemanticBase -> Place
Creator CreationInformation/Creation -> Creator
Date CreationInformation/Creation/CreationCoordinates ->Date UsageInformation/Availability ->AvailabilityPeriod Description CreationInformation/Creation ->Abstract
Format MediaInformation/MediaProfile/MediaFormat ->FileFormat Identifier
MediaInformation/MediaIdentification ->EntityIdentifier
MediaInformation/MediaProfile/MediaInstance -> InstanceIdentifier MediaInformation/MediaProfile/MediaInstance/MediaLocator->MediaUri Language CreationInformation/Classification ->Language CreationInformation/Classification ->CaptionLanguage
Publisher CreationInformation/Creation -> Creator UsageInformation/Availability ->Disseminator
Relation CreationInformation/RelatedMaterial/MediaLocator ->MediaUri MediaInformation/MediaProfile/MediaInstance/MediaLocator ->MediaUri Rights CreationInformation/Creation -> CopyrightString UsageInformation/Rights -> RightsID
Source MediaInformation/MediaIdentification ->EntityIdentifier MediaInformation/MediaProfile/MediaInstance/MediaLocator->MediaUri Subject CreationInformation/Classification ->Subject
Title CreationInformation/Creation -> Title Type CreationInformation/Classification ->Genre
Fonte: adaptado de Hunter (2002a).
Partindo-se da referência da proposta híbrida de Hunter (2002a) e de modo a realizar a composição de descritores Dublin Core e MPEG-7 no sentido de determinar os elementos de parâmetro desta pesquisa, os seguintes aspectos foram considerados: os elementos Dublin Core formariam a base para descrições genéricas sobre recursos multimídia, ou mesmo bibliográficas, classificando-se, portanto, na categoria de metadados independentes de conteúdo; enquanto que os descritores MPEG-7 estariam mais voltados à definição de aspectos estruturais, temporais, espaciais, de características de baixo nível e de conteúdo semântico dos elementos constituintes, classificando-se nas outras duas categorias de metadados. Desse modo, partiu-se do princípio de que a interoperabilidade acerca de elementos Dublin Core e de descritores MPEG-7 seria mantida pelas descrições multimídia contidas na proposta de elementos de parâmetro, possibilitando às aplicações externas que lidam com metadados de ambos os padrões projetarem consultas envolvendo os descritores. Contudo, as mesmas descrições não sustentariam a mesma interoperabilidade, por exemplo, em ambientes que lidam com descrições exclusivas de um desses padrões.
No processo de elaboração dos requisitos, quando observada uma relação um para um entre os elementos Dublin Core e MPEG-7 (com terminologias distintas), optou-se por selecionar ambos os descritores de modo a ampliar o universo de ontologias multimídia recuperadas por meio de termos-chave indicados nas buscas em repositórios Web. E, quando observada uma relação de um descritor Dublin Core para muitos descritores MPEG-7, optou-se em adotar como termo
equivalente um elemento MPEG-7 mais próximo ao Dublin Core. Desse modo, justificou-se a escolha dos dois padrões de metadados (recursos não ontológicos) para a composição de requisitos endereçados a descrição multimídia.
É válido ressaltar que a terminologia representativa dos elementos de parâmetro foi determinada no idioma inglês. O motivo seria pelo fato de esta linguagem ser universal, e de grande parte dos vocabulários multimídia (padrões de metadados e ontologias) disponíveis em repositórios Web encontrarem-se neste idioma.
Para cada categoria de metadados (independentes de conteúdo, dependentes de conteúdo e descritivos de conteúdo), foi elaborado um quadro para coleta e organização dos elementos de parâmetro (exibidos em detalhe no Apêndice A), primordiais aos processos de identificação, de análise e de comparação de ontologias no domínio multimídia. Para cada quadro, as subcategorias envolvidas foram determinadas a partir da revisão de literatura realizada sobre o padrão de metadados MPEG-7 (exibida na seção 3.3.4.1). Os elementos indicados na coluna “Elemento”, suas descrições e elementos equivalentes (específica para a categoria metadados independentes de conteúdo) foram determinados a partir de conhecimento teórico, obtido por meio da leitura de documentos científicos e normativos, e de conhecimento empírico, obtido a partir da análise dos esquemas de descrição envolvidos.
Os elementos de parâmetro relacionados à categoria metadados independentes de conteúdo, especializados na subcategoria metadados administrativos para gerenciamento e
administração de recursos informacionais (GILLILAND-SWETLAND, 2000), foram organizados em quatro tipos de descrição, a saber: i) criação e produção da mídia; ii) classificação da mídia; iii) informação da mídia; e iv) uso da mídia. Em (i) têm-se características envolvendo a criação do
conteúdo da mídia e de recursos a ele associados; em (ii) têm-se características destinadas à classificação de materiais audiovisual, tais como gênero, assunto, propósito, idioma, além de classificação etária, orientação para pais e avaliação subjetiva; em (iii) as características são voltadas ao meios de armazenamento incluindo formato, compressão e codificação do conteúdo audiovisual; e em (iv) as características refletem direitos de uso, registro e disponibilidade de uso e informação financeira acerca do conteúdo audiovisual.
Os elementos de parâmetro pertencentes à categoria metadados dependentes de conteúdo foram organizados nas subcategorias metadados visuais e metadados para áudio. Os
metadados visuais abrangeram as características estruturas básicas, cor, textura, forma, movimento, localização e reconhecimento de rosto. Os metadados para áudio contemplaram as características base espectral, timbre espectral, timbre temporal, paramétricos de sinal, espectral básico e básico.
A elucidação das características visuais bem como de áudio podem ser consultadas, respectivamente, nas seções 3.3.4.1.2 e 3.3.4.1.3.
154 Os elementos de parâmetro voltados à categoria metadados descritivos de conteúdo
foram classificados em quatro subcategorias de metadados, a saber: i) segmentos de mídia; ii) semântica de conteúdo; iii) personalização de conteúdo; e iv) características de alto nível envolvendo áudio. Em (i) têm-se características relacionadas à estrutura de conteúdo em termos de
segmentos de vídeo e segmentos de áudio; em (ii) encontram-se características envolvendo objetos, eventos e noções do mundo real que podem ser abstraídos do conteúdo multimídia; em (iii) agregam características de modos de personalização de conteúdo multimídia a fim de facilitar navegação, acesso e interação de usuários em relação ao consumo de conteúdo; e em (iv) têm-se características voltadas à cobertura de domínios de conhecimento específicos envolvendo áudio.
Finalmente, a estratégia de recorte para coleta e análise de elementos MPEG-7 (esquemas e descritores) foi determinada a partir dos elementos de níveis mais altos explicitados nas estruturas dos esquemas. No caso específico de descritores de áudio e visuais, todos os elementos elucidados na norma foram considerados na composição de requisitos. A justificativa para a seleção de elementos mais genéricos nas estruturas dos esquemas é que se considerou inviável em relação a tempo hábil de pesquisa a análise de seus mais de 1000 elementos; por outro lado, considerou-se viável em termos de aquisição de conhecimento abrangente sobre o domínio da descrição multimídia. Tal posicionamento vai ao encontro do método dedutivo proposto por Ranganathan e outros teóricos da teoria da classificação (RANGANATHAN, 1967; DAHLBERG, 1976; VICKERY, 1980, BARITE, 2000; JACOB, 2004), no qual se considera primeiro o domínio para depois fazer o tratamento dos elementos que compõem tal domínio.