Segundo Dias e Naves (2007), a análise de assunto é considerada um dos processos básicos da organização da informação e consiste na compreensão e interpretação do conteúdo de um documento. É uma etapa que se desenvolve dentro das atividades de indexação, portanto, é um processo importante que impacta a eficiência da recuperação da informação.
Fujita (2003) afirma que a análise de assunto é composta de três estágios que se superpõem: a) compreensão do conteúdo do documento; b) identificação de conceitos relevantes que representam o documento e c) seleção de conceitos válidos que serão úteis na recuperação. No primeiro estágio recomenda-se a leitura integral do documento, embora em alguns casos (livros, teses, monografias) isto seja impraticável, apesar de ser a situação ideal. No caso da presente pesquisa conforme relatado na seção 3.4.2 foi realizada a leitura na íntegra dos dezoito artigos científicos produzidos pelos pesquisadores da Embrapa Milho e Sorgo.
O documento da World Information System for Science and Technology – Sistema Internacional de Informação para Ciência e Tecnologia – elaborado pela UNESCO fornece algumas diretrizes em relação à prática da análise de assunto, recomendando atenção especial durante a leitura para o título, introdução, as primeiras frases de capítulos e parágrafos; ilustrações, tabelas, diagrama e suas explicações; conclusão; palavras ou grupos de palavras sublinhadas ou impressas com tipo diferente. Por outro lado destaca que os primeiros itens do
texto apresentam, geralmente, as intenções do autor, enquanto que as partes finais comunicam o alcance dessas intenções. Estas orientações foram seguidas durante a etapa de análise dos artigos científicos citados na seção 3.4.2. No segundo estágio, o de identificação de conceitos, que demanda intensa atividade cognitiva, busca-se selecionar conceitos que melhor representem o conteúdo do texto, e neste momento é importante que isto seja feito seguindo- se um esquema de categorias do domínio, caso exista, e que pode ser baseado em processos, propriedades, operações, equipamentos, etc. Por último, no estágio de seleção de conceitos pode acontecer que alguns conceitos identificados na etapa anterior sejam descartados, caso se verifique que os mesmo não são úteis para os objetivos a que se destina a indexação da informação.
Vale destacar que existe um grau de complexidade inerente à análise de assunto, a este respeito Naves destaca que isto se dá por causa do problema de especificação da terminologia e também por causa da subjetividade do indexador, que eventualmente pode se deixar influenciar pelos seus valores individuais.
2.3 - Fundamentos teóricos da classificação
No contexto deste trabalho, o interesse nos fundamentos da teoria da classificação se justifica, pois é neles que se pretende buscar subsídios teóricos para a elaboração da estrutura semântica representativa do domínio da cultura do sorgo. Ressalta-se que na modelagem do conhecimento a ser desenvolvida, a utilização de princípios da classificação vão se somar a outros construtos teóricos, tais como o método analítico-sintético, teoria do conceito e análise de assunto, que já foram apresentados neste capítulo.
A literatura técnica mostra que a importância da classificação está não apenas nos sistemas de recuperação de informação, mas na base de sistemas e atividades que se ocupam da organização do conhecimento em suas diferentes manifestações. Langridge (1977) reforça a relevância da classificação, afirmando que ela representa a principal atividade na organização do conhecimento.
A seguir apresentam-se definições de algumas estruturas semânticas conhecidas utilizadas na organização do conhecimento e recuperação da informação, a partir das quais serão tecidos alguns comentários:
Tesauro, linguagem documentária composta por um conjunto de termos semântica e genericamente relacionados, cobrindo uma área específica do conhecimento (GOMES, 1996). É importante destacar que tesauros são elaborados para organizar o conhecimento de uma área específica e neste aspecto guarda muitas semelhanças com as ontologias, talvez seja esta semelhança a provável responsável pela confusão entre os termos tesauros e ontologias. Taxonomia, classicamente é definida como ciência das leis da classificação de formas vivas. Atualmente é entendida como classificação de elementos de variada natureza. São estruturas classificatórias que consideram a unidade sistemática (taxon), não mais família, gênero, espécie, mas conceitos (CAMPOS & GOMES, 2007). Terminologia é o conjunto de termos de uma área de assunto, lidam com conceitos que se organizam com base em características (GOMES, 2008). Vocabulários controlados são utilizados para indexar documentos, são termos organizados em uma estrutura relacional. Uma de suas funções é representar a informação e o conhecimento por meio de um conjunto controlado e finito de termos – os descritores - que representam conceitos.
Nota-se nas definições acima, que o conceito é um elemento presente, representado nos termos ou expressões, participando ativamente na implementação destas estruturas de classificação. Verifica-se, portanto, que o objetivo de todo sistema de classificação do conhecimento passa pela organização das suas unidades conceituais. Isto se deve, segundo afirma Gomes (1996), ao fato de o conceito estar no bojo da teoria da classificação, uma vez que o que se procura classificar, sistematizar são os conceitos. A partir do exposto acima, a teoria do conceito assume uma relevância ímpar na organização do conhecimento, conforme já foi amplamente detalhada na seção anterior.
Foi mencionado anteriormente que a estrutura semântica aqui desenvolvida visa dar suporte à construção de uma ontologia de domínio, e corresponde às etapas de especificação e conceitualização que precedem à modelagem do conhecimento.
Chama-se a atenção também para o fato de existirem diversos métodos e metodologias para construção de ontologias (ver seção 2.5.4). O presente trabalho dá destaque ao Método 101 (NOY & McGUINNESS, 2001) a ser detalhado mais adiante, como método para construção de ontologias. Um traço comum presente nos diversos métodos é a etapa de criação de classes e subclasses. Campos e Gomes (2007) recomendam que esta etapa seja orientada segundo os seguintes princípios: Categorização, que fornece as bases para a apresentação sistemática;
Princípios, para a ordenação das Classes e de seus elementos. Seguem-se detalhes dos três
princípios acima apresentados.
2.3.1 Categorização
Segundo Barité (2000), historicamente o conceito de categoria teve inicio com os filósofos da antiguidade como Aristóteles, até chegar aos filósofos da era moderna como Kant e Husserl entre outros. Ao longo do tempo o conceito veio experimentando diversas mudanças e foi somente através de Ranganathan que este conceito extrapolou as definições no contexto da filosofia, migrando para o âmbito da classificação do conhecimento. O matemático indiano foi o responsável pela elaboração de conceitos harmônicos e reflexivos de categorias, e inovou ao introduzir pela primeira vez, a noção de categoria nos sistemas de classificação, criando as conhecidas categorias fundamentais: Personalidade, Matéria, Energia, Espaço e Tempo.
Barité afirma enfaticamente que a definição de categoria no contexto da teoria da classificação não pode ser feita a partir de conceitos emprestados da filosofia ou da metafísica, embora estes campos possam servir como ponto de partida para organizar o discurso científico. A título de fornecer uma definição inicial para categoria, Barité afirma que ela representa uma expressão abstrata extremamente genérica que pode ser percebida em qualquer entidade, elemento ou objeto. Já ao pensar sobre o caráter instrumental das categorias, afirma que elas são ferramentas que permitem descobrir as propriedades dos objetos, donde se conclui que as propriedades de um objeto representam possíveis categorias. Acrescenta ainda que categoria é uma noção extremamente simples que permite analisar qualquer fenômeno e situá-lo em uma dada posição em relação a um objeto.
Barité (2000, p. 5) define categorias como abstrações simplificadas que, quando mediadas pelos esforços intelectuais dos classificadores, permitem investigar particularidades de objetos do mundo físico e do mundo ideal. A análise e representação são feitas visando-se organizar logicamente sistemas de conceitos, sendo adequadas ao contexto de organização do conhecimento de uma forma geral; a análise de assunto particulariza a abordagem ajudando a estabelecer prioridades entre os assuntos de um documento permitindo ordená-los na seqüência de indexação correta.
Portanto, na teoria da classificação, as categorias são instrumentos importantes para a análise e organização de objetos, do conhecimento e de fenômenos, proporcionando dimensões de análises aplicadas na estruturação do conhecimento humano assim como de conceitos, que representam suas principais abstrações.
É preciso estar ciente de que é intelectualmente impossível na análise de um objeto, conseguir abranger a totalidade do conhecimento inerente àquele objeto, pois todo objeto dada a sua complexidade, permite múltiplos aspectos para análise. Considerando esta complexidade, Barité propõe conduzir esta análise a partir dos seguintes atributos dos objetos:
a) Todo objeto é naturalmente dinâmico e mutável, em função disto, recomenda-se apreender o objeto dentro de um momento específico e abstraí-lo da sua realidade; b) Objetos podem ser reais ou ideais. No caso dos primeiros, sua existência pode ser comprovada através de registros de diversos tipos, já no caso dos objetos de natureza abstrata ou existência imaterial, para que sua análise seja feita de modo a apresentar rigor científico é preciso que ela seja feita baseada em convenções ou acordos claramente pré-estabelecidos de forma consensual por especialistas do domínio; c) Alguns objetos têm problemas de delimitação, ou seja, não há consenso entre especialistas a respeito da sua definição, o que acaba gerando dificuldades para enquadrar o objeto em uma dada categoria; d) A grande maioria dos objetos pertence ao continuum espaço-tempo. A natureza dinâmica e mutável de alguns objetos, conseqüência da influência de agentes internos e externos, gera mudanças de configuração nos objetos que são perceptíveis ao longo do continuum espaço-tempo. Verifica-se aqui a complexidade de analisar um objeto neste contexto de mutabilidade e estabelecer uma categorização para o mesmo.
Uma importante contribuição a respeito das características que devem ser apresentadas por categorias, é dada pela abordagem da Análise de Conteúdo proposta por Laurence Bardin, (BARDIN, 1988 apud FERREIRA, 2010). Segundo Bardin, quando são corretamente estabelecidas, as categorias devem possuir as seguintes qualidades: Exclusão mútua, que estabelece que cada elemento só pode existir em uma categoria; Homogeneidade estabelece que para definir uma categoria, é preciso haver só uma dimensão na análise; Pertinência, ou seja, as categorias devem dizer respeito às intenções do investigador, aos objetivos da pesquisa, às questões norteadoras, às características da mensagem, etc.; Objetividade e fidelidade, estabelece que se as categorias forem bem definidas e ao mesmo tempo, os índices e indicadores que determinam a entrada de um elemento numa categoria forem bem claros,
não haverá distorções devido à subjetividade dos analistas; Produtividade, define que as categorias serão produtivas se os resultados forem férteis em inferências, em hipóteses novas e em dados exatos. As qualidades acima citadas estabelecem diretrizes que norteiam o trabalho do classificador, por estabelecerem direcionamentos claros a respeito da definição de categorias, foram de grande importância na avaliação qualitativa das categorias criadas na estrutura semântica do sorgo.
Segundo Campos e Gomes (2007), quando se faz uma categorização, esta-se analisando um domínio a partir de recortes conceituais que permitem determinar a identidade dos conceitos que fazem parte deste domínio. Ainda, segundo estas autoras, a categorização é um processo que leva a pensar o domínio de forma dedutiva, ou seja, busca determinar as classes de maior abrangência dentro do domínio escolhido. A categorização, portanto, além de fornecer princípios para organização do raciocínio, fornece uma ordem para a ordenação dos tópicos em uma estrutura classificatória. Este processo segue diretrizes que foram claramente estabelecidas por Ranganathan e denominadas de “cânones para ao trabalho no plano das idéias”.