Nesta seção, são exploradas as contribuições do trabalho, assim como trabalhos futuros que podem ser derivados do mesmo.
5.1.
CONTRIBUIÇÕES E CONCLUSÕES
Com o desenvolvimento deste trabalho, foram propostos e avaliados alguns métodos para a extração e alinhamento de hierarquias heterogêneas, estudo diferenciado na área de alinhamentos. Acredita-se que foi possível contribuir para que tarefas de IC que dependem da análise de informações distribuídas em diferentes fontes possam ser encontradas com mais facilidade.
Este trabalho dispõe de funcionalidades inexistentes ou de difícil acesso em demais aplicações, em um esforço de prover novas tecnologias, similar às aplicações submetidas à OAEI. Funcionalidade que a tornam um diferencial incluem: uma forma visual de tratar as operações de alinhamento, um repositório centralizado de heurísticas em português para aplicação, a possibilidade de se extrair de forma parametrizável estruturas hierárquicas da internet, entre outras.
Os quatro módulos desenvolvidos, fazem da ferramenta PLATAL um recurso completo e diferenciado para as atividades de alinhamento de hierarquias, começando desde o módulo de extração de hierarquias da web, passando pelos módulos de alinhamento de referência manualmente (visualmente) e alinhamento automático, até o módulo de avaliação que permite a comparação de alinhamentos para validar sua corretude.
No que se refere aos resultados obtidos com a avaliação realizada, deve-se destacar a eficiência dos métodos propostos, que, no melhor caso no cenário de teste comparado com a baseline, obtiveram uma melhora da medida-F de 0.09 para 0.30 (conjunto 6). Enquanto na relação com outros matchers, se obteve uma medida-F superior em 0.15 as demais no melhor cenário (conjunto 5). Para isso mais uma vez se mostrou a importância da análise estrutural de hierarquias aqui criada para seu alinhamento.
Com a arquitetura da solução implementada, é possível estender a ferramenta através da inclusão de novas técnicas ou mudanças nas hierarquias, e com isso mantê-la atualizada. Essa necessidade é observada não apenas no contexto de empresas, mas também na realidade dos usuários finais de sistemas de e-commerce, dada a constante variação das estruturas nos websites.
5.2.
TRABALHOS FUTUROS
Conforme visto ao longo do texto, o projeto buscou ser modularizado e configurável, de forma que possa ser estendido facilmente. Trabalhos futuros podem partir da estrutura e métodos aqui utilizados para o desenvolvimento de combinações ainda mais precisas no processo de alinhamento.
Para melhorar a parte de avaliação dos resultados, pode-se medir a concordância entre alinhamentos de referência, que podem ser subjetivos.
Outra melhoria que pode ser realizada é o desenvolvimento de uma forma de determinar automaticamente as expressões necessária para identificar os níveis de uma hierarquia em uma página web, automatizando praticamente todo o processo de criação de alinhamentos.
Uma opção de estudo futuro seria a criação de novos filtros e avaliadores para o módulo de alinhamento automático que utilizassem novas técnicas. Por exemplo, técnicas de interpretação baseadas em recursos externos, como técnicas de reuso de alinhamento e técnicas de recursos linguísticos, para avaliadores. Até mesmo parametrizar os valores de aceitação das técnicas aqui desenvolvidas através de interface pode vir a contribuir na flexibilidade da execução.
Por fim, um trabalho importante pode ser desenvolvido no âmbito de usar os alinhamentos resultantes desse trabalho para criar um alinhamento único e disponibilizar o mesmo para o usuário, de forma a usar apenas esse para se referir as categorias de diversas fontes.
REFERÊNCIAS
[1] ABRAIC. Associação Brasileira dos Analistas de Inteligência Competitiva. Capturado em: http://www.abraic.org.br, Junho 2011.
[2] Aflood. “Anchor-Flood”. Capturado em: http://mindblast.informatik.uni- mannheim.de:8080/sealstools/aflood/matcherWS?wsdl, Dezembro 2011.
[3] Alistair, M.; Bechhofer, S. "SKOS Simple Knowledge Organization System Reference". Capturado em: http://www.w3.org/TR/skos-reference/, Julho 2011.
[4] Aroma. “AROMA: extensional and scalable ontology matcher”. Capturado em: http://exmo.inrialpes.fr/software/aroma/, Dezembro 2011.
[5] Berners-Lee, T.; Fischetti, M. “Weaving the Web: The Original Design and Ultimate Destiny of the World Wide Web by Its Inventor”. Harper San Francisco, 1999.
[6] Bin, S.; Kuiyu, C. “Generating a concept hierarchy for sentiment analysis”. In: International Conference on Systems Man and Cybernetics, 2008, pp. 312-317.
[7] Bocassanta, F.; Dorneles, C. F. “Efetuando Junção por Similaridade de Documentos XML Armazenados em Sistemas de Arquivo”. Revista IEEE América Latina, vol. 8, 2010, p. 3.
[8] Brandolt, J. F. A. “Uso de Relações Semântico-Estruturais no Aprimoramento do Cálculo da Similaridade Semântica: um Estudo Voltado a estruturas Ontológicas em Língua Portuguesa”, Dissertação de Mestrado, Programa de Pós-Graduação em Ciência da Computação, PUCRS, 2009.
[9] Calero, C.; Ruiz, F.; Piattini, M. “Ontologies for Software Engineering and Software Technology”. Springer, 2006.
[10] Clark, J.; DeRose, S. “XML Path Language (XPath) Version 1.0". Capturado em:http://www.w3.org/TR/xpath/, Julho 2011.
[11] Collovini, S,; Grando, F.; Souza, M.; Freitas, L.; Vieira, R. “Semantic Relations Extraction in the Organization Domain” . In: IADIS International Conference Applied Computing, 2011.
[12] David, J.; Euzenat, J.; Scharffe, F.; Santos, C. T. “The Alignment API 4.0”. Semantic web journal, Jun-2010.
[13] Dorneles, C. F; Heuser, C. A.; Lima, A. E. N.; Silva, A.; Moura, E. “Measuring similarity between collection of values”. In: 6th ACM International Workshop on Web Information and Data Management, 2004, pp. 56-63.
[14] eCl@ss. “eCl@ss: Classification and Product Description”.Capturado em: http://www.eclass.de/, Março 2011.
[15] eCommerceOrg. “Evolução da Internet e do e-commerce”. Capturado em: www.e-commerce.org.br/stats.php, Setembro 2011.
[16] eCommerceOrg. “Meios de pagamento ecommerce”. Capturado em: http://www.e-commerce.org.br/meiosdepagamento-ecommerce.php, Setembro 2011.
[17] Euzenat, J. “An API for ontology alignment”, ISWC, 2004. [18] Euzenat, J.; Shvaiko, P. "Ontology Matching". Springer, 2007.
[19] Euzenat, J.; Stuckenschmidt, H. "The 'Family of Languages' Approach to Semantic Interoperability". In: Knowledge Transformation for the Semantic Web, 2003, pp; 49-63.
[20] Falcon. “Falcon-AO: A practical ontology matching tool”. Capturado em: http://ws.nju.edu.cn/falcon-ao/, Dezembro 2011.
[21] Feng, Y.; Xu, H.; Fang, X. “An Intelligent Recommendation Method of E- Commerce Based on Ontology”. In: Business Intelligence and Financial Engineering, 2009, pp592-594.
[22] Fensel D. “The Semantic Web: Research and Applications”. Springer-Verlag, 2004.
[23] Fleisher, C. S.; Blenkhorn, D. L. “Managing frontiers in competitive intelligence”. Quorum Books, 2001.
[24] Freitas, J. B. “SiSe: Medida de Similaridade Semântica Entre Ontologias Em Português”, Dissertação de Mestrado, Programa de Pós-Graduação em Ciência da Computação, PUCRS, 2007.
[25] Guo, W. “Ontology Design for Supporting Matchmaking in E-commerce”. In: International Symposium on Information Science and Engieering, 2008, pp. 410-413.
[26] Hepp, M. “A Methodology for Deriving OWL Ontologies from Products and Services Categorization Standards”. In: Int'l Journal on Semantic Web & Information Systems, vol. 2, Jan-Mar 2006, pp. 72-99.
[27] IBGE. “Pesquisa Mensal de Comércio”. Capturado em http://www.ibge.gov.br/home/estatistica/indicadores/comercio/pmc/pmc_201110_01.shtm, Novembro 2011.
[28] Isele, R.; Bizer, C. “Learning Linkage Rules using Genetic Programming”. In: Sixth International Workshop on Ontology Matching, 2011.
[29] ISWC. "The 10th International Semantic Web Conference". Capturado em: http://iswc2011.semanticweb.org/, Outubro 2011.
[30] Lee, H.; Shim, J. “Product Ontology and OWL Correspondence”. In: Studies in Computational Intelligence, 2008, pp. 1-14.
[31] Lopes, L.; Vieira, R.; Finatto, M. J.; Martins, D. “Extracting compound terms from domain corpora”, Journal of the Brazilian Computer Society, vol. 16-4, Nov-2010, pp 247-259.
[32] Malucelli, A.; Oliveira, E.; Palzer, D.”Combining Ontologies and Agents to help in Solving the Heterogeneity Problem in E-Commerce Negotiations”. In: International Workshop on Data Engineering Issues in E-Commerce, 2005, pp. 26-38.
[33] Massmann, S.; Raunich, S.; Aumuller, D.; Arnold, P.; Rahm, E. “Evolution of the COMA Match System”. In: Sixth International Workshop on Ontology Matching, 2011.
[34] Ngomo, A. N. “A Time-Efficient Hybrid Approach to LinkDiscovery”. In: Sixth International Workshop on Ontology Matching, 2011.
[35] Ngomo, A. N.; Lehmann, J.; Auer, S.; Höffner, K. “RAVEN - Active Learning of Link Specifications”. In: Sixth International Workshop on Ontology Matching, 2011.
[36] OAEI. "Ontology Alignment Evaluation Initiative 2011 Campaign". Capturado em: http://oaei.ontologymatching.org/2011/, Outubro 2011.
[37] OM-211. "The Sixth International Workshop on Ontology Matching". Capturado em: http://om2011.ontologymatching.org/, Outubro 2011.
[38] Rahm, E.; Do, H.; Maßmann, S. "Matching large XML schemas". In: ACM SIGMOD Record, 2004, pp. 26–31.
[39] Reusch, P. J. A.; Garcia, L. E. “Implementation of new ontologies for the classification of commodities in e-commerce”. In: Intelligent Data Acquisition and Advanced Computing Systems – IDAACS, 2009, pp549-554.
[40] RosettaNet. “RosettaNet Technical Dictionary”. Capturado em: http://www.rosettanet.org/, Março 2011.
[41] Saccol, A. I. C. Z. “Alinhamento estratégico da utilização da internet e do comércio eletrônico: os casos Magazine Luiza e Fleury”. Revista de Administração Contemporânea, vol. 9, 2005, pp. 59-80.
[42] SCIP. “Society of Competitive Intelligence Professionals“. Capturado em: http://www.scip.org, Junho 2011.
[43] Selenium Project. “Selenium 2.0 and WebDriver”. Capturado em: http://seleniumhq.org/docs/03_webdriver.html, Agosto 2011.
[44] Shane, S.; Venkatraman, S. “The promise of entrepreneurship as a field of research”. In Academy of Management Review, 2000, pp. 217-226.
[45] SKOS. "SKOS Simple Knowledge Organization System". Capturado em: http://www.w3.org/2004/02/skos/, Outubro 2011.
[46] Smith, M. K.; Welty, C.; McGuinness, D. L. "OWL Web Ontology Language Guide". Capturado em: http://www.w3.org/TR/2004/REC-owl-guide-20040210, Julho 2011. [47] Stanford University School of Medicine. "protégé". Capturado em: http://protege.stanford.edu/, Março 2011.
[48] Souza, M.; Vieira, R.; Busetti, D.; Chishman, R.; Alves, I. M. “Construction of a Portuguese Opinion Lexicon from multiple resources”. In: Simpósio Brasileiro de Tecnologia da Informação e da Linguagem Humana, 2011.
[49] Studer, R.; Benjamins, V. R.; Fensel D. “Knowledge Engineering: Principles and Methods”, Data & Knowledge Engineering, vol. 25, Mar-1998, pp. 161-197.
[50] UNSPSC. “United Nations Standard Products and Services Code”. Capturado em: http://www.unspsc.org/, Março 2011.
[51] Vegetti, M.; et al. “PRONTO: An ontology for comprehensive and consistent representation of product information”. Engineering Applications of Artificial Intelligence, vol. 4-8, Fev-2011, pp. 1305–1327.
[52] W3C OWL Working Group. "OWL 2 Web Ontology Language Document Overview". Capturado em: http://www.w3.org/TR/owl2-overview/, Julho 2011.
[53] World Wide Web Consortium (W3C). “W3C Semantic Web Activity”. Capturado em http://www.w3.org/2001/sw/ , Novembro 2011.