• Sonuç bulunamadı

BÖLÜM 1: SOSYAL AĞ VE SOSYAL YAYILIM

1.3. Sosyal Yayılım

1.3.1. Sosyal Yayılım Teorisi

O aprendizado incremental de redes Bayesianas é uma área de interesse para pesquisa acadêmica e de muito potencial de uso para as empresas, por vários motivos, entre eles:

• O crescimento constante das bases de dados. Fazer aprendizado em batelada dessas bases pode se tornar proibitivo computacionalmente;

• O aspecto temporal do aprendizado incremental de redes Bayesianas. Uma vez que usando o aprendizado incremental se terá sempre a rede Bayesiana mais atualizada;

• O aspecto adaptativo do aprendizado incremental de redes Bayesianas. Com o aprendizado incremental vai se adaptando a rede Bayesiana ao conjunto total de dados, diminuindo assim o risco de uma base de dados não aleatória produzir uma rede Bayesiana tendenciosa.

• O tempo necessário para fazer o aprendizado incremental de redes Bayesianas é menor do que o tempo do aprendizado em batelada, possibilitando assim o seu uso em aplicações onde tempo é crucial (web-mining, por exemplo).

Os resultados obtidos com o algoritmo ABC mostraram que esse método é completo e que ele consegue gerar bons resultados, sendo o algoritmo ABC em si um método que leva em conta um aspecto qualitativo do aprendizado, reforçando o foco nos resultados. Neste sentido as principais contribuições deste trabalho foram:

• A definição e implementação de dois métodos de aprendizado incremental: o AIP e o ABC.

o O AIP possui como base um princípio simples e se mostra adequado em problemas onde há condições para um bom aprendizado de estrutura de rede Bayesiana, o que implica na disponibilidade de uma base de dados grande e significativa o suficiente para isso.

o Já o ABC é um método mais completo, que consegue, se necessário, alterar a estrutura e os parâmetros da rede Bayesiana para adaptar ela aos registros processados.

• A definição e implementação de duas formas de otimização de estruturas AD-Tree.

o A primeira é chamada “AKD-Tree”, e é uma estrutura de tamanho otimizado, mas que privilegia a performance das consultas feitas na estrutura.

o Já a segunda otimização é chamada “AKD-Tree reduzida” e privilegia o tamanho da estrutura e por isso tem performance de consultas pior do que a da AKD-Tree, porém seu tamanho é mínimo.

Bibliografia

[1] Anderson, J.R., Matessa, M. Explorations of an incremental, Bayesian algorithm for categorization. Machine Learning, 9(4):275-308, 1992.

[2] Beinlich, I., Suermondt, H., Chavez, R., Cooper, G. The ALARM monitoring system: A case study with two probabilistic inference techniques for belief networks. Proceedings of the Second European Conference on Artificial

Intelligence and medicine, 689-693, 1992.

[3] Bentley, J.L. Multidimensional binary search trees used for associative searching. Communications of the ACM, 18(9): 509-517, 1975.

[4] Bezdek, J.C. Pattern recognition with fuzzy objective function algorithms. Plenum Press, New York, 1981.

[5] Buntine, W. Theory refinement on Bayesian networks. Proceedings of the

Seventh Conference on Uncertainty in Artificial Intelligence, 52-60, 1991.

[6] Buntine, W. Operations for learning with graphical models. Journal of Artificial

Intelligence Research, 2:159-225, 1994.

[7] Castelo, R. A Discrete Acyclic Digraph Markov Model in Data Mining. PhD thesis, Faculteit Wiskunde en Informatica, Univeriteit Utrecht, 2002.

[8] Castelo, R., Kocka, T. On inclusion-driven learning of Bayesian networks.

Journal of Machine Learning Research, 4:527-574, 2003.

[9] Castillo, E., Gutierrez, J., Hadi, A. Expert Systems and Probabilistic Network Models. Springer-Verlag, New York, 1997.

[10] Chow, C.K., Liu, C.N. Approximating discrete probability distributions with dependence trees. IEEE Transactions on Information Theory, 14(3):462-467, 1968.

[11] Cooper, G., Herskovits, E. A Bayesian method for the induction of probabilistic networks from data. Machine Learning, 9(4):309-347, 1992. [12] Domingos, P., Hulten, G. Catching up with the data: Research issues in

mining data streams. Workshop on Research Issues in Data Mining and

[13] Domingos, P., Hulten, G. A general framework for mining massive data streams. Journal of Computational and Graphical Statistics, 12(4):945-949, 2003.

[14] Druzdzel, M.J. SMILE: Structural Modeling, Inference and Learning Engine and GeNIe: A development environment for graphical decision-theoretic models. Proceedings of the Sixteenth National Conference on Artificial

Intelligence, 902-903, 1999.

[15] Druzdzel, M.J., van der Gaag, L.C. Building probabilistic networks: where do the numbers come from?. IEEE Transactions on Knowledge and Data

Engineering, 12(4):481-486, 2000.

[16] Fayyad, U., Piatetsky-Shapiro, G., Smyth, P. From data mining to knowledge discovery: an overview. Advances in Knowledge Discovery and Data Mining, AAAI Press, Menlo Park, CA, 1-34, 1996.

[17] Fisher, D.H. Knowledge acquisition via incremental conceptual clustering.

Machine Learning, 2(2):139-172, 1987.

[18] Friedman, N., Goldszmidt, M. Sequential update of Bayesian network structure. Proceedings of the Thirteenth Conference on Uncertainty in

Artificial Intelligence, 165-174, 1997.

[19] Friedman, N., Geiger, D. Goldszmidt, M. Bayesian network classifiers.

Machine Learning, 29(2-3):131–163, 1997.

[20] Gama, J., Castillo, G. Adaptive Bayes. Proceedings of the 8th Ibero-

American Conference of Artificial Intelligence, 765-774, 2002.

[21] Gennari, J.H., Langley, P., Fisher, D. Models of incremental concept formation. Artificial Intelligence, 40(1-3):11-61, 1989.

[22] Hruschka Jr, E.R., Ebecken, N.F.F. Variable ordering for Bayesian networks learning from data. Proceedings of the International Conference on

Computational Intelligence for Modelling, Control and Automation, Vienna,

Austria, 2003.

[23] Hruschka Jr, E.R. et al. Bayesian networks for imputation in classification problems. Journal of Intelligent Information Systems, 2007.

[24] Hruscka Jr, E.R. Imputação Bayesiana no contexto da mineração de dados. PhD. Thesis, COPPE-Universidade Federal do Rio de Janeiro, 2003.

[25] Hruscka Jr, E.R. Propagação de Evidências em Redes Bayesianas: Diagnóstico sobre Doenças Pulmonares, MSc. Thesis, CIC-Universidade de Brasília, 1997

[26] Huang, C., Darwiche, A. Inference in belief networks: a procedural guide.

International Journal of Approximate Reasoning, 15(3), 225-263, 1996.

[27] Hulten, G., Domingos, P. Mining complex models from arbitrarily large databases in constant time. Proceedings of the Eighth ACM SIGKDD

International Conference on Knowledge Discovery and Data Mining, 525-

531, 2002.

[28] Lam, W., Bacchus, F. Using new data to refine Bayesian networks.

Proceedings of the Tenth Conference on Uncertainty in Artificial Intelligence,

383-390, 1994.

[29] Langley, P. Order effects in incremental learning. Learning in Humans and

Machines: Towards an Interdisciplinary Learning Science, eds., Reimann, P.

and Spada, H., Elsevier, Amsterdam, 1995.

[30] Lauritzen, S.L. The EM algorithm for graphical association models with missing data. Computational Statistics and Data Analysis, 19:191-201, 1995. [31] Lauritzen, S.L., Spiegelhalter, D.J. Local computations with probabilities on

graphical structures and their application to expert systems. Journal of the

Royal Statistical Society B, 50(2):157-224, 1988.

[32] Mauro, N., Esposito, F., Ferilli, S., Basile, T.M.A. Avoiding order effects in incremental learning. Advances in Artificial Intelligence, 3673:110–121, 2005. [33] Mitchell, T.M. Machine Learning. McGraw-Hill Series in Computer Science.

The McGraw-Hill Companies, Inc., 1997.

[34] Moore, A.W., Lee, M.S. Cached sufficient statistics for efficient machine learning with large datasets. Journal of Artificial Intelligence Research, 8:67- 91, 1998.

[35] Moore, A.W., Schneider, J., Deng, K. Efficient locally weighted polynomial regression predictions. Proceedings of the Fourteenth International

Conference on Machine Learning, 236-244, 1997.

[36] Neapolitan, R.E. Learning Bayesian Networks. Prentice Hall, Upper Saddle River, NJ, 2003.

[38] Pearl, J., Verma, T.S. A statistical semantics for causation. Statistics and

Computing, 2:91-95, 1991.

[39] Provost, F.J., Kolluri, V. A survey of methods for scaling up inductive algorithms. Data Mining and Knowledge Discovery, 3(2):131-169, 1999. [40] Roure, J. Incremental methods for Bayesian network structure learning.

Ph.D. Dissertation proposal. U. Politecnica de Cataluña. 2004.

[41] Roure, J. An incremental algorithm for tree-shaped Bayesian network learning. Proceedings of the fifteenth European Conference of Artificial

Intelligence, 350-354, 2002.

[42] Roure, J. Incremental learning of tree augmented naïve Bayes classifiers.

Proceedings of the Eighth Ibero-American Conference of Artificial Intelligence, 2527:32-41, 2002.

[43] Roure, J., Talavera, L. Robust incremental clustering with bad instance orderings: a new strategy. Sixth Ibero-American Conference on Artificial

Intelligence, 136-147, 1998.

[44] Spiegelhalter, D.J., Lauritzen, S.L. Sequential updating of conditional probabilities on directed graphical structures. Networks, 20(5):579-605, 1990. [45] Spirtes, P., Glymour, C., Scheimes, R. Causation, Prediction and Search.

Springer-Verlag, New York, 116-125, 1993.

[46] Weiss, S.M., Kulikowski, C.A. Computer systems that learn. Morgan Kaufmann, San Mateo, CA, 1991.

[47] Witten, I.H., Frank, E. Data mining: practical machine learning tools and techniques (Second Edition). Morgan Kaufmann, San Mateo, CA, 2005. [48] Yang, Y., Webb, G.I. Proportional k-Interval discretization for naïve-Bayes

classifiers. Lecture Notes in Computer Science, 2167:564, 2001.

[49] Yang, Y., Webb, G.I. On why discretization works for naïve-Bayes classifiers.

Apêndice I – Tabelas com os resultados do