• Sonuç bulunamadı

Körüklü Çizme Üretim Teknikleri

2.3 Körüklü Çizme Üretimi

2.3.2 Körüklü Çizme Üretim Teknikleri

Redes Bayesianas e classificadores Bayesianos aprendem relações de causa e consequên- cia e podem combinar conhecimento a priori com padrões aprendidos a partir dos da- dos. Porém, o conhecimento representado por um classificador Bayesiano não é tão compreensível como algumas outras formas de representação, como as regras de classifi- cação. A combinação de classificadores Bayesianos e um conjunto de regras pode tornar os resultados mais compreensíveis, além de facilitar o processo de depuração conduzido por um especialista humano. Esta combinação é proposta por Hruschka et al. (2007), no método chamado BayesRule, que, além de explorar o potencial dos classificadores Bayesianos em relação à tarefa de classificação, transforma o classificador Bayesiano em um conjunto de regras de classificação do tipo SE-ENTÃO. Estas, são consideradas como mais compreensíveis e mais aceitáveis para usuários do que as recomendações dadas por sistemas caixa preta, pois proporcionam melhor entendimento e explicações, e podem ser validadas por inspeção humana. Além disso, a rede Bayesiana permite que o usuário ou especialista interfira nos nós da rede e insira um conhecimento que se propaga nos outros nós, o que seria dificultoso em um sistema como uma rede neural, por exemplo.

Uma rede Bayesiana pode ser considerada como uma forma de modelo gráfico prob- abilístico usado para representar conhecimento sobre um domínio de dados. É composta por uma estrutura de rede, que consiste em um grafo acíclico direcionado, e um con- junto de tabelas de probabilidade. Os nós da estrutura da rede representam as variáveis e os arcos entre os nós representam relações de dependência entre as variáveis corre- spondentes. Um arco começando em um nó X e terminando em um nó Y estabelece X como pai de Y e Y como filho de X. Uma rede Bayesiana pode ser utilizada como um classificador, calculando a probabilidade condicional de um nó, chamado nó classe, dados os valores das probabilidades dos outros nós.

Em Cheng et al. (2002) uma rede Bayesiana é representada por BN =< N, A, Θ >, onde < N, A > é um grafo acíclico direcionado em que cada nó xi∈ N representa uma

variável e cada arco a ∈ A entre nós representa uma dependência probabilística entre os nós associados. Uma distribuição de probabilidade condicional θi é associada com cada

nó xi ∈ N, i = 1, ..., n, coletivamente representado por Θ = θi, que quantifica o quanto

um nó depende de seus pais. A independência condicional, que é a condição de Markov, permite o cálculo da distribuição conjunta de todas as variáveis, dado por (5.1)

P (x1, x2, ..., xn|BK) = n

Y

i=1

P (xi|πxi, BK) (5.1)

onde BK representa o conhecimento antecedente, xi é a i-ésima variável ou nó, e πxi

é o conjunto de pais de xi. Portanto, uma rede Bayesiana pode ser usada como uma

representação do conhecimento que permite inferências. As redes Bayesianas podem ser construídas a partir do conhecimento de especialista humano ou podem ser aprendidas a partir dos dados. Na construção de uma rede Bayesiana baseada em conhecimento humano, o maior problema é a definição da distribuição de probabilidade condicional (Tversky e Kahneman, 1974). Para evitar esta dificuldade, é possível usar o conheci- mento humano para construir apenas a estrutura da rede Bayesiana e utilizar algoritmos de aprendizado para induzir Θ a partir dos dados.

Na estrutura da rede Bayesiana com λAo conjunto de filhos do nó A e πAo conjunto

de pais do nó A, o subconjunto de nós contendo πA, λA e os pais de λA é chamado

Markov blanket de A. Como descrito em Pearl (1988), os únicos nós que têm influência na distribuição de probabilidade condicional de um dado nó A são os nós que pertencem ao Markov blanket de A. Desta forma, o Markov blanket do nó que representa a classe pode ser usado como um critério de seleção de padrões para identificar, dentre os nós que definem a rede, aqueles que influenciam o nó classe.

No método BayesRule proposto por Hruschka et al. (2007), um classificador Bayesiano com n variáveis pode ser construído e então qualquer das variáveis pode ser definida como classe. Este método é baseado no conceito de probabilidade máxima a posteriori (Henrion e Druzdzel, 1990; Pearl, 1988) para extrair um conjunto de regras probabilísti- cas que descrevem a classificação. O subconjunto de nós de Markov blanket é usado para reduzir o número e a complexidade das regras de classificação, selecionando os padrões a serem usados no antecedente das regras do tipo SE-ENTÃO. Isto permite a redução no tempo requerido para construir modelos quando mais de uma variável é designada como classe. Seguindo esta aproximação, um classificador Bayesiano evidencia que o algoritmo de propagação deve ser usado para propagar os valores das variáveis e inferir

o valor da variável classe. O algoritmo de inferência descrito em Lauritzen e Spiegel- halter (1988) é usado na implementação do método BayesRule. A confiança da regra pode ser definida utilizando resultados inferenciais. Com isso, a probabilidade dada à classe inferida pode ser usada como um valor de confiança e é embutido no algoritmo de inferência.

Uma rede de classificação Bayesiana irrestrita (Cheng et al., 2002) apresenta uma estrutura de grafo acíclico direcionado. Como mencionado anteriormente, cada nó cor- responde a uma variável aleatória discreta no domínio do conhecimento e é associado a uma tabela de probabilidade condicional que especifica a probabilidade de cada condição possível do nó, dada cada combinação possível das condições de seus pais. Se o nó não tem pai, sua tabela de probabilidade condicional fornece as probabilidades marginais da variável que o nó representa. Portanto, uma rede Bayesiana representa a distribuição de probabilidade conjunta sobre um conjunto de variáveis aleatórias e pode ser usada para fazer inferências em qualquer nó. Desta forma, uma rede de classificação Bayesiana prediz o valor da variável classe discreta, dado o valor de um vetor de variáveis padrões. Um classificador naïve Bayes é um caso especial de uma rede de classificação Bayesiana irrestrita. Em particular, é uma rede Bayesiana na qual o nó classe não tem pais. Além disso, cada padrão tem o nó classe como seu único pai. A estrutura da rede é fixa, ou seja, não é necessário aprender a estrutura da rede naïve Bayes a partir dos dados, apenas os parâmetros numéricos. Desta forma, apenas as informações sobre os padrões e seus correspondentes valores são necessários para estimar as probabilidades.

A complexidade computacional do aprendizado de uma rede naïve Bayes é linear com relação à quantidade de instâncias de treinamento. A construção requer também apenas a informação fornecida por tabelas bi-dimensionais, nas quais cada entrada corresponde à probabilidade estimada para um dado valor de um padrão. Porém, o método naïve Bayes faz uma forte afirmação: todos os padrões são condicionalmente independentes dado o valor da classe.

O algoritmo BayesRule para extração de regras de classificação a partir de um classificador Bayesiano é descrito na subseção seguinte.

Benzer Belgeler