• Sonuç bulunamadı

VI. KÂGİR KUBBELİ CAMİLER

VI.IV. Hatuniye Cam

Dentro da ´area de AM foram propostos v´arios paradigmas capazes de aprender a par- tir de um conjunto de exemplos. Um requisito b´asico para todos os paradigmas de AM supervisionado ´e que o conceito a ser aprendido deve estar relacionado com casos obser- vados, isto ´e, exemplos, e cada exemplo deve estar rotulado com a classe a qual pertence. Os paradigmas de aprendizado mais conhecidos s˜ao brevemente discutidos nas pr´oximas se¸c˜oes.

2.5.1.1 Paradigma Simb´olico

Os sistemas de aprendizado simb´olico buscam aprender construindo representa¸c˜oes simb´o- licas de um conceito por meio da an´alise de exemplos e contra-exemplos desse conceito. As representa¸c˜oes simb´olicas est˜ao tipicamente na forma de alguma express˜ao l´ogica: ´arvores de decis˜ao; regras de decis˜ao ou redes semˆanticas.

Atualmente, entre as representa¸c˜oes simb´olicas mais estudadas est˜ao as ´arvores e regras de decis˜ao. ´E atribu´ıdo a Morgan & Messenger (1973) o desenvolvimento original do programa para a indu¸c˜ao de ´arvores de decis˜ao. O m´etodo de indu¸c˜ao de ´arvores de decis˜ao a partir de dados emp´ıricos, conhecido como particionamento recursivo, foi estudado por pesquisadores da ´area de IA e Estat´ıstica. Os sistemas ID3 (Quinlan, 1986) e C4.5 (Quinlan, 1987b) para indu¸c˜ao de ´arvores de decis˜ao tiveram uma importante contribui¸c˜ao sobre a pesquisa em IA. ´E interessante observar que sistemas de ´arvores de classifica¸c˜ao e regress˜ao (Breiman, Friedman, Olshen & Stone,1984) foram desenvolvidos independentemente por estat´ısticos durante praticamente o mesmo per´ıodo que o ID3, no final dos anos 70.

Os trabalhos com indu¸c˜ao de regras de decis˜ao surgiram com a simples tradu¸c˜ao das ´arvores de decis˜ao para regras, com a poda realizada sobre as regras, tal abordagem surgiu no trabalho de (Quinlan, 1987a). Posteriormente, foram criados m´etodos que induziam regras diretamente a partir dos dados, um exemplo desse trabalho pode ser encontrado

em (Michalski, Mozetic, Hong & Lavrac,1986). Um excelente levantamento dos principais sistemas indutores de regras de decis˜ao pode ser encontrado em (F¨urnkranz, 1999).

2.5.1.2 Paradigma Estat´ıstico

Pesquisadores em estat´ıstica tˆem criado diversos m´etodos de classifica¸c˜ao e regress˜ao, mui- tos deles semelhantes aos m´etodos empregados em AM. Por exemplo, o m´etodo CART (Breiman, Friedman, Olshen & Stone, 1984), um sistema muito conhecido para construir ´arvores de decis˜ao, foi desenvolvido por estat´ısticos. Como regra geral, t´ecnicas estat´ısti- cas tendem a focar tarefas em que todos os atributos tˆem valores cont´ınuos ou ordinais. Muitos deles tamb´em s˜ao param´etricos, assumindo alguma forma de modelo ou distribui- ¸c˜ao, e ent˜ao encontrando valores apropriados para os parˆametros do modelo a partir de dados. Por exemplo, um classificador linear assume que as classes podem ser expressas como combina¸c˜ao linear dos valores dos atributos, e ent˜ao procura uma combina¸c˜ao linear particular que forne¸ca a melhor aproxima¸c˜ao sobre o conjunto de dados. Os classificadores estat´ısticos freq¨uentemente assumem que os valores de atributos est˜ao normalmente distri- bu´ıdos, e ent˜ao usam os dados fornecidos para determinar m´edia, variˆancia e co-variˆancia da distribui¸c˜ao.

2.5.1.3 Paradigma Instance-based

Uma forma de classificar um caso ´e lembrar de um caso similar cuja classe ´e conhecida e assumir que o novo caso ter´a a mesma classe. Essa filosofia exemplifica os sistemas instance-based, os quais classificam casos nunca vistos utilizando casos similares conheci- dos (Aha, Kibler & Albert, 1991).

As caracter´ısticas principais dos sistemas instanced-based s˜ao: Os casos de treinamento devem ser lembrados

Se todos os casos forem memorizados, o classificador pode se tornar lento e dif´ıcil de manusear. O ideal ´e reter casos protot´ıpicos que juntos resumam toda a infor- ma¸c˜ao importante. Essa abordagem pode ser observada em livros m´edicos e legais.

Aha, Kibler & Albert(1991) descrevem algumas estrat´egias para decidir quando um novo caso deve ser memorizado. Uma segunda solu¸c˜ao reside em construir estruturas capazes de indexar os exemplos e responder consultas sobre os exemplos mais seme- lhantes de forma mais r´apida. Exemplos dessas estruturas s˜ao as M-trees (Ciaccia, Patella & Zezula,1997) e as Slim-trees (Jr., Traina, Seeger & Faloutsos, 2000);

Seção 2.5: Aprendizado de Máquina Indutivo por Exemplos 23

A medida de similaridade entre os casos

Se todos os atributos forem quantitativos, pode-se calcular a distˆancia entre dois casos utilizando a distˆancia euclidiana, por exemplo. Quando alguns atributos n˜ao s˜ao qualitativos, essa interpreta¸c˜ao de distˆancia se torna mais problem´atica. Al´em do mais, se existem muitos atributos irrelevantes, dois casos similares podem aparentar serem muito diferentes pois eles podem possuir valores diferentes em atributos sem importˆancia. Stanfill & Waltz(1986) desenvolveram um m´etodo sens´ıvel ao contexto para alterar a escala dos atributos de forma que as medidas de distˆancia fiquem mais robustas;

A rela¸c˜ao entre um novo caso e os casos armazenados

Para classificar um novo caso existem diversas alternativas. Uma delas consiste em usar um ´unico caso, o qual ´e o mais pr´oximo do novo caso para classificar esse novo caso. Uma segunda alternativa consiste em usar v´arios casos. Nessa alternativa, pode-se levar em considera¸c˜ao os diferentes graus de similaridade entre cada caso e o novo caso na determina¸c˜ao da classe do novo caso. A segunda alternativa ´e geralmente mais utilizada por ser mais robusta a erros nos dados.

2.5.1.4 Paradigma Conexionista

Redes neurais s˜ao constru¸c˜oes matem´aticas relativamente simples que foram inspiradas no modelo biol´ogico do sistema nervoso. Sua representa¸c˜ao envolve unidades altamente inter-conectadas, e o nome conexionismo ´e utilizado para descrever a ´area de estudo.

A met´afora biol´ogica com as conex˜oes neurais do sistema nervoso tem interessado muitos pesquisadores, e tem fornecido diversas discuss˜oes sobre os m´eritos e as limita¸c˜oes dessa abordagem de aprendizado. Em particular, as analogias com a biologia tˆem levado muitos pesquisadores a acreditar que as redes neurais possuem um grande potencial na resolu¸c˜ao de problemas que requerem intenso processamento sensorial humano, tal como vis˜ao e reconhecimento de voz.

As pesquisas em redes neurais foram iniciadas com o trabalho pioneiro de McCul- loch & Pitts (1943). McCulloch era um psiquiatra e pesquisou por 20 anos uma forma de representar um evento no sistema nervoso. Pitts era um jovem pesquisador e come¸cou a trabalhar com McCulloch em 1942. Praticamente 15 anos ap´os a publica¸c˜ao de McCulloch e Pitts, Rosenblatt(1958) apresentou o Perceptron, cuja grande contribui¸c˜ao foi a prova do teorema de convergˆencia. Mas, no livro Perceptrons,Minsky & Papert(1969) demons- traram a existˆencia de limites fundamentais nos perceptrons de uma camada. A pesquina

na ´area ficou praticamente est´atica at´e queHopfield(1982) utilizou a id´eia de uma fun¸c˜ao de energia para formular uma nova forma de compreender os c´alculos realizados em redes recorrentes com conex˜oes sin´apticas sim´etricas.

Talvez mais do que qualquer outra publica¸c˜ao, o artigo de Hopfield em 1982 e o livro de Rumelhart & McClelland (1998), foram as publica¸c˜oes que mais influenciaram para o resurgimento do interesse sobre redes neurais na d´ecada de 80.

Benzer Belgeler