SONUÇ VE ÖNERİLER - CBS amaçlı yer kontrol noktaları bilgi sistemi oluşturma ve Konya kent bütü

Como já se sabe, os variados arranjos de ensembles apresentam diferentes resultados em termos de desempenho. Desta forma, faz-se necessária, para a construção de um modelo de recomendação, a aplicação do conhecimento de Meta-aprendizado para associar os modelos que apresentaram melhor desempenho, as meta-características dos problemas na qual foram aplicados. Por outro lado, fazemos uma divisão quanto a abordagem de meta-aprendizado a ser aplicada, e adotamos as nomenclaturas: Meta-aprendizado Tradicional e Meta-aprendizado Multirrótulo. Em ambas divisões, o processo de associação é realizado em quatro etapas sepa- radamente. (a) A primeira etapa é referente à extração de meta-características do total de 200 problemas de classificações, conforme ilustrada na Figura 8. (b) A segunda etapa é referente à associação entre desempenho dos modelos de arquitetura as meta-características dos problemas aplicados, dando suporte ao processo de recomendação do tipo de arquitetura, conforme ilus- trada Figura 9. (c) Já na terceira etapa, mapeamos os desempenhos dos modelos homogêneos as meta-características dos problemas aplicados, dando suporte ao processo de recomendação dos componentes homogêneos. E por fim, (d) a quarta etapa (essa etapa só é implementada na abordagem multirrótulo), que faz o mapeamento do desempenho dos possíveis componentes he-

terogêneos as meta-características dos problemas aplicados. Essa última etapa, dá suporte ao processo de recomendação dos componentes heterogêneos.

Figura 8: Extração de meta-características.

Figura 9: Testes para mapeamento.

Meta-aprendizado Tradicional

Nesta abordagem, é realizado o mapeamento entre as metas-características aos melhores mo- delos, levando em consideração apenas o desempenho dos algoritmos que apresentaram menor valor do erro médio, vide Figura 10.

Para implementar o mapeamento referente à arquitetura, são realizados os testes (validação cruzada de 10-folds) com todos as arquiteturas (1 – Bagging, 2 – Boosting e 3 – Multiboosting) formados por todos os tipos homogêneos de componentes base (1 – RBF, 2 – J48, 3 – SMO, 4 – NB e 5 – IBk). É realizada um média geral dos experimentos de todas as arquiteturas. Em seguida é construído um ranking dos erros médios. A arquitetura que apresentar menor valor é selecionada para realizar o mapeamento das meta-característica da base testada. A Figura 11 ilustra esse processo.

Para implementar o mapeamento dos componentes homogêneos, foram executadas valida- ções cruzadas de 10-folds, 10 vezes sobre diferentes seeds de testes. Em seguida é construído um ranking para os tipos homogêneos de componentes base (1 – RBF, 2 – J48, 3 – SMO, 4 –

Figura 10: Mapeamento tradicional.

Figura 11: Mapeamento tradicional para escolha da arquitetura.

NB e 5 – IBk), com base no erro médio da validação cruzada para todos os seeds. O componente que apresentar menor valor é selecionado para realizar o mapeamento. A Figura 12 ilustra esse processo.

Meta-aprendizado Multirrótulo

Esta abordagem, diferentemente da abordagem tradicional, o mapeamento entre as metas- características aos melhores modelos, não é realizada levando-se em consideração apenas os valores de erro médio, mas sim, um teste estatístico que indica se a equivalência entre os desem- penhos podem ou não ser rejeitados. Uma vez que os modelos apresentem resultados estatistica- mente equivalentes, fazemos um mapeamento multirrótulo, vide Figura 13, considerando, desta forma, todas as soluções em potencial. Utilizamos o teste de hipótese t-teste bicaudal pareado, entre o melhor modelos e os demais. Esse teste estatístico tem como objetivo avaliar a equiva- lência entre duas medidas amostrais, supondo independência e normalização das observações – no caso, das taxas de erros (WITTEN; FRANK, 2005).

Figura 13: Mapeamento multirrótulo.

A implementação do processo de mapeamento da arquitetura multirrótulo é semelhante ao processo tradicional até a geração do ranking. Na sequência é calculada o teste de hipótese da melhor arquitetura com todas as demais. No mapeamento multirrótulo, o melhor valor assume valor um, enquanto que as demais, se o teste estatístico apresentar valor maior 0,5, não rejeitamos a hipótese nula H0, então é mapeado o valor um, caso contrário, mapeamos com valor zero, visto

que rejeitamos H0. A Figura 14 ilustra esse processo.

A implementação do processo de mapeamento de componentes homogêneos segue a mesma ideia do citado para arquitetura, tanto no que se refere à construção do ranking quanto do mape- amento multirrótulo. A Figura 15 ilustra o processo.

Figura 14: Mapeamento multirrótulo para escolha da arquitetura.

Figura 15: Mapeamento multirrótulo para escolha dos componentes homogêneos.

citados. Para a escolha dos componentes heterogêneos, é evoluída uma população de indivíduos. Cada indivíduo é uma representação inteira de 10 posições, cujo os alelos podem assumir valores entre [1,5], esse valores por sua vez indicam os tipos de componentes base heterogêneos (1 – RBF, 2 – J48, 3 – SMO, 4 – NB e 5 – IBk). Em seguida, para realização do mapeamento, é informado de forma binária, se o tipo de componente heterogêneo aparece ou não, onde um indica presença e zero a ausência. A Figura 16 ilustra o processo.

Uma vez realizado todos os mapeamentos, os meta-aprendizes são algoritmos de aprendi- zado conhecidos, como: rede neural Multi-layer Perceptron (MLP), máquina de vetores-suporte, árvore de decisão e algoritmo baseado em vizinhança. Nesse processo são criados meta-aprendizes independentes para recomendação de arquitetura, componentes homogêneos ou heterogêneos.

Figura 16: Mapeamento multirrótulo para escolha dos componentes heterogêneos.

Uma vez que se tenha um novo problema de classificação de padrões, todas as meta-características são extraídas, e apresentadas para cada meta-aprendiz treinado para o tipo de recomendação es- pecífica. Esses, por sua vez, farão a recomendação dos melhores parâmetros de controle do ensemblea ser utilizado como o novo problema apresentado. A Figura 17 ilustra o processo de recomendação.

Figura 17: Meta-aprendiz.

3.3 Síntese do Capítulo

Este capítulo permitiu ao leitor entender as novas abordagens aqui apresentada. Foram des- tacadas as contribuições correlatas ao tema. Apresentamos três novas abordagens que são a base da contribuição desta tese. Na sequência apresentamos a nova abordagem de incremento de técnicas de diversidade em ensembles. Posteriormente, apresentamos uma nova abordagem via

Algoritmo Genético para seleção de atributos. E finalmente, apresentamos a abordagem para recomendação dos parâmetros de controle em ensembles para arquitetura e componentes homo- gêneos e heterogêneos.

O próximo Capítulo 4, serão apresentadas as metodologias utilizadas para realização dos experimentos computacionais, bem como, uma análise dos resultados obtidos pelas abordagens aqui mencionadas.

Capítulo 4

Experimentos Computacionais

Este capítulo é dedicado à apresentação dos experimentos computacionais de validação das novas abordagens para construção eficientes de ensembles apresentadas no capítulo anterior. Tais protótipos foram implementados usando linguagem de programação Java, lançando-se mão dos insumos providos pelo framework WEKA (WITTEN; FRANK, 2005).

4.1 Problemas de Classificação

Para fins de validação da proposta, serão conduzidos experimentos sobre 20 problemas de classificação extraídos do repositório UCI (ASUNCIóN; NEWMAN, 2007). A maioria desses problemas também já serviu de alvo de investigação em trabalhos correlatos na linha de Comitês de Classificadores (OPITZ; MACLIN, 1999; DIETTERICH, 2000b; CANUTO et al., 2007). As bases de dados relativas a esses problemas, assim como uma descrição das suas propriedades em termos de número de amostras, número e tipos de atributos, número e distribuição das classes, e existência de atributos faltantes, podem ser encontradas no Apêndice A.

Para cada um dos 20 conjuntos de dados, serão gerados novos 10 conjunto de dados de forma aleatória e estratificado, totalizando 200 novos conjuntos de dados. Esse estratégia foi

adotada na tentativa de se obter um número maior de conjuntos de dados para extração das meta- características, bem como, a realização dos testes das gerações das diferentes configurações de ensemblesvia Bagging, Boosting e MultiBoosting.

Belgede CBS amaçlı yer kontrol noktaları bilgi sistemi oluşturma ve Konya kent bütününde bir uygulama (sayfa 133-138)