• Sonuç bulunamadı

von II. Gompcrz, Platon«

E. Zeilcr, History, 135

Neste capítulo, foram apresentados os principais conceitos que envolvem um processo de classificação de dados, um dos principais problemas em AM, área de IA em que se situa este projeto de mestrado. Após a definição dos aspectos gerais envolvidos em AM e na classificação de dados, foram intro- duzidos os paradigmas de aprendizado, bem como as técnicas de AM repre- sentantes desses paradigmas que foram utilizadas no desenvolvimento dos algoritmos hierárquicos estudados neste projeto: C4.5, RIPPER, SVMs, Redes Bayesianas e KNN. Além disso, foram discutidas estratégias de combinação de

classificadores, cujos conceitos fundamentais são necessários para o entendi- mento dos algoritmos baseados na combinação hierárquica de classificadores propostos no próximo capítulo. Também foram discutidos os principais mé- todos de particionamento do conjunto de dados em conjuntos de treinamento e teste, e as principais medidas de avaliação dos resultados obtidos para um classificador.

Uma vez definidos os principais conceitos e processos envolvidos em um problema convencional de classificação de dados, no próximo capítulo são discutidos os principais aspectos de problemas de classificação hierárquica. Além disso, são introduzidos os algoritmos para geração dos modelos hierár- quicos de classificação utilizados nos experimentos descritos no Capítulo5.

3

Classificação Hierárquica

A grande maioria dos problemas de classificação descritos na literatura de AM envolve classificação plana (flat classification). Neste tipo de classifica- ção, cada exemplo é associado a uma classe pertencente a um conjunto finito de classes, não considerando a existência de relacionamentos entre elas. No entanto, existe um grande número de problemas em que as classes são dis- postas em uma estrutura hierárquica, tal como uma árvore ou um DAG. Esses problemas são conhecidos na literatura como problemas de classificação hie- rárquica (Freitas & Carvalho,2007).

Dessa forma, um problema de classificação hierárquica difere de um pro- blema de classificação plana fundamentalmente na forma como as suas clas- ses estão relacionadas entre si, como pode ser observado na Figura3.1. Tanto para classificação plana como para classificação hierárquica, os nós represen- tam as classes envolvidas no problema, com exceção do nó identificado sob o rótulo “qualquer classe”. Esse é o nó-raiz e o ponto de partida para o pro- cesso de classificação, indicando a total ausência de conhecimento a respeito da classe a qual um exemplo pertença, se ele estiver posicionado sobre esse nó.

Na classificação plana, supõe-se a independência entre as classes envolvi- das. Nesse caso, a única conexão entre as classes é a ligação com o nó-raiz. Na classificação hierárquica, as classes que se ramificam a partir do nó-raiz podem se relacionar com outras classes - classes descendentes ou subclasses. Neste capítulo, são abordados os principais aspectos que caracterizam um problema de classificação hierárquica. Além disso, são introduzidas as abor- dagens utilizadas para o desenvolvimento dos algoritmos analisados experi-

Figura 3.1: Classificação Plana x Classificação Hierárquica (Freitas & Carva- lho, 2007).

mentalmente no Capítulo 5. As seções estão organizadas da seguinte forma: na Seção 3.1, são descritos os conceitos básicos de um processo de classifi- cação hierárquica; na Seção3.2, são descritas as principais abordagens utili- zadas para a resolução de um problema hierárquico; estratégias para a com- binação hierárquica de classificadores são propostas e discutidas na Seção

3.3; métodos e medidas para avaliação de modelos hierárquicos são discuti- das na Seção 3.4; por fim, algumas considerações finais a respeito dos tópicos discutidos no capítulo são apresentadas na Seção 3.5.

3.1 Conceitos Básicos

Classificação hierárquica é um tipo de problema de classificação no qual as classes envolvidas podem ser divididas em subclasses ou agrupadas em superclasses, dando origem a uma hierarquia. Nos métodos hierárquicos de classificação, o algoritmo de aprendizagem induz um modelo que captura os relacionamentos mais relevantes entre as classes funcionais no conjunto de dados de treinamento, considerando os relacionamentos hierárquicos entre elas. Essa abordagem permite a utilização de uma grande variedade de algo- ritmos de AM no processo de classificação (Freitas & Carvalho,2007).

Dois importantes aspectos que caracterizam um problema de classificação hierárquica são: o tipo de hierarquia empregado para representar os relaci- onamentos entre as classes; e o nível hierárquico em que as predições são feitas.

Tipos de Hierarquia de Classes

Existem duas maneiras em que as classes podem estar dispostas hierar- quicamente: como uma árvore ou um DAG.

A principal diferença entre a estrutura em árvore (Figura 3.2) e a estrutura DAG (Figura3.3) é que, na estrutura em árvore, cada nó, exceto o nó-raiz, tem somente um nó-pai, enquanto que no DAG cada nó, exceto o nó-raiz, pode ter um ou mais nós-pai.

Figura 3.2: Exemplo de uma hierarquia de classes estruturada como uma árvore (Freitas & Carvalho,2007).

Figura 3.3: Exemplo de uma hierarquia de classes estruturada como um DAG (Freitas & Carvalho, 2007).

Problemas de classificação hierárquica têm por objetivo a classificação de cada novo dado de entrada em um dos nós-folha, pois quanto mais profunda a classe na hierarquia, mais específico e útil é o conhecimento. Pode ocorrer, no entanto, do classificador não apresentar uma confiabilidade desejada na classificação em uma das classes do nível mais profundo, sendo mais seguro realizar a classificação nos níveis mais elevados.

Para estruturas de classes em árvore, quanto mais profundo é o nível, mais difícil é o processo de predição. Isso se deve ao fato de que o número de exem- plos por classe em níveis mais profundos tende a ser menor e, conseqüente- mente, a confiabilidade do modelo de classificação induzidos para esses níveis também tende a ser menor.

Para estruturas em DAG, a análise é um pouco mais complexa porque, como um nó-filho pode ter mais de um nó-pai, algumas classes em níveis mais profundos podem ter mais exemplos do que seus ancestrais. Apesar disso, na prática, mesmo para DAGs, a TA de predição decresce com o aumento do nível de profundidade (Freitas & Carvalho,2007).

Dessa forma, quanto mais próxima da raiz da hierarquia ocorrer a associ- ação de um dado de entrada com um nó, menor tende a ser a TE de classifi- cação. Por outro lado, menos específica, e por conseqüência menos útil, será a classificação obtida. Assim, um classificador hierárquico terá que lidar com o trade-off especificidade X TE de classificação.

Nível hierárquico de predição de classes

Em alguns problemas, todos os exemplos devem ser associados com classes representadas por nós-folha. Tais problemas são chamados de “problemas de predição obrigatória em nós-folha”.

Em contraste, existe uma outra categoria de problemas em que não existe essa restrição de obrigatoriedade de classificação nos nós-folha. Tais proble- mas, denominados de “problemas de predição opcional em nós-folha”, permi- tem que um exemplo seja associado a uma classe representada por um nó interno da hierarquia. Essa característica pode ser útil para problemas que optam pela liberdade em realizar uma predição mais geral, porém com maior confiabilidade. Lembrando que quanto mais específica é uma predição, maior é sua utilidade.