BÖLÜM 1: FAALİYET TABANLI MALİYETLEME
1.7. Faaliyet Tabanlı Maliyetleme Sisteminin Uygulama Aşamaları
1.7.1. Faaliyetlerin Belirlenmesi
1.7.1.2. Faaliyet Analizi
Em muitos problemas de AM, cada exemplo do conjunto de dados deve ser classificado com um único rótulo. No entanto, há outros problemas como classificação multirrótulo, em que os exemplos podem ser classificados simul- taneamente em mais de uma classe (De Carvalho e Freitas, 2009). Na próxima seção, são apresentados alguns métodos usados para resolver problemas de classificação multirrótulo.
A.5 Classificação multirrótulo
Existem vários exemplos de aplicações de classificação multirrótulo, tais como: diagnóstico médico, um paciente pode ter duas ou mais doenças ao mesmo tempo; bioinformática, proteínas podem ser classificadas ao mesmo tempo em cada uma das suas várias funções; classificação de texto, um do- cumento pode ser classificado em diferentes categorias. Nesta tese, diferentes MHs podem ser recomendadas para uma nova instância do PCV.
Diversos métodos para problemas de classificação multirrótulo podem ser encontrados na literatura. Em nossos experimentos, foram usados dois mé- todos que transformam exemplos multirrótulos em exemplos com um único rótulo e um terceiro que consiste na eliminação dos exemplos multirrótulos. Esses métodos são brevemente descritos a seguir:
• Transformação baseada em rótulos (Tsoumakas e Katakis, 2007). Novos problemas de classificação são criados a partir dos diferentes rótulos que podem usados para classificar os exemplos de um conjunto de dados. Para cada rótulo, um novo problema de classificação binária é criado. Os exemplos associados a esse rótulo são classificados como positivo, e os demais são classificados como negativo.
O processo de transformação reversível é um aspecto positivo desse mé- todo. Pois, é possível recuperar as classes do problema original a partir dos novos problemas. No entanto, esse método tem como principais as- pectos negativos: a suposição de que as diferentes classes são indepen- dentes entre si e o maior tempo computacional para induzir os modelos cuja quantidade é o número de classes.
• Decomposição de rótulos (Boutell et al., 2004). Cada exemplo multirró- tulo associado a k rótulos é transformado em k exemplos associados a um rótulo diferente. Desse modo, o número de exemplos do novo conjunto de dados é maior do que o número de exemplos do conjunto original. Apesar de ser induzido apenas um classificador a partir do novo conjunto de da- dos, tal conjunto não é muito apropriado para treinar o modelo preditivo.
Pois, o conjunto de dados fica inconsistente devido aos exemplos diferen- tes que possuem valores iguais para os meta-atributos e valor diferente para a classe Esse é um tipo de inconsistência que prejudica a indução do modelo preditivo.
• Eliminação de exemplos multirrótulos (De Carvalho e Freitas, 2009). Um método mais simples é a eliminação de todos os exemplos multirrótulos. Embora o conjunto de dados resultante seja único e não contém da- dos inconsistentes, a eliminação de muitos exemplos multirrótulos pode prejudicar a indução do modelo. A quantidade de exemplos remanescen- tes pode ser insuficiente para o modelo adquirir uma boa capacidade de generalização. Além disso, a transformação irreversível do conjunto de dados é outro aspecto negativo desse método, já que não há como saber quais foram os exemplos excluídos.
Para ilustrar os efeitos do resultado de cada uma dessas três abordagens de classificação multirrótulo, considere o conjunto de dados mostrado na Tabela A.1.
Tabela A.1: Uma ilustração de conjunto de dados com exemplos multirrótulo.
Instância Classe Multirrótulo
1 {AM, BD}
2 {LP}
3 {RE}
4 {AM, LP, RE}
A Tabela A.2 mostra o resultado da transformação baseada nos rótulos das classes, que transforma o conjunto de dados com exemplos multirrótulo em “q” conjuntos de dados com exemplos classificados em uma única classe, em que “q” é o número de classes diferentes. Como no exemplo ilustrado existem quatro possíveis valores de classe, quatro conjuntos de dados novos são criados a partir do conjunto de dados original. Embora todos os conjuntos tenham os mesmos exemplos, a diferença está no modo como esses exemplos são classificados. Em cada conjunto novo, uma das classes é a classe positiva e as outras formam a classe negativa. Somente os exemplos 1 e 4 da Tabela A.2 são classificadas como “AM”, por isso esses exemplos são classificados como “+” na “Base AM”, enquanto que os demais são classificados como “-”.
Tabela A.3 mostra o resultado após a aplicação do método da decomposi- ção dos rótulos. Perceba que a transformação resultou em diversos exemplos iguais com classe distinta.
A.5. CLASSIFICAÇÃO MULTIRRÓTULO 143
Tabela A.2: Transformação dos exemplos multirrótulo baseada no método de
classificação binária dos rótulos.
Base AM Base BD Base LP Base RE
Inst. Classe Inst. Classe Inst. Classe Inst. Classe
1 + 1 + 1 - 1 -
2 - 2 - 2 + 2 -
3 - 3 - 3 - 3 +
4 + 4 - 4 + 4 +
Tabela A.3: Transformação dos exemplos multirrótulo baseada no método de
decomposição dos rótulos.
Instância Classe 1 AM 1 BD 2 LP 3 RE 4 AM 4 LP 4 RE
eliminação das instâncias multirrótulo. No problema ilustrado, houve uma eliminação significativa de 50% das instâncias originais.
Tabela A.4: Transformação dos exemplos multirrótulo baseada no método de
eliminação dos exemplos multirrótulo.
Instância Classe
2 LP
3 RE
Avaliação de uma classificação multirrótulo
O desempenho preditivo de um modelo de AM para problemas de classifi- cação multirrótulo deve ser avaliado a partir de métricas específicas, já que o classificador pode indicar corretamente apenas um subconjunto das classes verdadeiras para um dado exemplo multirrótulo.
Seja X um conjunto de dados multirrótulo composto por t exemplos mul- tirrótulo (xi,yi), com i = 1,2,...,t e yi ⊆ K, onde K={k1,...,kq} é o conjunto de
possíveis classes. Seja ainda ˆf um classificador multirrótulo e zi = ˆf (xi) um
vetor binário com c elementos que representa o conjunto de classes preditas por f para o exemplo xi. Para avaliar a qualidade da classificação, pode ser
A.4. HammingLoss( ˆf , X) = 1 n n X 1 a(yi, zi) k (A.4)
O valor a(yi, zi) representa a distância de Hamming entre os vetores yi; e
zi. Essa distância corresponde à operação “OU Exclusivo” da lógica booleana.
Quanto menor o valor da medida HammingLoss, melhor é a classificação. A classificação perfeita ocorre quando o valor dessa medida é igual a zero.