Em Zitzler et al. [132], os algoritmos evolucionários multi-objetivos têm, além dos objetivos propostos no problema, mais outros três objetivos: a) encon- trar o seu conjunto de soluções não dominadas o mais próximo possível da Fronteira de Pareto; b) possuir soluções uniformemente espaçadas ao longo da fronteira; e c) maximizar pontos nos extremos da fronteira não dominada para cada objetivo. De forma semelhante, Deb [32] enfatiza como meta para os MOEAs apenas os itens (a) e (b). Independente do item a ser empregado, quando deseja-se comparar MOEAs ou medir sua eficiência em resolver os problemas de otimização, uma prática freqüente em muitos estudos é apre- sentar os resultados em gráficos bi ou tridimensionais, onde observa-se com facilidade o comportamento e talvez até mesmo o desempenho dos algoritmos em questão. Não há dúvidas que se o resultado visual for de alguma forma, quantificado e confirmado, há suporte científico para distinguir qual a melhor opção. No entanto, se o problema de otimização possuir vários objetivos a apresentação dos resultados em forma gráfica torna-se mais complicada.
Com a intenção de investigar desempenho de algoritmos, pesquisadores como Czyzak [24], Deb [32], Hansen e Jaszkiewicz [51], Schott [104], Veld- huizen [121], Zitzler [131] e Zitzler et al. [132] apresentaram trabalhos rele- vantes para construção de métricas para MOEAs. Algumas delas estão des- critas nesta seção. Mas, antes de apresentá-las, alguns conceitos importantes devem ser introduzidos.
Rnn e B ⊂ Rnn de dois MOEAs quaisquer, sendo n
numa dimensão genérica.
Agora, considere o operador Υ represente uma função que retorne o subcon- junto de pontos não dominados de um conjunto “.” (a definição formal de Υ é apresentada na Subseção 3.2.1). De acordo com Hansen e Jaszkiewicz [51], o conjunto solução A pode ser declarado melhor que B em três níveis: a) A ≺f B (A é fracamente melhor que B); b) A ≺F B (A é fortemente
melhor que B); e c) A ≺C B (A é completamente melhor que B). Abaixo,
encontram-se as expressões que definem essas conclusões sobre A e B, e na Fig. 2.2 encontram-se os exemplos gráficos.
A≺f B ⇔ Υ(A∪ B) = A, A 6= B (2.9) A ≺F B ⇔ Υ(A∪ B) = A, B \ Υ(A∪ B) 6= ∅ (2.10) A≺C B ⇔ Υ(A∪ B) = A, B ∩ Υ(A∪ B) = ∅ (2.11) ✲ f1 ✻ f2 • • • • • • ◦ ◦ ◦ ◦ ◦ ✲ f1 ✻ f2 • • • • • • ◦ ◦ ◦ ◦∗ ◦ ✲ f1 ✻ f2 • • • • • • ◦ ◦∗ ◦∗ ◦∗ ◦∗
Fig. 2.2: Relação de desempenho entre os conjuntos de solução A(•) e B(◦). No primeiro caso, A ≺C B. Na seqüencia, A ≺F B e A ≺f B. O símbolo
∗ representa ponto comum em A e B. Nota-se claramente que se A ≺C
B⇒ A ≺F B∧ A ≺f B.
As métricas para comparar os resultados de algoritmos multi-objetivos podem não estar em sintonia com os conceitos apresentados em (2.9), (2.10) e (2.11). Por isso dois critérios de compatibilidade foram propostos no mesmo estudo.
Definição 2 Compatível fracamente: uma métrica de comparação é fraca- mente compatível com a relação de desempenho ≺i, i ∈ {f, F, C} se para
cada par de conjuntos não dominados A e B, tal que A ≺i B, a métrica
Definição 3 Compatível: uma métrica de comparação é compatível com a relação de desempenho ≺i, i ∈ {f, F, C} se para cada par de conjuntos não
dominados A e B, tal que A ≺i B, a métrica avalia A melhor que B.
As métricas apresentadas a seguir são avaliadas quanto à compatibili- dade com ≺C, ≺F e ≺f, quanto a utilizarem mecanismos para classificar as
soluções, quanto à necessidade de comparação com conjuntos Pareto e quanto ao custo computacional. O estudo destas métricas está suportado princi- palmente pelo livro de Deb [32] e pela tese de doutorado de Knowles [72]. Informações complementares podem ser obtidas nas referências originais. Taxa de Erro: Com a finalidade de contabilizar a proporção de pontos eficientes, Veldhuizen [121] elaborou a métrica TE (Taxa de Erro)2
que é baseada no conhecimento prévio dos pontos eficientes Y∗ como mostrado na
equação abaixo.
T E = P|A|
i=1ei
| A | , (2.12)
sendo | A | o número de soluções de A, e contador de erros ei é tal que:
ei = 1, se ei ∈ A \ Y∗;
ei = 0, caso contrário. (2.13)
Para concluir se um ponto pertence ou não a Y∗, definiu-se uma distância
Euclideana mínima com relação a qualquer um dos elementos pertencentes ao conjunto referência εT E. Em outras palavras, εT E representa a precisão
da métrica TE medida em termos de distância Euclideana.
TE é uma métrica simples de implementar, com poucos parâmetros e é simétrica, ou seja, (1 − ER) contabiliza o número de pontos pertencentes a Y∗. Como desvantagens, têm-se: a) o custo computacional associado à
comparação de proximidade com ponto eficiente em Y∗; b) não mede uni-
formidade espacial das soluções em A; c) penaliza conjuntos soluções com muitos pontos em Y∗, se também existirem muitos pontos fora; e d) a métrica
é fracamente compatível com ≺C.
Importante observar que a métrica TE foi desenvolvida para ser aplicada no espaço dos objetivos. Analogamente, ela pode medir a proximidade do conjuntos solução encontrado em relação ao conjunto solução referência, no espaço de busca.
2
Métrica C: A métrica C foi proposta por Zitzler [131] para comparar dois conjuntos de soluções não dominadas A e B quanto à dominância. Formal- mente,
CA,B= | {b ∈ B | ∃a ∈ A : a b} |
| B | (2.14)
Considerando-se dois conjuntos A e B quaisquer, observa-se que não neces- sariamente CA,B =CB,A.
O custo computacional é baixo quando comparado às demais métricas desta seção, mesmo sendo preciso calcular CA,B e CB,A. Também é uma
métrica simples de implementar e de interpretar, não exigindo a classificação do conjunto solução e não necessitando da informação do conjunto Y∗. No
entanto, essa métrica é compatível apenas com ≺C e ainda ela não mede
uniformidade da distribuição das soluções.
Métrica do Espaçamento: Diferentemente da finalidade das métricas an- teriores, Schott [104] elaborou um mecanismo para medir a qualidade da distribuição dos pontos ao longo da fronteira não dominada. Considerando novamente que | A | representa o número de soluções de A, observe abaixo como o cálculo de uniformidade é feito.
S = v u u t 1 | A | |A| X i=1 (di− ¯d)2 (2.15)
O termo di é a menor distância, no espaço dos objetivos, a qualquer outro
ponto pertencente a A e ¯d é a média de todos os di calculados. Esta for-
mulação simplesmente calcula o desvio padrão das menores distâncias entre soluções. Logo, quanto menor o desvio padrão mais uniformemente estão espalhados os pontos.
Como vantagens, a métrica de Schott não depende de comparação com conjunto Pareto e não necessita classificar o conjunto A. E como desvanta- gens, a métrica não mede a proximidade com a fronteira eficiente, tem custo computacional relativamente alto e ainda não é possível definir relação de compatibilidade com ≺f, ≺F ou ≺C.
Métrica do Espalhamento : Trata-se de outra métrica destinada a medir qualidade na distribuição das soluções que foi desenvolvida por Deb et al. e descrita em [32]. Seu cálculo é mostrado a seguir.
∆ = PM m=1d e m+ P|A| i=1 | di− ¯d | PM m=1dem+| A | ¯d (2.16)
Sendo ∆ o valor da métrica, di é a distância até algum outro ponto na
vizinhança, ¯d é a média de todos os di calculados e dem é a distância entre
os pontos extremos de A e Y∗ em cada objetivo. Portanto, são investigadas
tanto a uniformidade de distribuição dos pontos quanto o quão extensa é essa distribuição na fronteira. Na implementação desta métrica, realizada neste trabalho, calculou-se di como a menor distância entre uma solução i a
qualquer outra do conjunto solução.
Uma vantagem desta métrica é a penalização de conjuntos não dominados com soluções dispersas e longe dos extremos em cada objetivo. Por outro lado, são consideradas como desvantagens: a) a necessidade de se conhecer Y∗; b) o custo com classificação tanto de A quanto de Y∗ para todos os objetivos; c) a incompatibilidade com as relações de desempenho; e d) a não medição de proximidade com a fronteira de Pareto.
Métrica do Hipervolume: Essa métrica é endereçada tanto para analisar proximidade de conjuntos solução à fronteira de Pareto quanto para quali- ficar a uniformidade da distribuição dos pontos sobre a fronteira. Cada ponto do conjunto solução A é um vértice de um hipercubo hci. O outro vértice,
tomando-se a diagonal principal, é um ponto fixo que pode ser definido como o pior valor para cada objetivo. Considerando um conjunto solução A, a união das regiões de cada hipercubo gera um hipervolume HV que é norma- lizado com um hipervolume HVR construído a partir de Y∗. Observa-se que
o índice é acrescentado para denotar o conjunto sobre o qual age a métrica do hipervolume. As equações (2.17) e (2.18) deixam claro como o cálculo do hipervolume é feito.
HVA = volume ∪|A|i=1hci
(2.17) HV RA= HVA HVY∗ (2.18) Pelas expressões acima, conclui-se que hipervolume maior significa melhor proximidade da fronteira eficiente.
A métrica do hipervolume tem custo computacional relativamente médio quando comparado às outras métricas, é de fácil implementação e interpre- tação para casos 2D e quantifica tanto dispersão quanto proximidade de Y∗.
Entretanto, a classificação das soluções e a escolha do ponto fixo pode não ser tarefa trivial. Adicionalmente, a compatibilidade da métrica do hipervolume com ≺f, ≺F ou ≺C não está clara.
Como descrito, todas as métricas apresentam vantagens e desvantagens para medir a proximidade com a fronteira de Pareto e uniformidade das
soluções. Certamente, o uso de mais de uma métrica ajudar a julgar melhor os conjuntos soluções encontrados. Para os interessados em aprofundar no estudo de métricas, sugere-se a consulta Knowles [72].