3.7. Bulgular
3.7.1. Nominal Ölçek Sorularına Ait Frekans Tabloları ve Grafikler
Nesta seção são apresentados os resultados obtidos na identificação do tanque de múl- tiplas seções quando os dados de treinamento e validação estão sujeitos à presença de ruído e 3% de outliers. Assim, durante a execução dos treinamentos das redes FWNN, são utilizados os conjuntos de dados apresentados nas Figuras4.7e4.8.
CAPÍTULO 4. METODOLOGIA E ESTUDOS DE CASO 64 a utilizada na seção anterior. Para cada combinação de algoritmo, função custo e largura de kernel foram efetuadas 15 execuções do algoritmo de treinamento. Três diferentes valores de largura de kernel (10, 0,1 e 0,01) foram avaliados, além do ajuste adaptativo da largura de kernel. O valor atribuído ao coeficiente de aprendizado η do algoritmo de retropropagação do erro foi igual a 0,001 e o número de épocas de treinamento foi estabelecido em 350 épocas.
A Figura 4.13 apresenta as respostas dos melhores modelos FWNN obtidos a partir do conjunto de dados de treinamento contendo ruído e 3% de outliers. Comparando-se os modelos FWNN-MSE e FWNN-MCC, observa-se que este último apresentou melhor desempenho. Apesar de existir uma porcentagem maior de outliers nos conjuntos de da- dos de treinamento e validação, isto não proporcionou um efeito prejudicial significativo para o modelo FWNN-MCC. Esse modelo foi encontrado pelo algoritmo de retropropa- gação do erro, utilizando largura de kernel adaptativa e com função custo definida pela maximização da correntropia. 0 100 200 300 400 500 600 700 0 10 20 30 40 50 amostras nível do tanque (cm) Saída desejada FWNN−MCC FWNN−MSE
Figura 4.13: Validação dos modelos FWNN-MSE e FWNN-MCC (kernel adaptativo) do tanque de múltiplas seções - Resultado de treinamento com ruído e 3% de outliers.
A variação da largura de kernel adaptativo durante a execução do algoritmo de trei- namento é ilustrada na Figura4.14. A largura de kernel da correntropia é mais uma vez inicializada com o valor unitário, apresentando um acréscimo em seu valor durante as primeiras épocas do algoritmo de treinamento. Em seguida o valor deste parâmetro passa a oscilar, mas com uma tendência de redução, até estabilizar-se em um valor próximo a 0,25. A curva apresentada na Figura 4.14 corresponde ao ajuste realizado na largura
CAPÍTULO 4. METODOLOGIA E ESTUDOS DE CASO 65 de kernel em cada época do algoritmo de treinamento para se obter o melhor modelo FWNN-MCC, cuja resposta foi apresentada na Figura4.13.
0 50 100 150 200 250 300 350 0 0.5 1 1.5 2 2.5 épocas largura do kernel
Figura 4.14: Variação da largura de kernel adaptativo - Tanque de múltiplas seções - Resultado de treinamento com ruído e 3% de outliers.
As curvas de aprendizado de todas as configurações de modelo avaliadas neste estudo de caso são ilustradas na Figura4.15.
0 50 100 150 200 250 300 1 2 3 4 5 6 7 amostras MSE de treinamento σ = 0.01 σ = 0.1 σ = 10 σ adaptativo FWNN−MSE
Figura 4.15: Curvas de aprendizado dos modelos FWNN - Tanque de múltiplas seções - Resultado de treinamento com ruído e 3% de outliers.
CAPÍTULO 4. METODOLOGIA E ESTUDOS DE CASO 66 épocas vão sendo executadas pelo algoritmo de treinamento. Os valores de MSE foram calculados a partir dos dados de treinamento em presença de ruído e 3% de outliers. Devido à escala utilizada nesta figura, algumas curvas são sobrepostas. Para facilitar a análise em relação às curvas de aprendizado, apenas uma parte da Figura4.15é ampliada e apresentada em destaque na Figura4.16.
10 20 30 40 50 60 70 80 90 0 0.5 1 1.5 2 amostras MSE de treinamento σ = 0.01 σ = 0.1 σ = 10 σ adaptativo FWNN−MSE
Figura 4.16: Curvas de aprendizado ampliadas dos modelos FWNN - Tanque de múltiplas seções - Resultado de treinamento com ruído e 3% de outliers.
A Figura 4.16 demonstra que para os valores fixos de largura de kernel (σ = 0,01, (σ = 0.1 e σ = 10), as taxas de convergência para a obtenção de modelos FWNN-MCC são bastante próximas. Entretanto, quando o valor de σ é fixo em 10, a curva de treina- mento aproxima-se mais à curva de treinamento do modelo FWNN-MSE. Como pode ser notado, a curva de treinamento quando σ = 10 atinge valores menores de MSE do que as curvas geradas pelos demais valores fixos de largura de kernel.
Em relação à curva de treinamento do modelo encontrado a partir da utilização da largura de kernel adaptativa, pode-se observar que, devido à inicialização aleatória dos parâmetros da rede, o valor inicial do erro médio quadrático é mais elevado do que para as outras configurações de modelos. Apesar disto, a curva de treinamento do modelo FWNN-MCC com largura de kernel adaptativa inicia-se com um rápido decaimento e, logo em seguida, começa a oscilar até que, por volta da centésima época, seu comporta- mento torne-se praticamente estável.
CAPÍTULO 4. METODOLOGIA E ESTUDOS DE CASO 67
A Tabela 4.2 apresenta um comparativo de desempenho entre os modelos FWNN
encontrados quando os dados experimentais aplicados na identificação do tanque de múl- tiplas seções estão sujeitos a presença de ruído e 3% de outliers. Novamente, são apre- sentados para cada configuração de modelo, a média do MSE de validação, a variância do MSE de validação e o melhor MSE encontrados em 15 execuções do algoritmo de retropropagação do erro.
Tabela 4.2: Comparação de desempenho dos modelos - Tanque de múltiplas seções - Resultado de treinamento com ruído e 3% de outliers.
Modelo e Treinamento
Largura Média do MSE Variância do MSE Melhor MSE
de kernel de Validação de Validação de Validação
FWNN-MSE – 2,001 ×10−3 1, 719 × 10−7 1,386 ×10−3
FWNN-MCC 0,01 5,399 ×10−2 1,171 ×10−4 2,971 ×10−2
FWNN-MCC 0,1 5,873 ×10−3 3,842 ×10−5 3,899 ×10−3
FWNN-MCC 10 3,125 ×10−3 1,613 ×10−6 2,426 ×10−3
FWNN-MCC Adaptativo 6, 663 × 10−4 7,157 ×10−6 5, 489 × 10−4
De acordo com a Tabela4.1, os modelos obtidos a partir da largura fixa de kernel igual a 0,01 não apresentaram bom desempenho. Novamente, o modelo de melhor desempenho corresponde ao modelo FWNN-MCC com largura de kernel adaptativa. Isto pode ser notado tanto pela sua média de MSE de validação quanto pelo melhor MSE de validação. O modelo FWNN-MSE possui desempenho pouco melhor que o desempenho apresentado pelo modelo FWNN-MCC encontrado por meio da utilização da largura fixa de kernel igual a 10.