3- KAYIT DIŞI EKONOMİ VE VERGİ AFFI UYGULAMALARININ KAYIT
3.3. Kayıt Dışı Ekonominin Nedenleri
3.3.1. Kayıt Dışı Ekonominin Mali ve Ekonomik Nedenleri
De posse dos conjuntos de treinamento e validação, os parâmetros livres de cada modelo de regressão foram variados com o objetivo de se encontrar os seus valores ótimos ou subótimos. Por exemplo, para o caso do modelo RBF, para os três robôs, tomou-se um intervalo de 2 a 100 funções de base radial, em incrementos de 1 função.
Como todos os algoritmos implementam qualização vetorial, o objetivo final de cada algoritmo é particionar o task space em sub-espaços, de forma a reduzir o somatório dos erros de quantização gerado por todos os modelos lineares locais atribuídos aos respectivos sub-espaços. Como nos modelos baseados em RNAs, o principal hiperparâmetro é o número de neurônios ocultos, onde cada um destes neurônios atuam como protótipo que quantiza uma região do task space. Para se estabelecer condição de igualdade entre os modelos, definiu-se um limite superior de 100 neurônios ocultos para cada um destes modelos, estabelecendo-se portanto a relação noexemplos
nodeprotótpios ≈ 10, e percebeu-se que para nenhum dos modelos as redes degradaram. Para os outos modelos, o limite superior foi definido empiricamente tendo como critério o alcance de EQM satisfatório ou a estagnação do decaimento deste. Denotou-se por nqa quantidade de elementos do conjunto de parâmetros utilizado na seleção de modelos. Por exemplo, para o caso supracitado da rede neural RBF
nq = 100.
Para a seleção dos hiperparâmetros dos modelos e, consequentemente, dos melhores modelos de regressão, foi adotado o critério do menor valor médio do EQM obtido em relação as nr rodadas de treinamento. Para esta dissertação adotou-se nr= 10, para todas as simulações. Para um determinado parâmetro q fixo, os conjuntos de treinamento e validação são reembaralhados e submetidos ao modelo através de nr rodadas, onde uma rodada específica será denotada por n. A cada aplicação dos conjuntos de treinamento e validação, novos valores do EQM de treinamento, expressos a partir de agora por ξ, são calculados para a norma quadrática do vetor de erro entre o desejado e o estimado para as variáveis de saída (ângulo de junta). Além disso, todos os pesos e limiares associados ao melhor resultado dentre as nr rodadas para um dado modelo são armazenados para posterior seleção. Após a seleção, estes pesos e limiares serão resgatados e utilizados na fase de testes.
4.6. Seleção de Hiperparâmetros e Treinamento 79
Ao fim da fase de treinamento obteve-se uma matriz nr× nq, ou seja,
EQM(θ) = ξ11(θ) ξ12(θ) . . . ξ1nq(θ) ξ21(θ) ξ22(θ) . . . ξ2nq(θ) ... ... . . . ... ξnr1(θ) ξnr2(θ) . . . ξnrnq(θ) (4.1)
em que ξij(θ) é o EQM da i-ésima rodada para o j-ésimo valor do hiperparâmetro q, contabilizando-se através na norma quadratica o erro acumulado em todas as juntas.
Após a determinação da matriz dos erros médios quadráticos na fase de treinamento, calculam-se os vetores de média, µj(θ), e de desvio padrão σj(θ), para j = 1, . . . , nq, ou seja, médias e devios padrões sobre as colunas da matriz EQM(θ)
µj(θ) =èµ1(θ) µ2(θ) . . . µnq(θ) é (4.2) σj(θ) =èσ1(θ) σ2(θ) . . . σnq(θ) é (4.3) em que os elemento destes vetores são definido, respectivamente, pelas equações (4.4) e (4.5) µj(θ) = 1 nr nr Ø i=1 ξij(θ), j = 1, . . . , nq (4.4) σj(θ) = ö õ õ ô 1 nr nr Ø i=1 [ξij(θ) − µj(θ)]2, j = 1, . . . , nq (4.5) Após o cálculo destes vetores, os melhores parâmetros foram escolhidos ao se tomar os índices j∗ que representam os parâmetros de menor média µj(θ). De forma mais compacta tem-se
j∗ = arg min
∀j {µj(θ)}. (4.6)
Em seguida, retorna-se à matriz EQM(θ) e busca-se na coluna referenciada por
j∗ o índice i∗ da rodada de treinamento que apresentou o menor valor de ξij
∗. Este
valor particular será denotado por ξi∗j∗(θ). Os parâmetros associados a cada modelo são
guardados, através de j∗ e i∗, e utilizados posteriormente na fase testes. Por exemplo, no caso das simulações da rede RBF, j∗ e i∗ apontam para o número de neurônicos da camada oculta que foi obtido o melhor resultado, de acordo com o critério recém descrito. As próximas subseções apresentam os modelos selecionados para cada conjunto de dados, bem como os valores de ξi∗j∗(θ) que nortearam esta escolha.
A cada rodada de treinamento, novos conjunto de treinamento e validação são submetidos aos algoritmos e novos hiperparâmetros são calculados. Para cada conjunto de hiperparâmetros calculam-se os valores de ξ. Desta forma, a matriz EQM(θ) dá lugar a um vetor coluna de dimensão nr× 1:
EQM(j)(θ) =èξj1(θ) ξj2(θ) . . . ξjnr(θ)
éT
(4.7) A partir deste ponto, a seleção dos melhores parâmetros é realizada através da escolha do índice i∗, que representa a rodada de menor ξ, ou seja,
i∗ = arg m
j in {ξij(θ)}, i = 1, . . . , nr (4.8) As subseções seguintes reúnem os hiperparâmetros obtidos nesta etapa do trabalho para cada um dos manipuladores.
4.6.1 Rôbo Planar
Seguindo os procedimentos descritos nas seções anteriores, foram geradas 2016 padrões para o robô planar. Estas amostras foram subdivididas em três partes: conjunto de treinamento, validação e teste. Os conjuntos de treinamento e validação contêm 1210 e 403 amostras, respectivamente, restando 403 amostras para a fase de teste.
Para ilustrar melhor o processo de seleção de modelos e o critério adotado para tal fim, as Figuras22 e23 exibem, respectivamente, as componentes de µj(θ) e σj(θ) para as faixas de parâmetros adotadas para o algoritmo RBF. Este modelo apresentou o melhor performace e por isso seus gráficos são apresentados aqui. Gráficos similares também foram traçados para a melhor topologia dos outros modelos.
Ao observar os gráficos anteriores, pode-se notar que à medida que o número de parâmetros2dos modelos aumenta, os valores de µj(θk) tendem a decrescer. Neste momento
deve-se fazer uma análise do custo-benefício da adoção de modelos mais complexos em relação ao custo computacional necessário e a possibilidade de sobre-ajuste (overfitting). Esse processo de seleção se repete para todos os 6 modelos implementados neste trabalho. Os resultados da fase de seleção de modelos são mostrados na Tabela3. Nesta tabela são apresentados os parâmetros selecionados bem como o respectivo valor de ξi∗j∗(θ):
Na Tabela 3o número de neurônios da camada oculta dos algoritmos RBF e LMN Variaram de 2 até 100, 1 a 1, enquanto para os algoritimos SOM e K-SOM, variram de 16 até 121, em quadrados perfeitos sequenciais, visto que a rede SOM utlizada é planar. Especificamente para o K-SOM o número de neurônios vencedores variam de 16 até o
2 Note que o número de neurônios ocultos é um hiperparâmetro, cujo o aumento, aumenta o número de
4.6. Seleção de Hiperparâmetros e Treinamento 81 0 10 20 30 40 50 60 70 80 90 100 0 0.05 0.1 0.15 0.2 0.25
Número de Neurônios Ocultos
MSE Mé d io Variação do µ MSE
Figura 22 – RBF: Variações dos valores médios dos EQM de treinamento com o aumento da quantidade de neurônios ocultos
0 10 20 30 40 50 60 70 80 90 100 0 0.002 0.004 0.006 0.008 0.01 0.012 0.014
Número de Neurônios Ocultos
MSE Mé d io Variação do σ MSE
Figura 23 – RBF: Variações dos desvios padrões dos EQM de treinamento com o aumento da quantidade de neurônios ocultos
Modelos Parâmetros Selecionados ξi∗j∗(θ)
RBF γ = 18.8363 e nq= 25 9,5120E-07 LMN γ = 16.9372 e nq= 23 1,1106E-06
LWR Wcorte = 8,928E-02 2,2465E-05
LLM nq = 121, 8,5333E-04
CP nq = 121, 6.9802E-03
K-SOM nq = 529, e nqv = 100, 2,2204E-02
Tabela 3 – Robô Planar - Parâmetros selecionados para os diversos modelos de regressão que estimaram os ângulos de junta.
número de neurônios ocultos da rede SOM que quantizou o espaço na rodada corrente, visto que não se pode utlizar mais neurônios vencedores que o número de neurônios da rede SOM. Já para o algoritimo LWR, variou-se o valor de corte do W em torno da média, de acordo com a regra Wcorte = Wmédio+ 0.1K, onde K varia de -5 à +5. Quanto ao algoritimo CP, o número de neurônios variam de 2 até 50.
4.6.2 Manipulador PUMA 560
De forma análoga ao robô planar, para o conjunto de todas as juntas rotacionais do manipulador PUMA 560 são construido seis modelos de regressão, devido à abordagem MIMO. Gráficos similares aos das Figura22 e23 também foram traçados para nortear a escolha dos melhores parâmetros. Estes gráficos novamente foram úteis para visualizar os pontos nos quais os melhores parâmentros foram tomados. Eles serão omitidos nesta seção visto que a utilidade dos mesmos foi apresentada na seção anterior.
Os resultados da fase de seleção de modelos são ilustrados pela Tabela 4. Nesta tabela são apresentados os parâmetros selecionados bem como o respectivo ξi∗j∗(θ):
Modelos Parâmetros Selecionados ξi∗j∗(θ)
RBF γ = 6, 7941E − 01 e nq = 88 1,7666E-01 LMN γ = 6.8932e − 01 e nq= 100 1,9884E-01
LWR Wcorte = 0, 4333E − 02 2,2207E-01
LLM nq = 64, 2,6783E-01
CP nq = 256, 2,9048E-01
K-SOM nq = 121, qv = 4, 3,2598e-01
Tabela 4 – Manipulador PUMA 560 - Parâmetros selecionados para os diversos mode- los de regressão.
Assim como no caso dos parâmetros obtidos para o robô planar, o número de neurônios ocultos dos algoritmos RBF, LMN, variam de 1 até 100, 1 a 1, enquanto no SOM e K-SOM variam de 16 até 121, em quadrados perfeitos sequenciais. Especificamente para o K-SOM o número de neurônios vencedores variam de 16 até o número de neurônios ocultos da rodadas. Já para o algoritimo LWR, variou-se o valor de corte do W em torno