Kayıt Dışı Ekonominin Mali ve Ekonomik Nedenleri

3- KAYIT DIŞI EKONOMİ VE VERGİ AFFI UYGULAMALARININ KAYIT

3.3. Kayıt Dışı Ekonominin Nedenleri

3.3.1. Kayıt Dışı Ekonominin Mali ve Ekonomik Nedenleri

De posse dos conjuntos de treinamento e validação, os parâmetros livres de cada modelo de regressão foram variados com o objetivo de se encontrar os seus valores ótimos ou subótimos. Por exemplo, para o caso do modelo RBF, para os três robôs, tomou-se um intervalo de 2 a 100 funções de base radial, em incrementos de 1 função.

Como todos os algoritmos implementam qualização vetorial, o objetivo final de cada algoritmo é particionar o task space em sub-espaços, de forma a reduzir o somatório dos erros de quantização gerado por todos os modelos lineares locais atribuídos aos respectivos sub-espaços. Como nos modelos baseados em RNAs, o principal hiperparâmetro é o número de neurônios ocultos, onde cada um destes neurônios atuam como protótipo que quantiza uma região do task space. Para se estabelecer condição de igualdade entre os modelos, definiu-se um limite superior de 100 neurônios ocultos para cada um destes modelos, estabelecendo-se portanto a relação noexemplos

nodeprotótpios ≈ 10, e percebeu-se que para nenhum dos modelos as redes degradaram. Para os outos modelos, o limite superior foi definido empiricamente tendo como critério o alcance de EQM satisfatório ou a estagnação do decaimento deste. Denotou-se por nqa quantidade de elementos do conjunto de parâmetros utilizado na seleção de modelos. Por exemplo, para o caso supracitado da rede neural RBF

nq = 100.

Para a seleção dos hiperparâmetros dos modelos e, consequentemente, dos melhores modelos de regressão, foi adotado o critério do menor valor médio do EQM obtido em relação as nr rodadas de treinamento. Para esta dissertação adotou-se nr= 10, para todas as simulações. Para um determinado parâmetro q fixo, os conjuntos de treinamento e validação são reembaralhados e submetidos ao modelo através de nr rodadas, onde uma rodada específica será denotada por n. A cada aplicação dos conjuntos de treinamento e validação, novos valores do EQM de treinamento, expressos a partir de agora por ξ, são calculados para a norma quadrática do vetor de erro entre o desejado e o estimado para as variáveis de saída (ângulo de junta). Além disso, todos os pesos e limiares associados ao melhor resultado dentre as nr rodadas para um dado modelo são armazenados para posterior seleção. Após a seleção, estes pesos e limiares serão resgatados e utilizados na fase de testes.

4.6. Seleção de Hiperparâmetros e Treinamento 79

Ao fim da fase de treinamento obteve-se uma matriz nr× nq, ou seja,

EQM(θ) =         ξ11(θ) ξ12(θ) . . . ξ1nq(θ) ξ21(θ) ξ22(θ) . . . ξ2nq(θ) ... ... . . . ... ξnr1(θ) ξnr2(θ) . . . ξnrnq(θ)         (4.1)

em que ξij(θ) é o EQM da i-ésima rodada para o j-ésimo valor do hiperparâmetro q, contabilizando-se através na norma quadratica o erro acumulado em todas as juntas.

Após a determinação da matriz dos erros médios quadráticos na fase de treinamento, calculam-se os vetores de média, µ_j(θ), e de desvio padrão σj(θ), para j = 1, . . . , nq, ou seja, médias e devios padrões sobre as colunas da matriz EQM(θ)

µ_j(θ) =èµ1(θ) µ2(θ) . . . µnq(θ) é (4.2) σj(θ) =èσ1(θ) σ2(θ) . . . σnq(θ) é (4.3) em que os elemento destes vetores são definido, respectivamente, pelas equações (4.4) e (4.5) µj(θ) = 1 nr nr Ø i=1 ξij(θ), j = 1, . . . , nq (4.4) σj(θ) = ö õ õ ô 1 nr nr Ø i=1 [ξij_{(θ) − µ}j(θ)]2, j = 1, . . . , nq (4.5) Após o cálculo destes vetores, os melhores parâmetros foram escolhidos ao se tomar os índices j∗ _{que representam os parâmetros de menor média µj(θ). De forma mais} compacta tem-se

j∗ = arg min

∀j {µj(θ)}. (4.6)

Em seguida, retorna-se à matriz EQM(θ) e busca-se na coluna referenciada por

j∗ _{o índice i}∗ _{da rodada de treinamento que apresentou o menor valor de ξij}

∗. Este

valor particular será denotado por ξi∗_j∗(θ). Os parâmetros associados a cada modelo são

guardados, através de j∗ _{e i}∗_{, e utilizados posteriormente na fase testes. Por exemplo,} no caso das simulações da rede RBF, j∗ _{e i}∗ _{apontam para o número de neurônicos da} camada oculta que foi obtido o melhor resultado, de acordo com o critério recém descrito. As próximas subseções apresentam os modelos selecionados para cada conjunto de dados, bem como os valores de ξi∗_j∗(θ) que nortearam esta escolha.

A cada rodada de treinamento, novos conjunto de treinamento e validação são submetidos aos algoritmos e novos hiperparâmetros são calculados. Para cada conjunto de hiperparâmetros calculam-se os valores de ξ. Desta forma, a matriz EQM(θ) dá lugar a um vetor coluna de dimensão nr_{× 1:}

EQM_(j)(θ) =èξj1(θ) ξj2(θ) . . . ξjnr(θ)

éT

(4.7) A partir deste ponto, a seleção dos melhores parâmetros é realizada através da escolha do índice i∗_{, que representa a rodada de menor ξ, ou seja,}

i∗ = arg m

j in {ξij(θ)}, i = 1, . . . , nr (4.8) As subseções seguintes reúnem os hiperparâmetros obtidos nesta etapa do trabalho para cada um dos manipuladores.

4.6.1 Rôbo Planar

Seguindo os procedimentos descritos nas seções anteriores, foram geradas 2016 padrões para o robô planar. Estas amostras foram subdivididas em três partes: conjunto de treinamento, validação e teste. Os conjuntos de treinamento e validação contêm 1210 e 403 amostras, respectivamente, restando 403 amostras para a fase de teste.

Para ilustrar melhor o processo de seleção de modelos e o critério adotado para tal fim, as Figuras22 e23 exibem, respectivamente, as componentes de µj(θ) e σj(θ) para as faixas de parâmetros adotadas para o algoritmo RBF. Este modelo apresentou o melhor performace e por isso seus gráficos são apresentados aqui. Gráficos similares também foram traçados para a melhor topologia dos outros modelos.

Ao observar os gráficos anteriores, pode-se notar que à medida que o número de parâmetros2_{dos modelos aumenta, os valores de µj(θk) tendem a decrescer. Neste momento}

deve-se fazer uma análise do custo-benefício da adoção de modelos mais complexos em relação ao custo computacional necessário e a possibilidade de sobre-ajuste (overfitting). Esse processo de seleção se repete para todos os 6 modelos implementados neste trabalho. Os resultados da fase de seleção de modelos são mostrados na Tabela3. Nesta tabela são apresentados os parâmetros selecionados bem como o respectivo valor de ξi∗_j∗(θ):

Na Tabela 3o número de neurônios da camada oculta dos algoritmos RBF e LMN Variaram de 2 até 100, 1 a 1, enquanto para os algoritimos SOM e K-SOM, variram de 16 até 121, em quadrados perfeitos sequenciais, visto que a rede SOM utlizada é planar. Especificamente para o K-SOM o número de neurônios vencedores variam de 16 até o

2 _{Note que o número de neurônios ocultos é um hiperparâmetro, cujo o aumento, aumenta o número de}

4.6. Seleção de Hiperparâmetros e Treinamento 81 0 10 20 30 40 50 60 70 80 90 100 0 0.05 0.1 0.15 0.2 0.25

Número de Neurônios Ocultos

MSE Mé d io Variação do µ MSE

Figura 22 – RBF: Variações dos valores médios dos EQM de treinamento com o aumento da quantidade de neurônios ocultos

0 10 20 30 40 50 60 70 80 90 100 0 0.002 0.004 0.006 0.008 0.01 0.012 0.014

Número de Neurônios Ocultos

MSE Mé d io Variação do σ MSE

Figura 23 – RBF: Variações dos desvios padrões dos EQM de treinamento com o aumento da quantidade de neurônios ocultos

Modelos Parâmetros Selecionados ξi∗_j∗(θ)

RBF γ = 18.8363 e nq= 25 9,5120E-07 LMN γ = 16.9372 e nq= 23 1,1106E-06

LWR Wcorte = 8,928E-02 2,2465E-05

LLM nq = 121, 8,5333E-04

CP nq = 121, 6.9802E-03

K-SOM nq = 529, e nqv = 100, 2,2204E-02

Tabela 3 – Robô Planar - Parâmetros selecionados para os diversos modelos de regressão que estimaram os ângulos de junta.

número de neurônios ocultos da rede SOM que quantizou o espaço na rodada corrente, visto que não se pode utlizar mais neurônios vencedores que o número de neurônios da rede SOM. Já para o algoritimo LWR, variou-se o valor de corte do W em torno da média, de acordo com a regra Wcorte = Wmédio+ 0.1K, onde K varia de -5 à +5. Quanto ao algoritimo CP, o número de neurônios variam de 2 até 50.

4.6.2 Manipulador PUMA 560

De forma análoga ao robô planar, para o conjunto de todas as juntas rotacionais do manipulador PUMA 560 são construido seis modelos de regressão, devido à abordagem MIMO. Gráficos similares aos das Figura22 e23 também foram traçados para nortear a escolha dos melhores parâmetros. Estes gráficos novamente foram úteis para visualizar os pontos nos quais os melhores parâmentros foram tomados. Eles serão omitidos nesta seção visto que a utilidade dos mesmos foi apresentada na seção anterior.

Os resultados da fase de seleção de modelos são ilustrados pela Tabela 4. Nesta tabela são apresentados os parâmetros selecionados bem como o respectivo ξi∗_j∗(θ):

Modelos Parâmetros Selecionados ξi∗_j∗(θ)

RBF _{γ = 6, 7941E − 01 e n}q = 88 1,7666E-01 LMN γ = 6.8932e − 01 e nq= 100 1,9884E-01

LWR Wcorte = 0, 4333E − 02 2,2207E-01

LLM nq = 64, 2,6783E-01

CP nq = 256, 2,9048E-01

K-SOM nq = 121, qv = 4, 3,2598e-01

Tabela 4 – Manipulador PUMA 560 - Parâmetros selecionados para os diversos mode- los de regressão.

Assim como no caso dos parâmetros obtidos para o robô planar, o número de neurônios ocultos dos algoritmos RBF, LMN, variam de 1 até 100, 1 a 1, enquanto no SOM e K-SOM variam de 16 até 121, em quadrados perfeitos sequenciais. Especificamente para o K-SOM o número de neurônios vencedores variam de 16 até o número de neurônios ocultos da rodadas. Já para o algoritimo LWR, variou-se o valor de corte do W em torno

Belgede T.C. TEKİRDAĞ NAMIK KEMAL ÜNİVERSİTESİ SOSYAL BİLİMLER ENSTİTÜSÜ MALİYE ANABİLİM DALI YÜKSEK LİSANS TEZİ (sayfa 102-105)