IV. İşçinin kişiliğinin korunması
1. Genel olarak
As técnicas de Simulação de Monte Carlo via Cadeias de Markov (MCCM) tiveram início no ano de 1953 a partir do artigo publicado por Nicholas Metropolis, Arianna Rosenbluth, Marshall Rosen-Bluth, Augusta Teller e Edward Teller (GEYER, 1992).
Segundo Robert e Casella (1999), desde então, essas técnicas têm sido bastante aplicadas em vários campos de domínio científico, com particular enfoque em problemas complexos multidimensionais que exigem otimização e integração dos parâmetros, tais como análise de imagens, genética, radioatividade, etc.
Na Estatística Bayesiana este método tem sido bastante usado para solucionar problemas de normalização, marginalização dos parâmetros e cálculo da esperança matemática nas distribuições a posteriori. Na estatística clássica pode ser usado para estimar parâmetros de funções densidade probabilidade complexas.
Para ilustrar a aplicação dos métodos de MCCM, em especial para problemas de otimização e integração, é dado o exemplo a seguir (NASCIMENTO, 2009).
0.0001 0.001 0.01 0.1 1 0.01 0.1 1 10 100 Dose 2.5 pctle median 97.5 pctle
58 Seja o vetor X = (X1,...,Xd), um vetor aleatório d-dimensional em Ф com a seguinte distribuição de probabilidade:
contrario caso 0 x se ) x ( cf x (2.53)Onde: C é uma constante (possivelmente desconhecida) e pretende-se calcular a esperança matemática (I) da função π (Equação β.54).
h(X)
c h
x f x dx EI
(2.54) Segundo Nascimento (2009) o valor I pode ser obtido analiticamente, porém quando o vetor aleatório é grande, a solução torna-se inviável. Para contornar o problema de alta dimensionalidade, diversas técnicas de computação intensiva têm sido usadas tais como:(i) Integração numérica (fórmula de Newton-cotes: fórmula dos trapézios e a fórmula de Simpson): difícil e imprecisa quando o valor de C for maior,
(ii) Simulação Monte Carlo: com este método nem sempre é fácil obter uma amostra da distribuição de probabilidades, principalmente quando se trata de um vetor aleatório de variáveis dependentes. Outra situação que inviabiliza a utilização do método ocorre quando se conhece apenas o núcleo da função de probabilidades, isto é a constante C é desconhecida.
(iii) A simulação MCCM surge para contornar estas e outras dificuldades. A proposta é simular
π via construção de uma Cadeia de Markov em Ф tendo π como sua única distribuição
estacionária. Os métodos MCCM garantem que após um tempo suficientemente longo de
simulação, elementos de Ф possa ser amostrados com distribuição aproximadamente igual a π (σASCIMEσTτ, β00λ).
2.5.5.1. Cadeias de Markov
Chama-se Cadeia de Markov a um processo estocástico no qual a probabilidade condicional de qualquer evento futuro [X(tk+1)=xk+1], dado qualquer evento passado [X(tk-1)=xk-1] e o estado presente [X(tk)=xk], é independente do evento passado e dependente somente do estado presente.
59 Este tipo de processo, expresso pela Equação 2.55, é denominado “sem memória”, uma vez que o passado é esquecido (KONSTANTOPOULOS, 2009).
P [X(tk+1) ≤ xk+1| X(tk) = xk, X(tk-1) = xk-1,..., X(t1)= x1, X(t0)= x0] = P [X(tk+1) ≤ xk+1| X(tk)= xk] Para t0≤ t1 ≤tk ≤tk+1 = 0,1... e toda a sequência k0, k1,..., kt-1, kt, kt+1. (2.55)
As probabilidades condicionais P [X(tk+1)=xk+1| X(tk)=xk] são denominadas probabilidades de transição e representam a probabilidade do estado X(tk+1) ser xk+1 no instante tk+1, dado que o estado X(tk) é xk no instante tk.
Denomina-se estado a um elemento pertencente à sequência (finita ou infinita) de variáveis aleatórias.
Neste contexto, seja {Xn, n ϵ Ф} uma sequência (finita ou infinita) de variáveis aleatórias, onde Ф é o subconjunto de números inteiros. Diz-se que a esta sequência tem propriedades de
Markov se: n ϵ Ф, o processo futuro (Xm, m > n, m ϵ Ф) for independente do processo passado (Xm, m < n, m ϵ Ф), tendo como condição o presente Xn.
σormalmente Ф = Z+ = {0,1,β,γ...} ou σ = {1,β,γ...} e cada elemento de Xn é denominado de estado e seu o conjunto (Ф) é denominado de espaço de estados.
Os estados podem ser classificados como discretos, quando X(t) é definido sobre um conjunto discreto ou, caso contrário, contínuos. Semelhantemente, o tempo é classificado como discreto ou contínuo.
Se para cada X(k+1)e Xk tem-se:
P [X(tk+1) ≤ xk+1| X(tk) = xk]=P [X(1) ≤ x1| X(0)= x0] (2.56) Então as probabilidades de transição são ditas estacionárias, quer dizer, não variam com o tempo. As probabilidades expressas na Equação 2.56, são ditas probabilidades de transição de passo 1. A existência de probabilidades de transição estacionárias de passo implica que para cada xk+ n e xk e ( n =0,1,2,...) tem-se (NOGUEIRA, s.d):
P [X(tk+n) ≤ xk+n| X(tk) = xk]=P [X(n) ≤ x1| X(0)= x0] (2.57) sequência 1,2..., k-1, k, k+1.
60 Para simplificação da notação, adotando xk+ n e xk de j e de i, respectivamente, pode-se definir a Equação 2.57 na forma da Equação 2.58 ( n =0,1,2,...).
Pij = P[X(k+1) = j| X(k) =i] e Pijn [X(k+n)=j |X(k)=i] (2.58)
Uma das formas de se apresentar as probablidades de passo n é através da matriz de transição expressa pela Equação 2.59.
n MM n 1 M n 0 M n M 1 n 11 n 10 n M 0 n 01 n 00 n ji P ... P P ... ... ... ... P ... P P P ... P P P (2.59)
A matriz Pij édenominada de transição de passo n. Quando n =1, a matriz é denominada apenas de matriz de transição.
É a partir dessa matriz que se infere predição a longo prazo e para tal todos seus elementos devem ser positivos. A multiplicação da matriz de transição de vários passos pelo vetor probabilidade que expressa o estado inicial resulta em vetor de equilíbrio ou matriz invariável (V), dado pela Equação (2.59). Este tipo de cadeias de Markov é denominado de cadeia homogênea, isto é para obter o estado X(t+1), dado o Xn, não depende do tempo.
V p .
v n (2.60) Onde: v = vetor inicial de estados; p = matriz de transição, n = número de passos, V = distribuição de interesse.
Ou seja, à medida que n aumenta o produto v.pn se aproxima de um determinado e especifico vetor V, dado o vetor v e a probabilidade p. O vetor V é obtido pela resolução do sistema de equações lineares obtidas através da matriz pn. Para mais detalhes, recomenda-se a leitura de Konstantopoulos (2009) e Norris (1988).
Como propriedades desejáveis, as cadeias de Markov devem ser irredutíveis, aperiódicas e não absorventes. Diz-se que uma cadeia de Markov é irredutível quando cada estado pode ser alcançado a partir de qualquer outro estado, ou seja, os estados são comunicantes. Diz-se aperiódico a um estado que não pode ser alcançado novamente de n, 2n, 3n...n, onde n>1. Por fim,
61 diz-se que um estado é absorvente quando a cadeia tem um ou mais conjuntos fechados e, uma vez nesse estado, a cadeia permanece estagnada. Quando a cadeia for irredutível e aperiódica diz-se que é ergódiga (GILKS et al., 1996).
Os principais algoritmos usados para produzir passeios aleatórios dentro do universo de valores do parâmetro incluem o algoritmo de Metropolis-Hastings e amostrador de Gibbs. A distribuição gerada pelo algoritmo é denominada de distribuição estacionária da cadeia e reflete a convergência do procedimento de MCCM. Dessa distribuição, são extraídas várias amostras e suas respectivas estatísticas usando Simulação Monte Carlo de forma a se obter descrições desejadas da distribuição do parâmetro de interesse (VOSE 2008; NASCIMENTO, 2009).