F. HÂK N YARGILAMAYI SEVK VE DARES LKES VE
8. stinabe Yolu le htiyati Tedbir Karar
Nesta se¸c˜ao, vamos reanalisar o banco de dados estudado na Se¸c˜ao 2.7, agora ajus- tando um modelo log´ıstico misto el´ıptico. Estes dados, originalmente apresentados em Larsen et al. (2000), s˜ao oriundos de um estudo com su´ınos na Dinamarca, cujo o objetivo ´e investigar a ocorrˆencia de Ascaris suum em su´ınos criados em dois tipos diferentes de chiqueiros, a saber, chiqueiros convencional e SPF (Specific Pathogen Free). O banco de dados, que consiste de 1016 su´ınos divididos em 72 chiqueiros convencionais e 36 chiquei- ros do tipo SPF, ´e apresentado na Tabela 2.12 com as informa¸c˜ao do n´umero total de su´ınos e do n´umero de su´ınos contaminados por Ascaris suum em cada chiqueiro.
Na Se¸c˜ao 2.7, sob o paradigma bayesiano, ajustamos o modelo log´ıstico considerando as distribui¸c˜oes Normal e Skew -Normal para representar o comportamento dos efeitos aleat´orios. Naquela se¸c˜ao, apesar dos crit´erios de sele¸c˜ao de modelos n˜ao apresenta- rem resultados totalmente consistentes, existem ind´ıcios de que a distribui¸c˜ao dos efeitos
aleat´orios seja assim´etrica. Nesta se¸c˜ao, a an´alise ser´a feita sob o paradigma cl´assico e ser˜ao ajustados os modelos Log´ıstico-N, Log´ıstico-T e Log´ıstico-SL ao banco de dados. Duas abordagens ser˜ao adotadas para fazermos inferˆencia no modelo Log´ıstico-T. Ini- cialmente ajustamos o modelo assumindo que o n´umero de graus de liberdade ν ´e um parˆametro a ser estimado. Em um segundo momento, utilizamos uma estrat´egia que ´e muito usada na an´alise de modelos t-Student, assumimos que ν ´e fixo e consideramos uma grade de valores de ν (aqui indo de 3 a 25 para contemplar desde f.d.p com caudas muito pesadas at´e f.d.p bem similares a da distribui¸c˜ao Normal).
Utilizamos o algoritmo EMMC-M em todos os modelos ajustados, para os quais assu- mimos 2400 itera¸c˜oes e especificamos o n´umero de r´eplicas Monte Carlo L tal que L = 50 para as itera¸c˜oes 1-400, L = 200 para as itera¸c˜oes 401-1000, L = 500 para as itera¸c˜oes 1001-1500, L = 1000 para as itera¸c˜oes 1501-1800, L = 2000 para as itera¸c˜oes 1801-2100 e L = 5000 para as itera¸c˜oes 2101-2400. Os gr´aficos das estimativas dos parˆametros de interesse versus itera¸c˜oes, sob os modelos Log´ıstico-N, Log´ıstico-T e Log´ıstico-SL, podem ser encontrados no Apˆendice G. No caso do modelo Log´ıstico-T omitimos os gr´aficos nos casos em que o parˆametro ν ´e fixado.
Na Tabela 3.21, apresentamos as estimativas dos parˆametros dos modelos e o erros padr˜ao das estimativas sob todos os modelos, exceto sob o modelo Log´ıstico-SL, para o qual houve algum erro num´erico no c´alculo da aproxima¸c˜ao para a matriz de informa¸c˜ao de Fisher observada. Apresentamos, tamb´em, as estimativas para a variˆancia dos efeitos aleat´orios e para as medidas de raz˜ao de chances M OR12 e M OR|12|. Nesta aplica¸c˜ao,
a ´unica covari´avel inclu´ıda no modelo ´e o tipo de chiqueiro, assumindo o valor 0 para chiqueiro convencional e o valor 1 para chiqueiro do tipo SPF. Por isso, calculamos a raz˜ao de chances M OR12 = exp {−β1}, a qual representa o quanto a chance relativa de
contamina¸c˜ao por Ascaris suum ´e maior nos chiqueiros do tipo convencional do que no tipo SPF. A raz˜ao de chances M OR|12|, calculada como na Proposi¸c˜ao 3.5, nos mostra o quanto a chance relativa de contamina¸c˜ao por Ascaris suum pode ser diferente em su´ınos criados em chiqueiros diferentes e do mesmo tipo, isto ´e, quantifica o impacto do chiqueiro na chance relativa de contamina¸c˜ao, independentemente do tipo convencional ou SPF. Al´em disto, na Tabela 3.21, Tν e SLν representam os modelos Log´ıstico-T e Log´ıstico-
SL com o parˆametro ν sendo estimado, enquanto T3, por exemplo, representa o modelo
Log´ıstico-T com ν fixado no valor 3. Para efeito de compara¸c˜ao, tamb´em apresentamos as estimativas obtidas para o modelo Log´ıstico-N implementado no pacote estat´ıstico “lme4” do software gratuito R, qual representamos por NR.
Da Tabela 3.21, inicialmente avaliando apenas o modelo Log´ıstico-N, observamos que as estimativas obtidas com o Algoritmo EMMC-M s˜ao pr´oximas daquelas obtidas com a implementa¸c˜ao do modelo, no software R, atrav´es de m´etodos num´ericos de integra¸c˜ao. Ao ajustarmos o modelo Log´ıstico-T, vemos que o parˆametro ν foi estimado em 2,87, indicando que os efeitos aleat´orios possuem uma distribui¸c˜ao com caudas muito mais pesadas do que a distribui¸c˜ao Normal. O mesmo ocorre sob o modelo Log´ıstico-SL, sob o qual o ν ´e estimado em 1,629. Na an´alise realizada na Se¸c˜ao 2.7, existem ind´ıcios de que a distribui¸c˜ao dos efeitos aleat´orios seja assim´etrica e, por isso, acreditamos que distribui¸c˜oes com caudas pesadas se ajustem melhor aos efeitos aleat´orios do que a distri- bui¸c˜ao Normal. Analisando as estimativas obtidas para os efeitos fixos, vemos que apesar das estimativas para β0 e β1 estarem pr´oximas sob os modelos ajustados, elas n˜ao s˜ao
Quando analisamos as estimativas para a variˆancia V (γi) dos efeitos aleat´orios, notamos
que as maiores estimativas s˜ao obtidas sob o modelo Log´ıstico-T quando ν ´e estimado ou fixado no valor ν = 3. O contr´ario ocorre para M OR|12|, quando as estimativas obtidas sob o modelo Log´ıstico-T com ν pequeno s˜ao as menores entre os modelos ajustados. As estimativas obtidas para M OR12 s˜ao similares sob todos os modelos, o que ´e esperado
uma vez que dependem apenas das estimativas de β1. Ao compararmos os resultados
obtidos nesta se¸c˜ao com aqueles obtidos na Se¸c˜ao 2.7, percebemos que as estimativas de m´axima verossimilhan¸ca obtidas para β0, β1 e V (γi) sob o modelo Log´ıstico-N se as-
semelham `as obtidas sob o enfoque bayesiano quando assumimos normalidade para os efeitos aleat´orios e distribui¸c˜oes a priori vagas para os parˆametros. Tamb´em observamos que as estimativas de m´axima verossimilhan¸ca obtidas para β0, β1 e V (γi) sob o modelo
Log´ıstico-T com ν = 5 s˜ao bem pr´oximas das m´edias a posteriori obtidas sob o Modelo 4, o qual considera a distribui¸c˜ao Skew -Normal para os efeitos aleat´orios com distribui¸c˜oes
a priori pouco informativas para os parˆametros de escala e assimetria.
Tabela 3.21: Estimativas dos parˆametros (erro padr˜ao das estimativas), da variˆancia dos efeitos aleat´orios e da raz˜ao de chances sob todos os modelos
Modelo NR N Tν T3 T5 T7 T9 β0 -2,529 -2,525 -2,395 -2,401 -2,449 -2,472 -2,485 (0,24) (0,27) (0,25) (0,23) (0,24) (0,25) (0,26) β1 -1,062 -1,063 -1,085 -1,084 -1,080 -1,072 -1,072 (0,47) (0,46) (0,43) (0,44) (0,46) (0,45) (0,45) σ2 2,197 2,182 0,868 0,904 1,274 1,486 1,625 (0,70) (0,79) (0,36) (0,50) (0,56) (0,61) ν − − 2,870 − − − − (2,46) V (γi) 2,197 2,182 2,863 2,712 2,124 2,080 2,089 M OR12 2,892 2,959 2,956 2,945 2,921 2,921 2,912 M OR|12| 4,112 4,092 3,145 3,171 3,444 3,600 3,732 Modelo T11 T13 T15 T17 T20 T25 SLν β0 -2,493 -2,500 -2,503 -2,505 -2,510 -2,513 -2,485 (0,26) (0,25) (0,26) (0,27) (0,26) (0,26) β1 -1,069 -1,067 -1,070 -1,069 -1,067 -1,066 -1,078 (0,46) (0,46) (0,46) (0,46) (0,46) (0,46) σ2 1,715 1,783 1,836 1,873 1,921 1,973 0,962 (0,60) (0,59) (0,66) (0,66) (0,66) (0,65) ν − − − − − − 1,629 V (γi) 2,096 2,108 2,119 2,122 2,134 2,144 2,492 M OR12 2,907 2,915 2,912 2,907 2,904 2,895 2,939 M OR|12| 3,759 3,832 3,845 3,925 3,959 4,007 3,678
Observa¸c˜ao: Apesar das estimativas para o modelo Log´ıstico-N obtidas pelo m´etodo que implementamos coincidirem com aquelas fornecidas pelo m´etodo implementados no
software R, se comparados `aquelas obtidas em Larsen et al. (2000), vemos que existe
muita diferen¸ca, principalmente para a variˆancia dos efeitos aleat´orios. N˜ao h´a uma justificativa para tal diferen¸ca. Suspeitamos que possa haver algum erro de transcri¸c˜ao dos dados reais ou dos resultados obtidos em Larsen et al. (2000).
Apresentamos, na Figura 73, os gr´aficos das estimativas dos efeitos fixos β0 e β1, da
variˆancia dos efeitos aleat´orios V (γi) e das medidas raz˜ao de chances mediana M OR12 e
M OR|12|. Nestes gr´aficos, para facilitar a an´alise do comportamento das estimativas, in- terligamos por linhas as estimativas obtidas sob o modelo Log´ıstico-T quando assumimos ν como conhecido. ● ● ● ● ● ● ● ● ● ● −2.52 −2.48 −2.44 −2.40 Modelo β0 Tν T3T5 T7T9T11T13T15T17T20T25N SLν ● ● ● ● ● ● ● ● ● ● −1.085 −1.080 −1.075 −1.070 −1.065 Modelo β1 Tν T3T5 T7T9T11T13T15T17T20T25N SLν ● ● ● ● ● ● ● ● ● ● 2.2 2.4 2.6 2.8 Modelo V ( γi ) Tν T3T5 T7T9T11T13T15T17T20T25N SLν ● ● ● ● ● ● ● ● ● ● 330 335 340 345 350 355 360 Modelo AIC Tν T3T5 T7T9T11T13T15T17T20T25N SLν ● ● ● ● ● ● ● ● ● ● 2.90 2.91 2.92 2.93 2.94 2.95 2.96 Modelo M O R12 Tν T3T5 T7T9T11T13T15T17T20T25N SLν ● ● ● ● ● ● ● ● ● ● 3.2 3.4 3.6 3.8 4.0 Modelo M O R12 Tν T3T5 T7T9T11T13T15T17T20T25N SLν
Figura 73: Estimativas, sob todos os modelos ajustados, dos efeitos fixos β0 e β1 e da
variˆancia V (γi) dos efeitos aleat´orios, das medidas de raz˜ao de chances mediana M OR12
e M OR|12| e do AIC, para dados de Ascaris suum.
Da Figura 73, observamos que as estimativas para β0 obtidas sob o modelo Log´ıstico-
T com ν fixado possuem um comportamento mon´otono decrescente com respeito ao valor assumido para ν. Quando assumimos que ν = 3, a estimativa obtida est´a pr´oxima daquela obtida sob o modelo Log´ıstico-T em que ν ´e estimado (ν = 2,870). A medida em que fixamos ν em valores maiores, as estimativas para β0 decrescem e se aproximam do valor
estimado sob o modelo Log´ıstico-N. Isto ´e esperado, uma vez que o modelo Log´ıstico-N pode ser visto como um caso limite do modelo Log´ıstico-T. Sob modelo Log´ıstico-SL, a estimativa para β0 assume um valor intermedi´ario entre os observados nos demais
que as estimativas possuem uma tendˆencia de comportamento mon´otono crescente com respeito ao valor de ν. Acreditamos que esse comportamento s´o n˜ao ´e perfeito devido ao erro Monte Carlo contido nas estimativas. Mais uma vez, sob modelo o Log´ıstico-SL a estimativa obtida foi um valor intermedi´ario entre os obtidos sob os modelos Log´ıstico-N e Log´ıstico-T com ν pequeno. Comportamento similar ao observado para as estimativas dos efeitos fixos ocorre para as estimativas de M OR12e M OR|12|, principalmente porque
M OR12 ´e fun¸c˜ao apenas de β1. Do gr´afico das estimativas de V (γi), observamos que
sob o modelo Log´ıstico-T, quando o parˆametro ν ´e estimado ou fixado em ν = 3, as estimativas obtidas para V (γi) s˜ao altas e bem maiores que aquela obtida sob o modelo
Log´ıstico-N. No entanto, vemos que quando fixamos ν em um valor maior ou igual a 5, as estimativas sob o Log´ıstico-T s˜ao menores do que sob o Log´ıstico-N. Da Figura 73 tamb´em notamos que, segundo o AIC, o modelo Tν ´e o melhor modelo, seguido pelos modelos T20
e T11, nesta ordem. Este resultado parece ser um pouco contradit´orio, uma vez que as
estimativas obtidas ajustando-se o modelo T3 s˜ao mais pr´oximas daquelas obtidas sob Tν
e os modelos T3, T11 e T20 tˆem o mesmo grau de complexidade. O modelo Log´ıstico-N
´e o pior modelo seguido pelo modelo T25, o que ´e esperado uma vez que as estimativas
fornecidas por ambos os modelos s˜ao pr´oximas e estes modelos tˆem grau de complexidade similar. O comportamento do AIC para os demais modelos n˜ao ´e o esperado e, por isso, tal crit´erio n˜ao parece ser muito confi´avel.
Assumindo que o modelo Log´ıstico-T com ν estimado foi o que melhor ajustou-se aos dados, com as medidas de raz˜ao de chances mediana podemos obter as seguintes interpreta¸c˜oes:
• Se estamos comparando su´ınos criados em chiqueiros de tipos diferentes, com pro- babilidade de 50%, a chance relativa de contamina¸c˜ao por Ascaris suum de su´ınos criados em chiqueiros do tipo convencional ´e maior ou igual a 2,956 vezes a chance relativa de contamina¸c˜ao de su´ınos criados em chiqueiros do tipo SPF;
• Se compararmos dois su´ınos criados em chiqueiros diferentes do mesmo tipo, seja convencional ou SPF, com probabilidade de 50%, a chance relativa de contamina¸c˜ao por Ascaris suum de um dos su´ınos ´e pelo menos 3,145 vezes a chance relativa de contamina¸c˜ao do outro su´ıno com menor risco de contamina¸c˜ao. Isto indica grande heterogeneidade em chiqueiros do mesmo tipo.