2. LAGİNA
4.2 Yerleştirme Yuvaları
4.2.2 Kurt Ağzı
4.2.2.2 Karia İonia Tipi
bootstrap, denotado por D∗
b = (n, y∗b, δ ∗
b, X), em que y∗b = (y∗1, . . . , yn∗). Cabe destacar,
que a proposta para gera¸c˜ao das amostras bootstrap aqui apresentada para o modelo em estudo ´e pioneira em modelos de fra¸c˜ao de cura, podendo ser generalizada para outros modelos dessa classe.
As corre¸c˜oes bootstrap e Bartlett bootstrap s˜ao realizadas conforme os passos dos algoritmos apresentados nas Sub-se¸c˜oes 3.2.1 e 3.2.2. A amostra bootstrap gerada, D∗
b,
´e aplicada nos passos correspondentes nos algoritmos, sendo o modelo dado em (2.11).
3.3
Testes de hip´oteses em modelos de sobrevivˆen-
cia
As inferˆencias baseadas nas estat´ısticas de teste apresentadas na Se¸c˜ao 3.1 depen- dem de resultados assint´oticos, os quais est˜ao relacionados `a teoria assint´otica dos es- timadores de m´axima verossimilhan¸ca. A seguir s˜ao apresentadas algumas referˆencias que evidenciam a validade dos resultados para os modelos de sobrevivˆencia.
Um dos primeiros trabalhos a analisar com detalhes as propriedades assint´oticas do estimador de m´axima verossimilhan¸ca do modelo com fra¸c˜ao de cura, com distribui¸c˜ao exponencial associada aos tempos de falha, foi Ghitany e Maller (1992). Posterior- mente, Maller e Zhou (1996) apresentam demonstra¸c˜oes da normalidade assint´otica do estimador de m´axima verossimilhan¸ca e resultados para testes em grandes amostras, considerando o modelo param´etrico exponencial com covari´aveis, censura (n˜ao infor- mativa) e fra¸c˜ao de cura. Conforme Maller e Zhou (1996), o desenvolvimento te´orico para outras distribui¸c˜oes se d´a de forma an´aloga ao modelo exponencial.
No contexto dos modelos Weibull com fra¸c˜ao de cura, segundo Paes (2007) as propriedades do estimador de m´axima verossimilhan¸ca podem ser vistas como uma extens˜ao da teoria desenvolvida para modelos lineares generalizados (MCCULLAGH; NELDER, 1989). Ainda Paes (2007) descreve com detalhes os resultados assint´oticos para modelos Weibull com fra¸c˜ao de cura apresentados por Ghitany, Maller e Zhou (1994).
De acordo com Lawless (2003) os resultados assint´oticos para os testes de hip´oteses se aplicam a casos gerais, como de amostras censuradas e com covari´aveis associadas. Conforme Maller e Zhou (1996), al´em das condi¸c˜oes de regularidade usuais, ver Severini (2000), Casella e Berger (2002), uma condi¸c˜ao adicional ´e que o percentual de censura da amostra n˜ao seja t˜ao alto, para assim garantir a validade dos resultados assint´oticos.
Cap´ıtulo 4
Resultados num´ericos
Para avaliar os desempenhos em pequenas amostras dos testes raz˜ao de verossimi- lhan¸cas (LR), gradiente (G), escore (S) e Wald (W ), as vers˜oes corrigidas por bootstrap, respectivamente, LRb, Gb, Sb e Wb e do teste baseado na raz˜ao de verossimilhan¸cas cor-
rigida via Bartlett bootstrap (LRB), foi realizado um estudo de simula¸c˜ao. O n´umero
de r´eplicas de Monte Carlo foi 5000 e para as corre¸c˜oes bootstrap foram considera- das B = 1000 reamostras bootstrap. Os tamanhos amostrais utilizados foram iguais a n = 30, 50, 100. Toda a implementa¸c˜ao computacional foi desenvolvida na linguagem R (R Development Core Team, 2014), sendo que para a estima¸c˜ao dos parˆametros do modelo foi utilizada a fun¸c˜ao optim, considerando o m´etodo BFGS com primeiras deri- vadas anal´ıticas. Para os testes Wald e escore foi considerada a informa¸c˜ao observada, j´a que a informa¸c˜ao de Fisher nesse modelo ´e imposs´ıvel de ser obtida, conforme j´a descrito no Cap´ıtulo 2. A matriz de informa¸c˜ao observada foi obtida atrav´es da aproxi- ma¸c˜oes num´ericas no R, fornecida pelo optim. Ainda, a parametriza¸c˜ao utilizada no R se d´a em termos do logar´ıtmo de T , dessa forma utiliza-se a distribui¸c˜ao valor extremo apresentada em 2.1.3 (CARVALHO et al., 2011).
Da mesma forma que em Carneiro (2012), a matriz das vari´aveis regressoras ´e gerada a partir de distribui¸c˜oes de Bernoulli(pb), com pb em torno de 0,5, e considerada
constante durante todas as r´eplicas de Monte Carlo. Nas simula¸c˜oes, a fim de avaliar o impacto do aumento do n´umero de parˆametros de perturba¸c˜ao, foram consideradas quatro (p = 4) e seis (p = 6) covari´aveis. Para p = 4, foram geradas para cada i = 1, 2, . . . , n, xi1, xi2, xi3 e xi4 de forma independente, de distribui¸c˜oes de Bernoulli, com
probabilidades de sucesso (pb) 0,49, 0,5, 0,51 e 0,52, respectivamente. Analogamente,
para p = 6, foram geradas xi1, xi2, xi3, xi4, xi5 e xi6 de distribui¸c˜oes de Bernoulli, com
probabilidades de sucesso (pb) 0,48, 0,49, 0,5, 0,51, 0,52 e 0,53, respectivamente.
Os valores de Mi s˜ao gerados da distribui¸c˜ao Poisson com m´edia θi = exp(x⊤i β).
23 Os valores de β s˜ao fixados de tal forma que, combinados com a matriz das vari´aveis regressoras, a m´edia da fra¸c˜ao de cura seja em torno de 10% e 30%. Para os indiv´ıduos n˜ao imunes (Mi > 0) foi gerada uma amostra de tamanho mi (zik; k = 1, . . . mi) da
distribui¸c˜ao Weibull(a,b), em que a = 2 e b = 4. Os tempos de falha s˜ao obtidos por ti = min{zik; k = 1, . . . mi}. As censuras s˜ao geradas aleatoriamente de uma
distribui¸c˜ao uniforme, U (0,u), sendo que o valor de u afeta inversamente a propor¸c˜ao de censuras da amostra. Ap´os gerada a censura ci, os tempos observados s˜ao dados por
yi = min{ti, ci}. A cada tempo observado ´e associado o indicador de falha, δi = 1 se
ti ≤ ci e δi = 0 se ti > ci . Quando Mi = 0, o tempo observado recebe max{ci, . . . , cn},
(valor suficientemente grande), e o indicador de falhas recebe zero. Os valores fixados nas simula¸c˜oes para β e u s˜ao descritos no Apˆendice B.
Assim como Fonseca, Valen¸ca e Bolfarine (2013) e Carneiro (2012), para definir o percentual de censuras entre os curados e a propor¸c˜ao de censuras com rela¸c˜ao ao total de indiv´ıduos suscet´ıveis ao evento, consideramos os seguintes eventos: A = curados, Ac = n˜ao curados, C = censurados ou imunes. A partir desses eventos definimos a
propor¸c˜ao de censuras dentre os n˜ao curados, denotada por pc1, dada a seguir:
pc1 =
(C ∩ Ac)
#Ac ,
em que # denota a quantidade de indiv´ıduos no conjunto. A propor¸c˜ao de censurados ou imunes ´e dada por
pc2 =
#C #(A ∪ Ac).
Em aplica¸c˜oes a dados reais a quantidade pc2 ´e vista como o percentual de censuras
da popula¸c˜ao. Ainda em Fonseca, Valen¸ca e Bolfarine (2013) ´e apresentada uma rela¸c˜ao entre pc1 e pc2, que ´e dada por
pc2 = pc1(1 − p0) + p0,
em que p0 representa a propor¸c˜ao de imunes.
Os resultados para a avalia¸c˜ao da taxa de rejei¸c˜ao nula dos testes est˜ao apresentados nas Tabelas 4.1 a 4.6. Foi considerado o modelo de tempo de promo¸c˜ao Weibull, n´ıveis nominais iguais a 1%, 5% e 10%. As trˆes combina¸c˜oes de p0 e pc1 usadas para as simu-
la¸c˜oes implicam propor¸c˜oes de censuras na popula¸c˜ao (pc2) iguais a 19%, 37%, 51%.
Para as Tabelas 4.1 e 4.4, a propor¸c˜ao de imunes ou fra¸c˜ao de curados fixada foi de p0 = 10% e o percentual de censura dentre os n˜ao curados pc1 = 10%, o que implica
24
Tabela 4.1: Taxas de rejei¸c˜ao nula (%) para H0 : β1 = . . . = βq = 0, com p = 4, 10%
de fra¸c˜ao de cura e 10% censura, (pc2 = 19%), considerando os diferentes tamanhos
amostrais e n´ıveis nominais.
1% 5% 10% q Estat´ıstica❅❅ ❅n 30 50 100 30 50 100 30 50 100 1 LR 1,84 1,58 1,30 7,20 7,02 6,16 13,70 12,88 11,20 G 1,90 1,84 1,30 7,28 7,28 6,18 13,50 13,26 11,26 S 2,04 1,18 1,34 7,56 6,36 6,12 13,76 12,28 11,30 W 1,56 1,12 1,28 6,92 6,16 6,06 13,30 12,18 11,14 LRB 0,86 0,90 1,00 4,42 5,08 5,40 9,10 10,04 9,86 LRb 0,94 1,02 1,22 4,46 5,18 5,44 9,02 10,24 9,92 Gb 0,98 1,00 1,16 4,52 5,14 5,46 9,02 10,14 9,92 Sb 0,82 0,98 1,14 4,40 4,84 5,46 8,74 10,26 9,96 Wb 0,90 0,94 1,14 4,46 4,82 5,46 8,92 10,30 9,92 2 LR 2,38 1,82 1,44 8,74 7,42 6,68 15,40 13,54 11,76 G 2,56 2,16 1,56 8,94 7,58 6,86 15,36 13,96 11,92 S 2,54 1,70 1,46 8,98 7,32 6,58 15,76 13,30 11,68 W 1,90 1,52 1,30 8,22 6,94 6,38 14,86 12,74 11,54 LRB 0,94 1,18 0,92 5,34 5,38 5,34 10,16 10,40 10,12 LRb 1,06 1,22 1,04 5,38 5,46 5,40 10,08 10,42 10,14 Gb 1,04 1,28 1,10 5,30 5,40 5,44 10,08 10,60 10,12 Sb 0,96 1,06 1,16 5,12 5,42 5,34 9,78 10,62 10,28 Wb 0,96 1,16 1,18 5,28 5,46 5,42 9,90 10,58 10,28
pc2 = 19% (percentual de censuras da popula¸c˜ao). Nas Tabelas 4.2 e 4.5 foram fixados
p0 = 10% e pc1 = 30%, (pc2 = 37%). Ainda, para as Tabelas 4.3 e 4.6, foram fixados
p0 = 30% e pc1 = 30%, (pc2 = 51%).
A Tabela 4.1, apresenta as taxas de rejei¸c˜ao nula para o cen´ario com percentual de censura na popula¸c˜ao de 19%, com 4 covari´aveis, considerando q = 1 e q = 2. Verifica-se que as estat´ısticas usuais s˜ao mais liberais, apresentando taxas de rejei¸c˜ao acima dos n´ıveis nominais. Por exemplo, para n = 50, n´ıvel nominal de 10%, observa- se para LR, G, S e W , respectivamente, taxas de rejei¸c˜ao nula de 12,88%, 13,26%, 12,28% e 12,18%. Esses valores, no entanto, deveriam ser iguais ou muito pr´oximos ao n´ıvel nominal 10%. J´a as vers˜oes dos testes corrigidos apresentam distor¸c˜oes de tamanho menores que as usuais, com taxas de rejei¸c˜ao nula muito pr´oximas aos n´ıveis nominais. No mesmo cen´ario, as taxas de rejei¸c˜ao baseadas nos testes corrigidos s˜ao muito pr´oximas a 10%. Ainda neste cen´ario pode-se verificar que ao aumentar o n´umero de restri¸c˜oes (q = 2) os testes usuais tˆem desempenho ainda pior, com aumento das
25 taxas de rejei¸c˜ao nula para 13,54%, 13,96%, 13,30% e 12,74%, respectivamente, LR, G, S e W . J´a os testes baseados nas corre¸c˜oes propostas mant´em as taxas de rejei¸c˜ao pr´oximas aos n´ıveis nominais, apresentando no mesmo cen´ario, taxas de rejei¸c˜ao iguais a 10,40%, 10,42%, 10,60%, 10,62% e 10,58%, respectivamente, para LRB, LRb, Gb, Sb
e Wb.
A Figura 4.1 apresenta os gr´aficos QQ-plot (quantil exato versus quantil assint´o- tico), considerando os diferentes tamanhos amostrais, q = 1 e a mesma configura¸c˜ao de censura da Tabela 4.1. Observando a Figura 4.1, nota-se que a estat´ıstica corrigida por Bartlett bootstrap apresenta distribui¸c˜ao mais pr´oxima da distribui¸c˜ao nula de re- ferˆencia, χ2
q. J´a as estat´ısticas usuais, para o tamanho amostral n = 30, apresentam
distribui¸c˜oes muito pr´oximas entre si, mas longe da distribui¸c˜ao nula de referˆencia, quando comparadas com LRB. A medida que o tamanho amostral aumenta as distri-
bui¸c˜oes das estat´ısticas usuais tornam-se mais pr´oximas `a de referˆencia.
quantis assintóticos quantis e xatos 5 10 15 5 10 15 LR G S W LRB (a) n = 30 quantis assintóticos quantis e xatos 5 10 15 20 5 10 15 20 LR G S W LRB (b) n = 50 quantis assintóticos quantis e xatos 5 10 5 10 LR G S W LRB (c) n = 100
Figura 4.1: Gr´afico quantil-quantil considerando 10% de fra¸c˜ao de cura e 10% censura, q = 1 e diferentes tamanhos amostrais.
Na Tabela 4.2 s˜ao apresentadas as taxas de rejei¸c˜ao nula para o cen´ario com per- centual de censura na popula¸c˜ao de 37%, com 4 covari´aveis, considerando q = 1, 2. Verifica-se, assim como na Tabela 4.1, que os testes baseados nas corre¸c˜oes propostas apresentam menores distor¸c˜oes de tamanho quando comparadas `as usuais. Por exem- plo, para n = 30, n´ıvel de 10%, tem-se taxas de rejei¸c˜ao nula muito pr´oximas aos n´ıveis nominais (10,16%, 10,14%, 10,04%, 9,92% e 9,98%, respectivamente para LRB, LRb,
Gb, Sb e Wb). J´a as estat´ısticas usuais se mostram mais liberais, apresentando taxas
de rejei¸c˜ao de 15,36%, 15,10%, 15,32% e 14,66%, respectivamente, para LR, G, S e W . Tamb´em nota-se que os resultados dos testes baseados nas estat´ısticas usuais s˜ao mais distorcidos se comparados `a Tabela 4.1. Pode-se verificar ainda que o aumento do n´umero de restri¸c˜oes (q = 2) considerando 37% de censura na popula¸c˜ao, em geral,
26
Tabela 4.2: Taxas de rejei¸c˜ao nula (%) para H0 : β1 = . . . = βq = 0, com p = 4, 10%
de fra¸c˜ao de cura e 30% censura, (pc2 = 37%), considerando os diferentes tamanhos
amostrais e n´ıveis nominais.
1% 5% 10% q Estat´ıstica❅❅ ❅n 30 50 100 30 50 100 30 50 100 1 LR 2,72 2,82 1,42 8,88 10,10 6,28 15,36 17,32 12,24 G 2,74 3,06 1,46 8,86 10,32 6,30 15,10 17,30 12,32 S 2,88 2,40 1,38 8,92 8,82 6,08 15,32 16,12 11,90 W 2,22 1,96 1,30 8,16 8,72 6,04 14,66 16,26 11,94 LRB 1,06 1,14 0,92 5,22 5,66 4,96 10,16 10,90 10,28 LRb 1,22 1,22 1,02 5,14 5,84 4,94 10,14 11,08 10,20 Gb 1,12 1,00 0,96 5,22 5,62 4,92 10,04 10,70 10,08 Sb 1,22 1,30 1,00 5,08 5,90 4,72 9,92 10,78 10,02 Wb 1,22 1,22 1,04 5,16 5,78 4,86 9,98 10,90 10,10 2 LR 2,30 2,66 3,02 8,98 10,36 10,78 16,70 17,52 18,00 G 2,44 3,00 3,18 9,32 10,76 11,26 16,62 17,64 17,74 S 2,58 3,24 3,54 9,44 10,34 10,52 16,66 17,00 17,92 W 1,78 1,86 2,64 7,76 8,84 9,90 15,72 16,06 17,36 LRB 0,68 0,98 1,26 4,04 5,18 5,66 8,96 11,34 11,00 LRb 0,66 1,26 1,64 4,08 5,50 5,92 9,18 11,46 11,38 Gb 0,64 1,16 1,48 4,04 5,42 5,76 9,22 11,20 11,18 Sb 0,80 1,44 1,74 4,28 6,12 6,24 9,32 11,76 11,74 Wb 0,76 1,20 1,50 4,20 5,52 5,96 9,08 11,60 11,50
acarreta em aumento das distor¸c˜oes dos testes usuais. Ainda, `a medida que o tamanho amostral aumenta, os resultados dos testes usuais s˜ao ainda mais distorcidos (q = 2). Esse resultado n˜ao ´e esperado, no entanto, est´a de acordo com os resultados obtidos por Carneiro (2012), no qual ´e considerado o mesmo modelo e configura¸c˜oes aqui apresen- tadas. Esse comportamento at´ıpico pode ser justificado, possivelmente, por problemas num´ericos, que em amostras maiores ocorrem com maior frequˆencia. Os testes basea- dos nas corre¸c˜oes propostas mesmo quando q = 2 apresentam bom desempenho, com as menores distor¸c˜oes.
Na Tabela 4.3, s˜ao apresentadas as taxas de rejei¸c˜ao nula para o cen´ario com per- centual de censura na popula¸c˜ao de 51%, com 4 covari´aveis, considerando q = 1 e q = 2. Verifica-se que as estat´ısticas usuais s˜ao mais liberais, apresentando taxas de rejei¸c˜ao acima dos n´ıveis nominais, assim como nos resultados j´a discutidos (Tabelas 4.1 e 4.2). Considerando o tamanho amostral n = 50, uma restri¸c˜ao (q = 1), n´ıvel nominal de 5%, temos, por exemplo, para LR, G, S e W , respectivamente, taxas de rejei¸c˜ao nula de
27
Tabela 4.3: Taxas de rejei¸c˜ao nula (%) para H0 : β1 = . . . = βq = 0, com p = 4, 30%
de fra¸c˜ao de cura e 30% censura, (pc2 = 51%), considerando os diferentes tamanhos
amostrais e n´ıveis nominais.
1% 5% 10% q Estat´ıstica❅❅ ❅n 30 50 100 30 50 100 30 50 100 1 LR 2,20 2,24 1,54 8,36 8,56 6,20 14,16 14,98 11,24 G 2,40 2,82 1,62 8,34 9,42 6,40 14,30 15,86 11,48 S 2,18 1,62 1,28 8,24 7,14 5,90 14,12 13,46 11,14 W 1,32 1,46 1,16 7,28 6,76 5,70 13,20 13,48 10,90 LRB 0,90 0,98 1,06 4,82 5,14 5,00 9,46 10,12 9,96 LRb 0,80 1,22 1,22 4,90 5,42 5,14 9,48 10,24 10,06 Gb 0,76 1,10 1,16 4,86 5,28 5,06 9,26 10,10 9,98 Sb 0,84 1,14 1,14 4,88 5,16 5,14 9,66 9,98 9,90 Wb 1,04 1,18 1,14 5,18 5,22 5,18 10,00 10,14 9,88 LR 2,48 2,26 2,32 9,12 9,04 9,88 15,12 16,82 17,06 G 2,92 3,04 2,98 9,68 10,54 10,82 15,50 18,18 18,04 S 2,12 1,40 1,64 8,06 6,92 8,34 14,40 13,68 15,14 W 1,30 0,90 1,42 6,90 6,48 8,06 13,54 12,94 14,88 LRB 0,78 0,82 1,08 4,66 5,10 5,70 9,98 10,20 11,70 LRb 0,82 1,04 1,28 4,78 5,24 5,92 9,94 10,42 12,04 Gb 0,72 1,08 1,20 4,44 4,96 5,78 9,52 9,98 11,86 Sb 0,92 1,02 1,28 4,64 5,32 5,70 9,72 10,20 11,70 Wb 1,04 1,00 1,28 5,14 5,48 5,76 10,16 10,50 11,78
8,56%, 9,42%, 7,14% e 6,76%. As respectivas corre¸c˜oes propostas apresentam taxas de rejei¸c˜ao nula de 5,14%, 5,42%, 5,28%, 5,16% e 5,22%. Ou seja, as corre¸c˜oes propostas apresentam menores distor¸c˜oes quando comparadas aos testes usuais, com taxas de rejei¸c˜ao pr´oximas aos n´ıveis nominais. Ao aumentar o n´umero de restri¸c˜oes (q = 2), os desempenhos dos testes em geral apresentam resultados ainda mais distorcidos quando comparados a q = 1. Ainda cabe destacar que o aumento do tamanho amostral n˜ao melhora o desempenho dos testes quando considerado q = 2. As corre¸c˜oes propostas mesmo com o aumento do n´umero de restri¸c˜oes apresentam as taxas de rejei¸c˜ao nula pr´oximas aos n´ıveis nominais.
As Tabelas 4.4 a 4.6 apresentam os resultados das taxas de rejei¸c˜ao nula conside- rando 6 covari´aveis. Verifica-se que os testes usuais apresentam resultados ainda mais distorcidos quando comparados `as Tabelas 4.1 a 4.3. Ainda, considerando os respecti- vos percentuais de censura e n´umero de restri¸c˜oes (q), os resultados s˜ao semelhantes, verificando-se as maiores distor¸c˜oes quando a propor¸c˜ao de censura na popula¸c˜ao foi
28
Tabela 4.4: Taxas de rejei¸c˜ao nula (%) para H0 : β1 = . . . = βq = 0, com p = 6, 10%
de fra¸c˜ao de cura e 10% censura, (pc2 = 19%), considerando os diferentes tamanhos
amostrais e n´ıveis nominais.
1% 5% 10% q Estat´ıstica❅❅ ❅n 30 50 100 30 50 100 30 50 100 1 LR 2,78 2,20 1,50 9,00 7,80 6,68 15,54 13,78 12,62 G 2,88 2,22 1,50 9,24 7,90 6,76 15,68 13,82 12,68 S 2,50 2,22 1,46 8,84 7,90 6,52 15,48 13,66 12,70 W 2,32 2,12 1,42 8,62 7,78 6,40 15,28 13,52 12,58 LRB 1,58 1,32 1,10 5,48 5,72 5,40 10,86 10,40 10,90 LRb 1,46 1,36 1,24 5,28 5,76 5,52 10,36 10,56 11,02 Bb 1,22 1,38 1,20 5,08 5,74 5,62 10,46 10,60 11,02 Sb 1,20 1,14 0,96 4,90 5,50 5,44 9,84 10,44 11,00 Wb 0,80 1,08 0,94 4,16 5,46 5,40 9,30 10,56 11,00 2 LR 3,04 1,90 2,04 9,94 7,94 7,30 17,10 13,86 12,98 G 3,40 2,00 2,10 10,36 7,94 7,54 17,50 13,96 13,08 S 2,78 2,04 1,92 9,50 8,02 7,32 16,64 13,80 12,82 W 2,20 1,78 1,80 8,86 7,76 7,10 16,02 13,64 12,62 LRB 1,80 1,36 1,36 6,80 5,84 6,30 12,32 10,70 11,48 LRb 1,44 1,22 1,44 5,92 5,58 6,10 11,14 10,28 11,40 Bb 1,30 1,18 1,48 5,82 5,48 6,18 10,70 10,12 11,44 Sb 0,86 1,02 1,34 4,84 5,24 5,68 9,14 9,46 10,74 Wb 0,38 0,80 1,26 3,58 4,78 5,64 7,82 9,48 10,88
de 37%. Em rela¸c˜ao `as corre¸c˜oes propostas, os resultados indicam bom desempenho na maioria das configura¸c˜oes, com distor¸c˜oes menores que os testes usuais. Durante o estudo de simula¸c˜ao verificou-se o percentual m´edio de censura nas amostras bootstrap, sendo poss´ıvel constatar que as corre¸c˜oes apresentam maiores distor¸c˜oes quando o per- centual m´edio de censura nas amostras bootstrap n˜ao foi o mesmo da amostra original. Dessa forma, salienta-se a importˆancia de, em aplica¸c˜oes, preservar a quantidade de censura da amostra original.
De forma geral, considerando as Tabelas 4.1 a 4.6, pode-se verificar que quando o percentual de censura ´e de 37% (Tabelas 4.2 e 4.5) os testes usuais sem corre¸c˜oes apre- sentaram os piores desempenhos. As maiores distor¸c˜oes de tamanho foram verificadas quando testadas duas restri¸c˜oes (q = 2) e n = 100. Para todas as tabelas os testes usuais possuem menores distor¸c˜oes quando n = 100 e q = 1. Ainda, entre os cen´a- rios considerados, as menores distor¸c˜oes foram verificadas para o cen´ario com o menor percentual de censura na popula¸c˜ao 19%. Considerando o aumento do n´umero de pa-
29
Tabela 4.5: Taxas de rejei¸c˜ao nula (%) para H0 : β1 = . . . = βq = 0, com p = 6, 10%
de fra¸c˜ao de cura e 30% censura, (pc2 = 37%), considerando os diferentes tamanhos
amostrais e n´ıveis nominais.
1% 5% 10% q Estat´ıstica❅❅ ❅n 30 50 100 30 50 100 30 50 100 1 LR 2,64 2,26 2,42 9,08 8,48 8,96 16,22 14,52 15,66 G 2,88 2,44 2,42 9,40 8,68 9,14 16,34 14,86 15,76 S 2,54 2,16 2,08 8,82 8,20 8,44 15,34 14,18 14,88 W 1,90 1,98 1,94 8,20 8,14 8,20 15,22 13,92 14,80 LRB 1,24 1,24 1,70 5,72 5,82 7,46 10,80 11,08 13,78 LRb 1,24 1,36 1,74 5,74 5,90 7,66 10,56 11,14 13,80 Gb 1,20 1,44 1,84 5,46 6,00 7,70 10,44 11,14 13,92 Sb 0,90 1,30 1,58 4,82 5,70 7,18 9,74 10,86 13,18 Wb 0,72 1,18 1,52 4,12 5,48 7,10 9,04 11,02 13,24 2 LR 3,50 2,06 2,86 11,74 8,50 9,92 19,78 14,98 17,02 G 4,20 2,26 3,04 12,54 8,76 10,36 20,28 15,20 17,34 S 3,08 1,84 2,64 11,30 8,28 9,22 18,90 14,86 16,32 W 2,08 1,66 2,42 9,76 7,74 8,92 17,60 14,32 16,04 LRB 1,92 1,08 2,18 6,96 5,76 7,90 12,78 10,88 14,58 LRb 1,46 1,04 2,30 6,44 5,72 7,98 12,08 10,92 14,68 Gb 1,48 1,18 2,38 6,42 5,74 8,20 12,26 10,96 14,84 Sb 1,20 0,88 1,96 5,24 5,38 7,32 11,00 10,42 13,58 Wb 0,44 0,78 1,86 3,72 5,12 7,30 9,22 10,30 13,62
rˆametros verificou-se que as distor¸c˜oes dos testes usuais s˜ao ainda maiores. Em rela¸c˜ao `as corre¸c˜oes propostas, foi poss´ıvel verificar que todas possuem bons resultados, em todos os cen´arios considerados, com pequena diferen¸ca do n´ıvel nominal quando essa ocorre. Dessa forma, qualquer vers˜ao corrigida ´e recomend´avel. Por vantagens compu- tacionais poderia ser considerada a estat´ıstica da raz˜ao de verossimilhan¸cas corrigida por Bartlett bootstrap (LRB).
A Tabela 4.7 apresenta os resultados das simula¸c˜oes de Monte Carlo para investi- gar o poder dos testes em amostras finitas. Como os testes usuais se mostraram mais liberais, inicialmente foram geradas 5000 r´eplicas de Monte Carlo para determinar os valores cr´ıticos que garantissem o mesmo tamanho dos testes (sob a hip´otese nula). Para o estudo de poder a hip´otese nula testada foi β1 = 0, sendo calculadas as taxas de re-
jei¸c˜ao sob a hip´otese alternativa H1 : β1 = δ, em que δ = −1,5; −1,0; −0,5; 0,5; 1,0; 1,5.
O tamanho de amostra considerado foi n = 50, o n´ıvel nominal de 5% e o percentual de censura fixado sob H0 foi de 43%. Os valores fixados para os demais coeficientes
30
Tabela 4.6: Taxas de rejei¸c˜ao nula (%) para H0 : β1 = . . . = βq = 0, com p = 6, 30%
de fra¸c˜ao de cura e 30% censura, (pc2 = 51%), considerando os diferentes tamanhos
amostrais e n´ıveis nominais.
1% 5% 10% q Estat´ıstica❅❅ ❅n 30 50 100 30 50 100 30 50 100 1 LR 2,72 2,00 2,24 9,52 8,22 8,08 16,14 14,34 14,44 G 3,16 2,08 2,54 9,80 8,44 8,56 16,32 14,38 14,80 S 2,60 1,70 1,88 8,68 7,74 7,52 15,34 14,04 13,90 W 2,06 1,50 1,70 8,18 7,62 7,38 15,10 14,00 13,68 LRB 1,10 0,98 1,62 5,28 5,40 6,84 10,26 11,30 12,70 LRb 1,08 1,16 1,72 5,34 5,58 6,96 10,28 11,20 12,86 Gb 1,12 1,12 1,92 5,18 5,56 7,20 10,40 11,16 12,94 Sb 0,90 1,04 1,50 5,02 5,18 6,52 9,64 10,94 12,46 Wb 0,82 0,98 1,44 5,10 5,24 6,50 9,72 11,08 12,34 2 LR 3,26 2,50 1,84 11,38 8,42 8,06 18,72 14,74 14,40 G 4,00 2,68 2,20 12,50 8,66 8,60 19,72 14,80 14,98 S 2,44 2,24 1,58 9,98 8,10 7,12 16,76 14,18 13,46 W 1,74 1,84 1,38 8,56 7,60 6,86 15,94 13,86 13,20 LRB 1,20 1,18 1,46 5,36 5,88 6,50 11,14 10,30 12,20 LRb 1,04 1,28 1,52 5,12 5,78 6,60 10,94 10,40 12,34 Gb 1,20 1,34 1,62 5,36 5,76 6,84 11,06 10,50 12,54 Sb 0,92 1,18 1,18 4,46 5,56 5,96 9,94 10,18 11,70 Wb 0,94 1,18 1,20 4,38 5,52 5,80 9,66 10,22 11,62
Tabela 4.7: Taxas de rejei¸c˜ao n˜ao nula (%) para H0 : β1 = 0 e H1 : β1 = δ, com p = 4,
considerando o tamanho amostral n = 50 e n´ıvel nominal 5%.
Estat´ıstica❅❅ ❅δ −1,5 −1,0 −0,5 0,5 1,0 1,5 LR 95,86 78,90 33,72 12,88 62,80 96,50 G 95,56 77,44 33,18 11,00 58,76 95,38 S 94,22 75,74 31,56 16,90 69,36 97,56 W 95,56 78,20 32,96 16,74 69,12 97,48 LRB 96,30 80,42 35,96 14,46 65,80 97,14 LRb 96,28 80,74 36,40 14,66 66,10 97,18 Gb 96,10 80,26 36,30 12,96 63,16 96,64 Sb 94,68 78,02 33,92 18,28 71,64 97,98 Wb 96,04 80,14 34,70 17,80 70,94 97,88
31 foram β2 = 1,5, β3 = −1,3 e β4 = 1,5. Com base na Tabela 4.7 ´e poss´ıvel verificar que,
em geral, os testes baseados nas corre¸c˜oes propostas apresentam os maiores valores nos resultados das taxas de rejei¸c˜ao n˜ao nula. Ainda, quando δ positivo, o teste mais po- deroso foi Sb, e quando δ negativo o teste mais poderoso foi LRb ou LRB, dependendo
da magnitide de δ. Contudo, nenhum mostrou-se uniformemente melhor. Dessa forma, al´em dos testes baseados nas corre¸c˜oes propostas apresentarem menores distor¸c˜oes em termos de tamanho, tamb´em mostraram-se poderosos.
Cap´ıtulo 5
Aplica¸c˜ao
Este cap´ıtulo apresenta uma aplica¸c˜ao a dados reais dos testes apresentados e das corre¸c˜oes propostas. Os dados utilizados correspondem a um estudo realizado pela cooperativa de oncologia Ocidental, publicado por Edmonson et al. (1979), em que um ensaio aleatorizado foi feito para comparar dois tratamentos para cˆancer de ov´ario em 26 pacientes. Estes dados, cl´assicos na literatura em an´alise de sobrevivˆencia, est˜ao dispon´ıveis com o nome ovarian no pacote survival (THERNEAU; GRAMBSCH, 2000) no R (R Development Core Team, 2014).
A base de dados apresenta o tempo (em dias) das pacientes at´e a morte ou censura, o indicador da censura, a idade, a presen¸ca ou n˜ao de doen¸ca residual, o tipo de tratamento, e uma medida de performance, em que 1 ´e a melhor.
tempo (em dias)
sobre viv ência 0 200 400 600 800 1200 0,0 0,2 0,4 0,6 0,8 1,0
Figura 5.1: Kaplan-Meier dos dados referente ao tempo at´e a morte de pacientes com cˆancer de ov´ario.
33 A Figura 5.1 apresenta o gr´afico de Kaplan-Meier, que estima a curva de sobre- vivˆencia com base nestes dados. Pode-se notar que h´a um indicativo da presen¸ca de imunes nos dados, atrav´es da alta presen¸ca de censura `a direita no fim do estudo e pelo Kaplan-Meier, que se estabilizou em um valor em torno de 0,53. Nessa situa¸c˜ao os modelos com fra¸c˜ao de cura s˜ao adequados.
Em rela¸c˜ao `as caracter´ısticas dos indiv´ıduos, foram consideradas 4 covari´aveis (fa- tores): idade (x1 = −1 se a paciente tem menos de 60 anos, e 1 em caso contr´ario); doen¸ca residual (x2 = 1 se a paciente tem presen¸ca de doen¸ca residual, 0 em caso contr´ario); tipo de tratamento (x3 = 1 para o tratamento do grupo 1, 0 para o grupo 2) e medida de performance (x4 = 1 para a melhor performance, e 0 para a pior).
Dessa forma, o modelo tempo de promo¸c˜ao Weibull foi ajustado, com o objetivo de avaliar o efeito das covari´aveis consideradas no estudo sobre a fra¸c˜ao de cura. As covari´aveis foram inclu´ıdas no modelo atrav´es do parˆametro θ, por meio da rela¸c˜ao θi = exp(x⊤i β).
Inicialmente foram consideradas todas as covari´aveis no modelo, associadas `a fra¸c˜ao de cura, dada por
p0i = exp[− exp(β1x1i+ β2x2i+ β3x3i+ β4x4i)].
Ap´os a estima¸c˜ao dos parˆametros foram realizados testes de hip´oteses para verificar a significˆancia dos parˆametros associados a cada covari´avel. As hip´oteses consideradas foram
H0 : βj = 0 versus H1 : βj 6= 0, (5.1)
para j = 1, . . . , 4. Da mesma forma que nas simula¸c˜oes, foram considerados p = 4 e q = 1, sendo 5 o n´umero de parˆametros de perturba¸c˜ao em todos os testes realizados.
Os testes foram realizados considerando o n´ıvel de significˆancia de 5%, sendo a hi- p´otese nula rejeitada se p-valor < 0,05. Na Tabela 5.1 s˜ao apresentados os p-valores associados aos testes de hip´oteses realizados considerando as estat´ısticas usuais, corri- gida (LRB) e os testes corrigidos. S˜ao destacados em negrito os p-valores que rejeitam
a hip´otese nula.
Ao testar a significˆancia da covari´avel x1, H0 : β1 = 0, pela Tabela 5.1, considerando
as estat´ısticas usuais, corrigida LRB e os testes corrigidos, temos p-valores < 0,05,
logo a covari´avel ´e significativa e permanece no modelo. Ao testar a exclus˜ao das demais covari´aveis x2, x3 e x4, ou seja H0 : β2 = 0, H0 : β3 = 0 e H0 : β4 = 0,
34
Tabela 5.1: p-valores dos testes de hip´oteses corrigidos e n˜ao corrigidos, para os parˆa- metros associados `a fra¸c˜ao de cura do modelo de tempo de promo¸c˜ao Weibull: dados de cancˆer no ov´ario. Teste ❅❅ ❅ β1 β2 β3 β4 LR 0,001 0,193 0,402 0,191 G 0,001 0,196 0,397 0,197 S 0,000 0,183 0,409 0,174 W 0,001 0,193 0,413 0,181 LRB 0,003 0,215 0,470 0,247 LRb 0,004 0,217 0,495 0,249 Gb 0,004 0,201 0,491 0,259 Sb 0,001 0,225 0,505 0,229 Wb 0,002 0,201 0,500 0,227
considerando todos os testes temos p-valores> 0,05, logo as covari´aveis x2, x3 e x4 n˜ao
s˜ao significativas, indicando que devem ser exclu´ıdas do modelo. Cabe destacar, no entanto, que os p-valores baseados nas estat´ısticas usuais s˜ao sempre menores que os p-valores das corre¸c˜oes propostas, essa diferen¸ca chega a ser pr´oxima de 0,10 quando considerada a estat´ıstica escore (S) e o teste corrigido (Sb), ao testar H0 : β3 = 0.
Nessa aplica¸c˜ao as conclus˜oes inferenciais s˜ao as mesmas, no entanto, pelas diferen¸cas de p-valor verificadas, dependendo das covari´aveis as conclus˜oes inferencias poderiam ser contr´arias, destacando assim a importˆancia da utiliza¸c˜ao das corre¸c˜oes propostas. Tabela 5.2: Estimativas dos parˆametros e erros padr˜ao do modelo de tempo de promo- ¸c˜ao Weibull final: dados de cˆancer no ov´ario.
Parˆametro Estimativa Erro padr˜ao
β1 1,114 0,339
ρ 0,910 0,244
γ −15,438 3,690
Na Tabela 5.2 s˜ao apresentadas as estimativas dos parˆametros e seus erros padr˜ao considerando o modelo ajustado. Baseado nas estimativas da Tabela, a fra¸c˜ao de cura estimada ´e dada por
b
35 Baseado nas estimativas dos parˆametros o modelo ajustado pode ser interpretado em termos da fra¸c˜ao de cura, atrav´es da equa¸c˜ao (5.2). Pacientes com idade inferior a 60 anos apresentaram fra¸c˜ao de cura estimada de 72,019%, j´a as pacientes com idade igual ou superior a 60 anos apresentaram fra¸c˜ao de cura estimada de 4,752%. Dessa forma, conclui-se que as pacientes com cˆancer de ov´ario mais jovens (idade inferior a 60 anos)