İnsani Müdahale ile Koruma Sorumluluğu Arasındaki Kavramsal İlişk

TEORİK VE KAVRAMSAL ÇERÇEVE

1.2.3. Koruma Sorumluluğu

1.2.3.4. İnsani Müdahale ile Koruma Sorumluluğu Arasındaki Kavramsal İlişk

Na busca de associações entre as séries evolutivas, diagnósticos e cirurgias, foram usados três métodos básicos: comparação de médias, regressão logística univariada, e análise do potencial diagnóstico das variáveis explicativas selecionadas, por curvas ROC.

3.9.1 - Comparação de médias

Inicialmente são consideradas tabelas constituídas de duas colunas, na primeira das quais se distribuem os valores possíveis das variáveis-resposta primárias (as uropatias e os eventos cirúrgicos) e na segunda coluna são colocados os respectivos valores médios da variável explicativa. Dessa forma temos que a média listada em determinada linha é calculada exclusivamente sobre o conjunto de casos em que a respectiva variável-resposta efetivamente ocorre. Após inspeção visual da segunda coluna, as eventuais diferenças verificadas entre médias de variáveis-resposta diversas, deverão ser testadas para que se decida se tais diferenças são estatisticamente significantes.

Para o teste estatístico das diferenças entre médias, as variáveis-resposta primárias podem ser usadas como tal (sob a forma primária), ou agrupadas, sob a forma de variáveis-resposta compostas, conforme já foi explicado em outra parte deste capítulo. De qualquer forma, a variável resposta considerada só poderá assumir dois valores: valor 0, representando a não ocorrência, e valor 1, representando a ocorrência positiva.

É feito, inicialmente, um teste para se estabelecer se as amostras podem ser consideradas de mesma variância. Tanto se pode usar o método de Levene (LEVENE et al., 1960), como o

método que faz uso das medianas, denominado teste de Brown-Forsythe (BROWN AND FORSYTH et al., 1974).

Conforme a prevalência, ou não, da hipótese de homoscedasticidade, utiliza-se respectivamente o teste de Student clássico ou o teste de Welch-Satterthwaite para se avaliar a significância da diferença das médias observadas (DANIEL, 1991). O nível de significância pertinente é calculado. O teste de Welch-Satterthwaite também é usado, sem que se faça teste preliminar, nos casos em que o tamanho das amostras é diferente (ZIMMERMAN, 2004).

3.9.2 - Classificação com regressão logística

Consideremos um certo número de observações empíricas, cada uma delas consistindo de um conjunto de valores em que y é a variável-resposta (binária, podendo assumir os valores 0 ou 1) e x = (x1, x2, ... xn) representa as variáveis explicativas (que, no caso mais

geral, são variáveis contínuas). Chama-se regressão logística (RL) ao ajustamento a tais dados de uma equação da forma y = 1 / [1 + e - P(x) ], sendo P(x) o polinômio P(x) = βnxn + βn-1xn-1 +

... β1x1 + β0. O cálculo dos coeficientes de ajustamento (βn, βn-1, ... β1, β0),se faz de maneira

que y(x) corresponda à melhor estimativa, considerada, como critério, a maximização da verossimilhança da probabilidade P(1 \ x), que é a probabilidade da variável-resposta assumir o valor 1, desde que as variáveis explicativas tenham os valores x = (x1, x2, ... xn).

Na RL, y(x) assume valores no intervalo fechado [0 , 1] para uma variação de P(x) no intervalo (-∞ a +∞). Para cada coeficiente β obtido, é costume se calcular também o respectivo intervalo de confiança e o nível de significância. Além da interpretação de y(x) como uma probabilidade, conforme já exposto, uma outra vantagem dos modelos baseados em RL é que os coeficientes de ajustamento estão associados ao conceito de razão de chances, muito familiar aos bioestatísticos. Pode se demonstrar que, para cada variável explicativa considerada, a respectiva razão de chances, para a variável-resposta em questão, pode ser calculada por RCn = e βn.

3.9.3 - Comparação do potencial de discriminação de classificadores

A análise por curvas ROC (Receiver Operating Characteristics) é uma técnica desenvolvida para aplicação inicial na detecção de sinais de radar, que se tornou padrão, inclusive na pesquisa médica, para avaliar e comparar o poder de discriminação de modelos classificadores. Chamaremos de variável-resposta à variável (binária) resultante do processo de classificação (por exemplo: 0 = anomalias ausente; 1 = anomalias presente), e designaremos por “escore” a variável (muitas vezes contínua) da qual decorre a classificação. Um par de observações do escore e da respectiva variável-resposta será referido como um “caso”.

Para um determinado classificador, a curva ROC nada mais é que uma representação no plano cartesiano da sensibilidade (eixo das ordenadas) em função da taxa de falso positivo (ou seja: 1 – especificidade), no eixo das ordenadas, sendo tais valores calculados para todos os valores de escore observados nos diversos casos. A medida básica do potencial de discriminação do classificador é a área sob a curva (ASC). Calculada pela regra de integração dos trapézios, a ASC é equivalente à estatística de Wilcoxon (ou Mann-Whitney) e dessa constatação decorre sua interpretação: se forem tomados aleatoriamente entre os casos a serem classificados, um caso no qual a variável-resposta é positiva e outro caso em que a variável-resposta é negativa, a ASC representa a probabilidade de que os valores dos respectivos escores permitirão identificar corretamente qual dos dois casos é o positivo (HANLEY et al., 1982).

A análise por ROC permite avaliar o potencial que cada variável explicativa tem para separar casos positivos e casos negativos das variáveis-resposta, no universo de dados considerados. No nosso trabalho essa metodologia foi utilizada para avaliar, dentre diversos parâmetros de caracterização das séries evolutivas, aqueles que têm maior potencial de discriminação.

Uma análise completa por curvas ROC deve compreender os seguintes cálculos: área sob a curva (ASC) (DELONG et al., 1988; FAWCETT, 2004), desvio padrão da ASC (HAJIAN- TILAKI et al., 2002; DELONG et al., 1988); intervalo de confiança do valor de ASC (nível de 95%) (MACSKASSY et al., 2003), o ponto em que se observa a melhor separação (maior soma de sensibilidade com especificidade); o ponto de maior acurácia (maior percentual de acertos na previsão); razões de verossimilhança (positivo e negativo); comparação (diferença) entre ASC de diferentes escores (HANLEY et al., 1997; DELONG et al., 1988). As curvas podem ser traçadas (FAWCETT, 2004), mas os indicadores numéricos são suficientes para análises e comparações.

A maioria dos pacotes de cálculo estatístico dispõe de possibilidades de análises por curvas ROC. A área sob a curva é sempre calculada com precisão, mas os cálculos de desvio padrão e comparação de curvas costumam se basear em métodos simplificados.

As rotinas e planilhas utilizadas nesses cálculos foram devidamente validadas, por comparação com softwares comerciais de análise estatística - SPSS (SPSS Inc., Chicago, EUA), StatsDirect (StatsDirect Ltd, Cheshire, UK), MedCalc (Medcalc Inc.,Mariakerke,. Belgium), Analyse-It (Analyse-It Software Ltd, Leeds, England), AccuROC (Accumetric Corporation, Montreal, Canada). O aplicativo permite exibição simultânea e comparação de até 5 curvas e, no que concerne aos cálculos de desvio padrão e de comparação de curvas, a metodologia utilizada é a mesma do AccuROC, superando às dos outros softwares (STEPHAN et al., 2003).

3.9.4 – Scripts para avaliação do potencial preditivo das variáveis explicativas

A avaliação do potencial preditivo das variáveis explicativas é feita, principalmente, através de análise da significância estatística dos coeficientes apurados em ajustamento, por regressão logística, das variáveis-resposta consideradas, em função das variáveis explicativas disponíveis. O processamento de regressão logística foi feito com suporte do software SPSS, através de rotinas (“scripts”, na terminologia do SPSS) especializadas para as tarefas almejadas. Antes de se realizar o processamento em ambiente SPSS, é necessário delimitar o estudo através de escolhas feitas no aplicativo em Excel. Uma análise específica envolve a seleção das unidades renais que serão consideradas e da variável-resposta cuja associação se pretende estabelecer. Delineada a análise, no aplicativo Excel, realiza-se então a exportação de dados para o SPSS (sob a forma de um arquivo-texto).

As rotinas compatíveis com SPSS começam por ler os dados, exportados pelo aplicativo em Excel, sobre os quais serão feitas as análises posteriores. Após essa importação de dados, podemos considerar que estamos trabalhando sobre uma tabela em que cada linha representa um caso (associado a uma unidade renal), enquanto as colunas, em sua maioria, armazenam valores (contínuos em amplitude, na maioria das vezes) das variáveis explicativas, que são duzentas e quarenta e uma, no total.

Para cada uma das 241 variáveis explicativas disponíveis para consideração, calcula-se o modelo de regressão logística univariada, seguida imediatamente de avaliação do respectivo potencial de discriminação, o que se faz através do cálculo da área sob a respectiva curva ROC. O processamento todo - cálculo da regressão, análise por ROC - é feito, variável por variável, automaticamente, por programação (script). Os resultados são armazenados em um arquivo-texto, que servirá como base para a analise do potencial preditivo das variáveis explicativas. Nesse arquivo, cada linha contém resultados relativos a uma determinada variável explicativa: coeficientes da regressão logística, estatística de cada coeficiente (DP, Wald, valor-p, razão de chances), área sob a curva ROC. Esses arquivos texto são lidos, posteriormente, por uma planilha em Excel que classifica as variáveis explicativas, seja pela significância dos coeficientes de regressão, seja pela área sob a curva ROC calculada. Os resultados obtidos são descritos no capítulo VI.

Capítulo 4 - CASUÍSTICA

4.1 - Introdução

Neste capítulo são descritas as casuísticas que serão objeto de atenção em estudos empreendidos nesta dissertação (Cap. V e VI). Inicialmente abordamos em detalhes o banco de dados completo. Em seguida, de maneira mais resumida, serão analisadas as demais casuística consideradas nesta dissertação.

Belgede Koruma sorumluluğu gelişimi ve uygulaması (sayfa 73-82)