• Sonuç bulunamadı

Seguem as técnicas estatísticas utilizadas no tratamento de dados desta pesquisa.

• Teste de normalidade dos dados – Kolmogorov-Smirnov

• Teste não paramétrico Mann-Whitney, aplicado para testar se duas amostras independentes foram extraídas de populações com médias iguais.

• Teste não paramétrico Kruskal-Wallis, teste equivalente ao teste Mann- Whitney para

k amostras independentes (k>2). • Regressão

5.5.1 Teste de normalidade de Kolmogorov-Smirnov

A maioria dos problemas de pesquisa em ciências sociais aplicadas são solucionados considerando algumas suposições iniciais, como assumir uma função de distribuição para os dados amostrados. Nesse sentido, surge a necessidade de averiguar se essas suposições podem realmente ser assumidas. Segundo Fávero et al (2009), assumir a normalidade dos dados é o primeiro passo para simplificar as análises. Para dar suporte a esta suposição, considera-se o teste de Kolmogorov – Smirnov, que pode ser utilizado para avaliar duas hipóteses.

• Hipótese Nula (H0): Os dados seguem uma distribuição normal.

• Hipótese Alternativa (H1): Os dados não seguem uma distribuição normal.

Este teste calcula a máxima diferença absoluta entre a função de distribuição acumulada assumida para os dados – no caso, a Normal – e a função de distribuição empírica dos dados. Compara-se esta diferença com um valor crítico, para um dado nível de significância de 5%, por exemplo.

A estatística utilizada para o teste é:

Dn=max

Esta função corresponde à distância máxima vertical entre os gráficos de F(x) e Fn(x) sobre

a amplitude dos possíveis valores de x. Em Dn , temos que

F(x) representa a função de distribuição acumulada assumida para os dados.

Fn(x) representa a função de distribuição acumulada empírica dos dados.

A função de distribuição acumulada assumida para os dados é definida por

F x

( )

(i) =P X

(

<x(i)

)

e a função da distribuição empírica Fn(x) corresponde à proporção de valores menores ou iguais a x. Tal função pode ser escrita com os dados colocados em ordem crescente, da forma x(1),x(2),...,x(n): Fn(x)= 0, se x<x( )1 k n, se x( )kx<x( )k+1 1, se x>x( )n        (9)

Se o valor-p obtido for inferior a 5%, então a distribuição dos dados não pode ser aproximada por uma distribuição normal; caso contrário, se o valor-p for acima de 5%, a distribuição dos dados pode ser aproximada por uma distribuição normal.

5.5.2 Teste não paramétrico de Mann-Whitney

Segundo Wagner (2004), o teste de Mann-Whitney é um teste não paramétrico alternativo ao teste t-Student para comparar as médias de duas amostras independentes. Há dois pressupostos exigidos para sua aplicação.

• As duas amostras devem ser independentes e aleatórias.

• As variáveis em análise devem ser numéricas ou ordinais.

Caso não haja evidências significativas de que as amostras sejam normais, o teste pode ser utilizado.

Já os pressupostos para a aplicabilidade do teste t-Student são mais exigentes: as populações de onde as amostras provêm têm distribuição normal; as amostras são independentes e aleatórias; as populações têm uma variância comum.

Sejam N1 e N2os tamanhos das duas amostras, as hipóteses subjacente são as que seguem.

- H0: As duas amostras têm distribuições idênticas - H1: As duas amostras têm distribuições diferentes

A estatística de teste U é calculada conforme os passos a seguir:

• as observações das duas amostras são combinadas em uma única variável de tamanho N1+

N2;

• o conjunto de observações formado é colocado em ordem crescente, atribuindo o número de ordem 1 à observação menor e o número de ordem N1+ N2 à observação maior. Caso haja “empates” ou ties, a cada uma das observações “empatadas”, é atribuído o número de ordem médio que elas teriam se não estivessem “empatadas”.

• calculam-se as somas dos números de ordem das observações de cada amostra:

W1:soma dos números de ordem das observações da amostra 1; W2:soma dos números de ordem das observações da amostra 2.

• calculam-se as quantidades: U1=N1N2+ N2⋅(N2+1) 2 −W2 (10) U2 =N1⋅N2 + N1⋅(N1+1) 2 −W1 (11)

A estatística de teste será determinada pela expressão: U =min(U1,U2). A hipótese nula

afirma que as duas amostras terão a mesma distribuição de probabilidades caso as médias (e também as medianas) das duas amostras sejam estatisticamente iguais. Se o valor-p obtido for inferior a 5%, então as duas amostras não têm distribuições de probabilidades idênticas; caso contrário, se o valor-p for maior do que 5%, então as duas amostras têm distribuições idênticas.

No pacote estatístico SPSS, o resultado do teste U de Mann-Whitney não apresenta nenhuma estatística descritiva, tampouco compara médias ou medianas. Segundo Wagner (2004), a comparação realizada por esse teste avalia a semelhança entre as duas séries, por meio do grau de intersecção dos ranks (postos). A apresentação do mean rank não deve ser considerada uma medida descritiva. Os dados da presente pesquisa permitem deduzir que o grupo que apresentar retorno médio mensal significativamente maior terá um mean rank mais alto. Porém, para saber o quanto foi maior, é necessário obter estatísticas descritivas para os grupos.

5.5.3 Teste de Kruskal-Wallis

Segundo Fávero (2009), o teste Kruskal-Wallis é um teste não paramétrico, que verifica a probabilidade de que k amostras independentes sejam provenientes da mesma população. O teste Kruskal-Wallis é equivalente ao teste Mann-Whitney.

O teste de Kruskal-Wallis pode ser utilizado para avaliar as hipóteses:

• Hipótese nula (H0): afirma que a distribuição das k amostras é igual;

• Hipótese alternativa (H1): afirma que a distribuição das k amostras é diferente;

Neste estudo, o teste será utilizado para verificar se há diferença dos retornos médios mensais estudados ao longo dos anos em cada grupo.

5.5.4 Regressão

Segundo Hair et al (2005), a regressão é uma técnica associativa que nos ajuda a determinar se há uma relação coerente e sistemática entre duas ou mais variáveis.

No presente estudo, utilizou-se a técnica da regressão múltipla, sendo aplicada a média dos retornos dos fundos como variável dependente, e o retorno mensal dos índices IMA-S, IRF-M e IMA-B como variáveis independentes. O programa utilizado para cálculo da regressão foi o pacote estatístico SPSS, versão 19.

Por meio do coeficiente múltiplo de determinação, R2, mensurou-se a habilidade das diversas variáveis independentes, que são os índices, de prever a única variável dependente, que é o retorno do fundo. O R2 múltiplo varia de 0 a +1 e representa a quantidade de oscilação na

variável dependente explicada pelas variáveis dependentes combinadas. Se R2 é estatisticamente significativo, verifica-se o nível de explicação do modelo.