2.1 Coleta dos dados
Tendo em vista as exigências de disclosure, os dados primários para a pesquisa foram obtidos através de demonstrativos contábeis de empresas não- financeiras, cujas ações são negociadas no mercado acionário americano. Conforme já discutido anteriormente, dados sobre a utilização de derivativos não são, em geral, disponibilizados pelas empresas brasileiras e, portanto, uma avaliação empírica com significância estatística não pôde ser realizada para o âmbito nacional.
Para a realização da avaliação empírica, foram levantados os demonstrativos financeiros das empresas americanas. Através do Annual Reports Service disponibilizado pelo The Wall Street Journal, foram obtidos fisicamente os relatórios financeiros de diversas empresas. Apesar de o levantamento da amostra não ser aleatório, pois foram obtidos relatórios apenas de empresas com contratos de distribuição com o Annual Reports Service, a diversidade de empresas com relação a tamanho, setores de atuação e indicadores financeiros permite que os resultados das análises estatísticas sejam significantes.
A forma de obtenção dos relatórios pode, inclusive, constituir forma de seleção amostral superior à seleção de empresas pertencentes ao S&P500, como em MIAN (1996) ou superior às listas das maiores empresas disponibilizadas pelas revistas Forbes ou Fortune, como em HENTSCHEL e KOTHARI (2001), por exemplo. Empresas previamente classificadas pelo faturamento ou pela capitalização podem induzir vieses nas análises, uma vez que companhias maiores podem ter características semelhantes e maior probabilidade de utilizar derivativos devido à complexidade de sua estrutura e de suas operações.
A empresa The Wall Street Journal disponibilizou mais de 1.000 demonstrativos financeiros. Relatórios de empresas financeiras e de fundos de
investimento foram descartados por não constituírem objeto de avaliação nesta pesquisa.
Os relatórios restantes foram cuidadosamente analisados, com o objetivo de se identificar claramente se a empresa era usuária de derivativos, seguindo um procedimento semelhante a GECZY et al (1997). Ou seja, as empresas foram classificadas através da busca de referências sobre a utilização de derivativos nos relatórios financeiros.
Para aumentar a confiabilidade da coleta, cada demonstrativo foi avaliado pelo menos duas vezes, objetivando a classificação das empresas entre usuárias ou não-usuárias de derivativos. Se a segunda avaliação conduziu a uma classificação diferente da obtida na primeira avaliação, então uma terceira análise dos demonstrativos foi efetuada para dirimir a inconsistência.
Alguns demonstrativos, com um nível de transparência maior, permitiam até mesmo a identificação do tipo de derivativo utilizado, ou seja, contratos a termo, futuros, opções e swaps, além do fator de risco administrado, como, por exemplo, taxa de juros, preço de commodities ou taxa de câmbio.
A regra da Securities and Exchange Commision prevê que as empresas usuárias de derivativos façam o disclosure de dados de gestão de risco de mercado. Devido à natureza dos diferentes relatórios financeiros, foram avaliados os demonstrativos denotados por Form 10-K, que representam os relatórios anuais. Atenção especial foi dada ao item 7A, referente aos disclosures quantitativos e qualitativos sobre risco de mercado e às informações financeiras das posições em derivativos.
Os casos em que a utilização ou não-utilização de derivativos não era explicitamente citada nos relatórios financeiros foram descartados. Este procedimento pôde eventualmente influenciar a pesquisa, porém a postura conservadora na classificação das empresas como usuárias ou não-usuárias de derivativos confere maior confiabilidade aos resultados de discriminação.
Ou seja, se por um lado este procedimento tende a diminuir o número de empresas não-usuárias levantadas, por outro lado tende também a diminuir o erro de classificação inicial da empresa, pois a falha na identificação de informação sobre derivativos pode, eventualmente, ser decorrente de um lapso na análise dos demonstrativos financeiros, dado o potencial de erro humano inerente à forma de coleta de dados.
A partir da lista das empresas para as quais havia informação sobre o uso de derivativos, foram levantados diversos indicadores financeiros. Utilizando-se o serviço de informações disponibilizado, via Internet, pelo MultexInvestor, foram obtidos para cada empresa dados sobre as perspectivas de risco, tamanho, valor, dividendos, rentabilidade, geração de caixa, crescimento, liquidez, endividamento e atividade.
Tendo em vista os recentes problemas enfrentados pelas corporações americanas, principalmente aqueles relacionados com governança corporativa, ética empresarial, compensação de executivos e uso de critérios contábeis, pode-se argumentar que indicadores baseados em dados de balanços patrimoniais e demonstrativos de resultados não são confiáveis. Porém, considerando-se que os critérios contábeis permitem uma relativa padronização dos relatórios financeiros, supõe-se que os dados coletados são apropriados para os objetivos deste trabalho.
A etapa de coleta de dados possibilitou o levantamento de um total de 351 empresas e 25 variáveis, dentre elas algumas categóricas, como, por exemplo, as referentes ao uso de derivativos, e outras métricas, principalmente aquelas relacionadas aos indicadores financeiros.
2.2 Tratamento dos dados e análise estatística
O tratamento e a análise inicial dos dados permitem a familiarização com as características da amostra, a identificação dos ajustes necessários para a
aplicação das técnicas estatísticas e a compreensão das potenciais limitações dos resultados.
Assim, o entendimento dos dados e das relações entre variáveis possibilita a especificação e o refinamento das técnicas quantitativas, conferindo subsídios para a formulação de perspectivas razoáveis para a interpretação dos resultados.
O caráter eminentemente complexo da análise multivariada exige muita cautela na avaliação dos resultados, uma vez que diversos aspectos devem ser levados em consideração de modo concomitante, como, por exemplo, desvios das premissas dos modelos multivariados, sensibilidade ao tamanho da amostra, influência de dados faltantes ou dos outliers etc. Em particular, o poder estatístico das técnicas multivariadas exige grande conjunto de dados e premissas mais complexas do que as necessárias em análises univariadas (HAIR et al, 1998).
A análise gráfica dos dados constitui importante atividade na pesquisa multivariada por possibilitar uma visão geral da amostra e das necessidades futuras de ajustes ou transformações nos dados.
Tendo sido conduzida uma examinação gráfica dos dados, ficou clara a necessidade de transformação de algumas variáveis para uma melhor adequação às premissas dos modelos de análise multivariada, principalmente se houver exigências de normalidade das distribuições das variáveis e de relações de linearidade entre variáveis.
Adicionalmente, outliers também foram encontrados na etapa de análise gráfica, sugerindo a condução de uma avaliação posterior mais apurada dos dados muito distantes da média amostral. Através de uma matriz de scatterplots, foi realizada também uma análise visual das relações entre as variáveis consideradas, obtendo-se evidências da existência de variáveis altamente correlacionadas que eventualmente podem subsidiar avaliações de multicolinearidade.
Após a realização da avaliação gráfica, foram conduzidos estudos analíticos sobre os dados coletados. Com relação aos missing data, o procedimento adotado na etapa de coleta de dados permitiu a exclusão das empresas cuja utilização ou não-utilização de derivativos não ficava explicitamente evidente a partir dos relatórios financeiros.
Para cada empresa cuja informação sobre utilização de derivativos era suficiente, grande parte das variáveis financeiras levantadas estava disponível e, portanto, não houve a necessidade de novas exclusões de casos da amostra.
Por outro lado, para algumas variáveis, diversos dados faltantes foram observados. Ou seja, o valor de algumas variáveis encontrava-se indisponível para grande parte das empresas. Variáveis contendo mais de 20% de dados faltantes foram excluídas do estudo, uma vez que poderiam reduzir consideravelmente o total de casos válidos para a análise multivariada.
Além disso, houve a preocupação em se manter variáveis altamente correlacionadas com as variáveis excluídas por excesso de dados faltantes, para que não houvesse prejuízo do poder explicativo das perspectivas financeiras sobre o uso de derivativos pelas empresas.
Considerando-se a análise preliminar de missing data, a amostra inicial foi reduzida, contendo 18 variáveis independentes e mantendo o número total de 351 observações.
É importante enfatizar, ainda com relação aos missing data, que um dos pontos de atenção em pesquisa envolvendo análise multivariada está relacionado com os motivos que levam à inexistência de alguns dados. Pela característica dos dados utilizados, o processo de missing data da pesquisa não está ligado, obviamente, às ações por partes de respondentes, como, por exemplo, recusa em responder algumas questões. Uma vez que a pesquisa baseia-se em dados obtidos a partir de demonstrativos e de provedores de informação de mercado,
os missing data decorrem principalmente da forma de disponibilização de dados por parte das empresas e do histórico armazenado para a análise.
Assim, dependendo dos dados fornecidos pelas empresas e dos mecanismos de obtenção de índices utilizados pelo provedor de informações, pode haver dados faltantes para determinadas empresas. Por exemplo, pode haver missing data em indicadores de geração de caixa, uma vez que dados para cálculo destes indicadores podem não estar disponíveis publicamente para todas as empresas. Além disso, algumas empresas podem não apresentar indicadores de rentabilidade histórica de médio prazo simplesmente porque foram constituídas recentemente.
Como o processo de missing data pode influenciar os resultados obtidos, é necessário que se avaliem os dados faltantes com relação à sua extensão e aleatoriedade. O procedimento anterior, referente à exclusão de variáveis, faz com que a influência dos dados faltantes tenha uma extensão que não compromete o tamanho da amostra considerada.
Foi realizado também um diagnóstico da aleatoriedade dos missing data através de examinação empírica, buscando-se avaliar se os dados faltantes estão distribuídos randomicamente entre casos e variáveis. Os resultados, para a maioria das observações e variáveis, indicam que o processo de missing data é aleatório, dados os baixos índices de correlação entre variáveis dicotômicas formadas através da substituição dos valores válidos pelo valor 1 e dos dados faltantes pelo valor 0.
Além disso, dividindo uma variável em dois grupos distintos, um deles contendo as observações com missing data para a variável e o outro grupo contendo as observações válidas, obtiveram-se resultados de diferenças de médias para as demais variáveis que, na maioria das vezes, não eram estatisticamente significantes quando se considera também um número mínimo de observações necessário para o cálculo de médias.
Porém, como era de se esperar, observou-se que o processo de missing data de algumas variáveis influenciam o processo de outras variáveis de forma significante, pois, por exemplo, o mesmo dado financeiro faltante pode ser necessário para o cálculo de diferentes indicadores. Assim, a amostra sugere a existência de vieses potenciais decorrentes dos dados faltantes.
Uma vez que o objetivo do estudo é identificar características das empresas que podem estar associadas à utilização de instrumentos financeiros para gestão de riscos, indicadores que representam conceitos semelhantes podem ser excluídos. Exemplificando, sendo o índice de liquidez corrente e o índice de liquidez seca variáveis altamente correlacionadas, com processos de missing data relacionados entre si, pode-se utilizar somente uma delas na análise multivariada. Desta maneira, pode-se melhorar não somente aspectos de aleatoriedade dos missing data, como também os aspectos de multicolinearidade.
Na pesquisa conduzida, decidiu-se não realizar nenhum método de imputação para a estimativa de missing values, como, por exemplo, métodos de substituição baseados em valores médios amostrais, valores constantes ou regressões. Obviamente, a decisão de eliminação de observações com dados faltantes diminui o número de casos válidos para a análise multivariada. Porém, considerando a amostra coletada e as variáveis relevantes, estabeleceu-se que o preenchimento de dados faltantes não traria benefícios suficientes para justificar sua realização.
Com relação aos outliers, foram conduzidas análises sob perspectivas univariada e multivariada. Outliers constituem observações com uma combinação única de características e eventualmente podem ser benéficas ou prejudiciais à análise multivariada. Assim, se por um lado, os outliers podem indicar características da população que não seriam descobertas normalmente, por outro lado, dados muito afastados da média podem não ser representativos da população e distorcer consideravelmente os resultados da análise (HAIR et al, 1998).
A avaliação efetuada identificou que os outliers unidimensionais encontrados na amostra decorrem principalmente de características específicas e extraordinárias das empresas. Mesmo considerando valores de referência conservadores, 33 casos poderiam ser classificados como outliers. Nestes casos, optou-se pela não-exclusão dos outliers, para não haver uma diminuição considerável do número de observações válidas. Além disso, a retenção dos outliers permite que a análise conduzida seja representativa de toda população e não apenas de um segmento. Obviamente, análises estatísticas específicas a serem realizadas posteriormente podem exigir a exclusão dos outliers para se evitarem distorções expressivas nos resultados.
Em termos multidimensionais, tendo em vista a utilização de níveis de significância mais conservadores e pela dificuldade de avaliação de representatividade da população, não se excluiu a priori nenhuma observação que poderia ser um potencial outlier. Optou-se, portanto, neste trabalho, pela visão de que a eliminação de outliers só deve ser realizada se houver alguma evidência muito clara de que o dado é aberrante, ou seja, que o dado não representa nenhuma possível observação da população.
Finalmente, com relação às principais premissas da análise multivariada, buscou-se realizar uma avaliação de normalidade, homocedasticidade, linearidade e multicolinearidade das variáveis relevantes. A análise de curtose e assimetria das distribuições mostrou valores significativamente diferentes de zero para a maioria das variáveis. O teste de Kolmogorov-Smirnov para uma amostra reforçou as evidências de que a distribuição de praticamente todas as variáveis diferia significativamente da normal.
Em decorrência das distribuições das variáveis, a homocedasticidade de potenciais variáveis dependentes também não foi verificada. Com relação à linearidade, a análise gráfica sugere a existência de relações lineares entre várias variáveis, bem como a existência de algumas relações não-lineares. Foram também identificados indícios de multicolinearidade, devido à presença de elevada correlação entre algumas variáveis. Como discutido anteriormente, diversos indicadores financeiros são derivados dos mesmos dados contábeis e
de mercado, aumentando a probabilidade de existência de variáveis correlacionadas e implicando limitada contribuição marginal de variáveis pertencentes a uma mesma dimensão financeira. A análise das características dos indicadores financeiros das empresas é importante para ampliar as limitações das técnicas quantitativas utilizadas.
As principais análises estatísticas conduzidas foram a análise de diferenças de média, a análise discriminante e a regressão logística. Através das diferenças de média pôde-se descobrir se os diferentes grupos, ou seja, empresas usuárias e empresas não-usuárias de derivativos, possuem características financeiras distintas. A análise discriminante e a regressão logística buscaram identificar quais indicadores financeiros teriam maior relevância para a separação dos grupos.
Uma vez que o objetivo não é a predição ou a classificação de observações, a interpretação das análises multivariadas está direcionada para a separação ou discriminação de observações através da avaliação da significância e do sinal dos coeficientes das equações discriminantes.
Como é usual em análises multivariadas, a avaliação dos dados mostrou que diversas variáveis não obedeceram estritamente às premissas dos modelos, mesmo realizando-se ajustes ou transformações. Portanto, os resultados obtidos podem ser influenciados pelo grau com que as características da amostra distanciam-se das premissas teóricas.
Desta maneira, apesar de diversas simulações terem sido realizadas visando ao aprimoramento dos resultados, sempre haverá restrições sobre a validade e significância dos resultados devido à violação de algumas premissas. Supõe- se, porém, que, em linhas gerais, para a finalidade das investigações deste trabalho, os resultados qualitativos podem ser adequadamente fundamentados pelas análises estatísticas efetuadas.