Potansiyel Küme Gruplarındaki Ana Sektörlerin Bölgedeki Durumu

4. İSTATİSTİK ANALİZ

4.2. İsta s ki Analiz Çalışmasının Sonuçları

4.2.2. Potansiyel Küme Gruplarındaki Ana Sektörlerin Bölgedeki Durumu

Com o objectivo de dotar o estudo de consistência empírica, r ecorremos, à análise em componentes principais. Esta é uma forma de identificar variáveis que "seguem juntas", isto é, que apresentam uma estrutura subjacente comum, condensando, assim, uma quantidade assinalável de variáveis observadas, num número mais reduzido de componentes. Estes últimos representam as dimensões latentes – constructos – que sintetizam e explicam o conjunto das observações e descrevem os dados através de um número menor de conceitos, do que as variáveis individuais originais. Logicamente, o questionário foi a fonte de onde brotaram as questões que nos pareceram mais pertinentes e ajustadas às variáveis selecionadas (ver Apêndice 7 e Apêndice 10).

Uma pesquisa apurada acerca dos softwares existentes no mercado, conduziu-nos ao IBM SPSS Statistics – Versão 20. Essa é a ferramenta que preside aos trabalhos de análise em componentes principais dos dados, que se seguem. Note-se que o software inclui o pacote de Análise em Componentes Principais (ACP), em conjunto com a análise factorial, por serem técnicas semelhantes

das prestações de serviços), em detrimento do balanço total (reflexo do património global da empresa).

RESULTADOS: APRESENTAÇÃO E ANÁLISE

164

quanto à interpretação, embora tenham pressupostos e técnicas de construção completamente díspares.

A ACP é um método estatístico multivariado, cujo propósito é criar um conjunto de novas variáveis – as Componentes Principais (CP) – ortogonais entre si e onde o método de construção é iterativo e maximiza a variância inicial. Com este método de construção, a primeira componente é a que tem maior valor explicativo sobre a variação total dos dados iniciais, ao que se lhe segue a segunda componente, e assim sucessivamente. Desta forma, podemos controlar a quantidade de variância inicial explicada, e reter, tão só, as componentes necessárias e mais adequadas ao que o investigador pretende, porém, utilizando muito menos variáveis. Para além da redução dos dados, uma das suas principais vantagens é permitir sumariar a informação redundante (variáveis iniciais correlacionadas), em combinações lineares independe ntes (CP), que representam a maior parte da informação original.

A análise em componentes principais é uma técnica que requer amostras de grande dimensão porque baseia-se na matriz de correlação das variáveis envolvidas e as correlações, geralmente, necessitam de uma amostra considerável antes de se estabilizarem. Em termos teóricos, o tamanho da amostra é, pelo menos, suficiente para a aplicação da ACP, na medida em que os 358 casos válidos enquadram-se dentro dos padrões estabelecidos na literatura (Little et al., 1999; Tabachnick e Fidell, 2001; Hair e Tatham, 2007). Mas para determinar se a ACP é efectivamente uma técnica apropriada para surtir os efeitos pretendidos, lançámos mão de testes estatísticos para determinar se as variáveis estão significativamente correlacionadas, nomeadamente, os testes de Kaiser-Meyer- Olkin (KMO) e da Esfericidade de Bartlett.

O teste de KMO compara as correlações entre as variáveis e tem uma escala classificativa para a adequabilidade que varia entre 0 e 1 (ver Apêndice 9). Valores próximos de 1 significam que as variáveis estão bastante correlacionadas (Little et al., 1999; Hair e Tatham, 2007), o que é excelente. Neste caso o seu valor é de 0.647 (ver Apêndice 8), concluindo-se que o grau de adequabilidade da ACP aos dados é razoável. Complementarmente, pela leitura da linha diagonal da

RESULTADOS: APRESENTAÇÃO E ANÁLISE

165

matriz anti imagem da matriz de correlações (ver Apêndice 16), com excepção da variável “nível da procura”, todos os valores são superiores a 0,5; por outro lado, os restantes valores da matriz são baixos. Estas duas constatações reforçam a validade do teste KMO.

O teste de Bartlett testa a hipótese de a matriz de corr elações ser uma matriz identidade e o seu determinante ser igual a 1, ou seja, de as variáveis não estarem correlacionadas entre si. Atendendo ao nível de significância (Sig) podemos constatar que o seu valor é aproximadamente zero (para três casas decimais), inferior ao valor crítico (p < 0,05). Da observação dos resultados (ver Apêndice 8), temos que: p = 0 e [chi2 (435) = 3638,053; p menor que 0.001], ou seja, o teste é altamente significativo, levando-nos a rejeitar a hipótese nula (a matriz de correlações não é uma matriz identidade). Assim, existem relações entre as variáveis que se espera incluir na análise e a técnica ACP é apropriada neste caso.

Da matriz anti imagem da matriz de correlações (ver Apêndice 16), optou-se por não eliminar nenhuma das variáveis, pois que, na sua diagonal principal, todas as trinta apresentam valores adequados (> 0,5) e a remoção de algumas com os valores mais baixos, certamente não traria alterações relevantes, nem vantajosas.

Para seleccionar as combinações lineares (rectas) de todas as variáveis iniciais, que descrevam grande parte da variância dos dados – as CP – optou-se pelas dez que, no seu conjunto, explicam aproximadamente 70% da v ariância total – 67,305% (ver Apêndice 17). A extracção foi fruto da aplicação do critério de kaiser – que remete para componentes com valores próprios – eigenva lues –

superiores à média, isto é, superiores a 1.

Por outro lado, também a matriz de comunalidades116 apresenta extracções com valores sempre superiores a 0,5 para todas as variáveis iniciais, o que se considera aceitável117 (ver Apêndice 12), mas ressalva-se que os valores também

116_{Comunalidade é a proporção da variância individual de cada variável inicial, que é}

explicada pelas componentes retidas; corresponde à soma dos quadrados das correlações entre a componente em questão e as variáveis iniciais .

117

Se a comunalidade é inferior a 0,5, signific a que as CP extraídas não explicam nem 50% da variância daquela variável, sendo preferível analisá-la separadamente.

RESULTADOS: APRESENTAÇÃO E ANÁLISE

166

são sempre inferiores a 0,8, o que está longe de ser excelente. Neste caso, o valor da comunalidade apresentado no quadro representa a percentagem da variância da variável original que é explicada pelas componentes retidas, verifica-se quanto da variação das variáveis originais é explicada pelas componentes e não o contrário.

Outro critério de selecção possível, para identificar o número óptimo de componentes a reter, seria o do scr ee plot através da sua observação gráfica (ver Apêndice 18). Identificar-se-ia a percentagem da variância explicada por cada componente (o valor próprio) e quando este se reduzisse significativamente e a curva passasse a ser quase paralela aos eixos das abcissas, retinham -se os do lado esquerdo do gráfico e excluir-se-iam as restantes CP. Porém, desta forma, apenas seriam retidas as sete primeiras componentes (as mais robustas), mas que, no entanto, apenas explicariam cerca de 50% da variância total, o que do nosso ponto de vista, seria manifestamente insuficiente.

Então, o critério escolhido assoma-se-nos ser o mais credível para estender inferências à restante população e adequado para a validação dos resultados , visto que a perda de informação não foi muito acentuada ( aproximadamente 33%) e as variáveis iniciais viram-se reduzidas em aproximadamente 67%. Estes dez componentes são representativos da totalidade das trinta variáveis expurgadas do questionário, com perda de apenas 33 % da informação original.

Após a extracção inicial de CP e atendendo ao facto de estes serem combinações lineares independentes (das variáveis iniciais correlacionadas), optámos por aplicar o tratamento de rotação ortogonal Varimax118. Visou-se optimizar a estrutura factorial e consequentemente, equilibrar a importância relativa das componentes remanescentes. Simplificando a matriz de componentes

118_{Um dos pressupostos quando se aplicam rotações do tipo ortogonal}_{– varimax ou}

equimax – é que os factores estejam correlacionados entre si. Caso se tratasse de factores correlacionados, poderíamos aplicar rotações oblíquas , tais como a promax ou oblimin. A escolha não se faz, porém, sem alguma polémica. Certos autores defendem que nas ciências sociais, pura e simplesmente, não existem const ructos que não se relacionem com outros constructos, e que por isso, certas colecções de dados jamais se deveriam submeter a rotações ortogonais. Então, rotações oblíquas como a promax, por exemplo, seriam sempre preferíveis. Estes métodos foram construído s com base na análise factorial mas aplicam -se perfeitamente à análise de componentes principais.

RESULTADOS: APRESENTAÇÃO E ANÁLISE

167

facilita-se a sua interpretação e a identificação das variáveis que compõem as componentes, ou seja, as que têm uma maior correlação – tanto positiva, como negativa – com as componentes. Os valores obtidos (ver Apêndice 20) são todos consistentes com o mínimo aceitável para a ACP – superiores a 0,5.

A percentagem da variância da solução inicial, de cada componente retido, era de 13,167; 10,346; 8,950; 7,736; 6,302; 5,593; 4,662; 3,698; 3,514; e 3,337. Após a rotação, obtiveram-se valores mais “alisados”, respectivamente, 9,031; 8,425; 8,031; 6,907; 6,853; 6,520; 5,796; 5,599; 5,534; 4,608. Apesar da correlação linear entre os componentes ser garantidamente igual a zero, foi verificada a plot de scor es dos componentes e confirmou-se a inexistência de outliers e associações não-lineares entre eles.

Belgede İzmir Kümelenme Analizi (sayfa 30-44)