1.2. SERMAYE YAPISI UNSURLARI
3.2.2. Türkiye’de Sermaye Yapısı Kararlarını Etkileyen Faktörler
A recolha e a cumulação de dados, referentes a todos os aspectos da vida humana, do que existe e do que se faz, são uma das características mais mar- cantes da sociedade actual, também conhecida justamente por sociedade da informação. As superfícies, os volumes, as temperaturas, as velocidades, são indicadores de quantificação de tudo o que existe. Desde a órbita dos planetas
156 António Fidalgo
à estrutura dos átomos, do macro ao micro, inventaria-se progressivamente tudo o que é sólido, líquido e gasoso. E o mesmo se diga do que se faz, o que se compra nos supermercados, o combustível que se mete no carro, as idas ao médico, o que se receita, os consumos de água e de energia, as taxas de natalidade e de mortalidade, as sondagens de opinião e os índices de confi- ança. Segundo Eric Schmidt, Chief Executive da Google, existiam indexados em 2005 cerca de 170 terabytes de informação dos aproximadamente 5 mi- lhões de terabytes de informação existentes no mundo, levando ainda cerca
de 300 anos a indexá-la toda.1 Valendo o que valem tais números, sobretudo
o referente à informação efectivamente possível, o que é um facto a reter é o progressivo registo informático de tudo o que existe e ocorre no universo.
Os armazéns de dados, data warehouses, fazem a integração de dados provenientes de diferentes bases de dados e separam os dados, vindos de uma mesma fonte; num e noutro caso de modo a possibilitar o seu processamento. Os terabytes de informação que esses armazéns contêm são de facto mons-
truosos (tera significa em grego monstro!).2 O data mining ou a mineração
de dados, enquanto conceito para explorar essa mole imensa de informação, é uma metáfora feliz porque é também no âmago da terra que se encontram ri- quezas consideráveis, dos diamantes ao petróleo, sendo necessário minar pela terra dentro para os extrair das profundezas recônditas em que se encontram.
A definição comum de data mining é a retirada do artigo de Fayyad et alt., “From Data Mining to Knowledge Discovery in Databases”: “a extrac- ção não trivial, a partir de dados, de informação implícita, desconhecida e
potencialmente útil”.3 Tal extracção não pode, face à imensidão dos dados,
ser feita humanamente (manualmente). Com efeito, hoje deparamos com ba-
1 http://news.com.com/Google+ETA+300+years+to+index+the+worlds+info/2100-
1024_3-5891779.html?part=rss&tag=5891779&subj=news
2A Enciclopédia Britânica, tida com um dos repositórios tradicionais do saber, cabe em 3
simples Cds de 700 MB cada, o DVD do nosso filme preferido chega no máximo a 4,7 GB, 60 dias de música ininterrupta em formato mp3, qualidade de 192 vbr, não chega aos 100 GB.
3 O artigo de Fayyad começa da seguinte forma: “Across a wide variety of fields, data
are being collected and accumulated at a dramatic pace. There is a urgent need for a new generation of computational theories and tools to assist humans in extracting useful information (knowledge) from the rapidly growing volumes of digital data. These theories and tools are the subject of the emerging field of knowledge discovery in databases (KDD).” W. Frawley and G. Piatetsky-Shapiro and C. Matheus, Knowledge Discovery in Databases: An Overview. AI Magazine, Fall 1992, pages 213-228.
Data Mininge um novo jornalismo de investigação 157
ses de dados com um número de objectos na ordem dos mil milhões, 109
, cada objecto contendo múltiplos campos, que podem ir às centenas ou aos milha- res. O processo de escavação e de análise de dados tem necessariamente de ser automatizado por programas informáticos.
Convém aqui explicar um pouco mais o que é a mineração de dados, distinguindo-a de uma simples consulta ou pesquisa, query, ou do On-line
Analytical Processing(OLAP). Uma consulta numa base de dados é quando
se faz uma pesquisa por um determinado campo, por exemplo saber quais os alunos de um curso matriculados numa determinada disciplina. Ora enquanto a pesquisa tradicional de uma base de dados é saber o que é que lá se encontra, o OLAP procura responder porque é que certas coisas são verdadeiras, ou seja, porque é que verificam tais e tais relações e não se verificam outras. Num pro- cedimento analítico da base de dados o utilizador formula uma certa hipótese sobre uma relação entre dados, por exemplo se a elevada incidência de uma doença na população de uma região tem alguma correspondência com algum hábito alimentar peculiar ou com algum outro factor específico da região, e verificar a validade dessa hipótese com sucessivas pesquisas de teste (contra- pesquisas) à base de dados. O que caracteriza a consulta e o procedimento analítico é a interactividade do utilizador e do sistema. Ora enquanto o OLAP consiste em testar modelos hipotéticos, elaborados previamente, a mineração de dados usa os próprios dados para descobrir esses modelos, muitas vezes insuspeitados. Enquanto o OLAP é de natureza dedutiva, o Data Mining é um processo indutivo.4
“A maior automatização do Data Mining resulta em três vantagens prin- cipais. A primeira é não exigir tanto tempo de trabalho de especialistas como o que uma análise interactiva (baseada em consultas individuais escolhidas caso a caso) de um grande volume de dados pode implicar. A segunda é um ganho de capacidade de extracção de conhecimento, devido a ser possível tes- tar um número muito mais vasto de hipotéticas relações interessantes ao nível dos dados do que seria possível se essas hipóteses tivessem de ser directa-
4“The OLAP analyst generates a series of hypothetical patterns and relationships and uses
queries against the database to verify them or disprove them. OLAP analysis is essentially a deductive process. (...) Data mining is different from OPAL because rather than verify hy- pothetical patterns, it uses the data itself to uncover such patterns. It is essentially an inductive process.” de Introduction to Data Mining and Knowledge Discovery de Two Crows Corpora- tion, www.twocrows.com/intro-dm.pdf.
158 António Fidalgo
mente sugeridas ao sistema de pesquisa (e os seus resultados tivessem de ser directamente avaliados) por especialistas humanos. A terceira vantagem, mais subtil, é que ao testarem automaticamente conjuntos exaustivos de possíveis padrões, os sistemas de KDD tem mais probabilidades de testar e encontrar conhecimento inesperado (e inovador) do que se pode esperar de consultas in- teractivas sugeridas com base no conhecimento sobre o domínio previamente existente.”5
A questão essencial para o jornalismo é que a mineração de dados dá azo a informações inesperadas, à descoberta de relações que deixam por vezes literalmente uma pessoa de boca aberta, de espanto face à novidade que apre- sentam. Por outro lado, tais relações são as causas ou os motivos por que se verificam certos acontecimentos ou procedimentos que à primeira vista sur- gem como fruto do acaso.
A mineração de dados é hoje um instrumento precioso para as actividades comerciais, em particular para a banca, os seguros e a venda de retalho. As
loyalty cards ou os cartões de fidelidade comuns nas gasolineiras e nos su-
permercados servem justamente para permitir traçar perfis de consumo e de consumidores, ao longo de sucessivas compras e permitir uma maior eficiên- cia de algoritmos de procura e de estabelecimento de padrões.