Em meio a uma rede permeada por dados e informações com acesso aberto ou não, ainda há grandes dificuldades para coletá-los e tratá-los adequadamente. Nada obstante, se por um lado as novas tecnologias e os procedimentos de administração de informações e comunicação causaram este aumento no volume de informações disponíveis, é também através deles que provavelmente se encontrará as soluções para dominar e usufruir desta imensidão de dados (DOWBOR, 2003).
Nesta perspectiva, a mineração de dados, aqui representada pelos scripts desenvolvidos, surgem para que que se tenha acesso e possibilidades de manipulação desses dados. Cada script (software) permitiu isoladamente ou associado com os demais, possibilidades de processar a conversão de dados em informação e conhecimento. Atualmente, tais processos de conversão são necessários em todas as esferas do processo de avanço científico e tecnológico, podendo ser mensurados mediante a construção de indicadores que permitem várias formas de visualização e representação das informações coletadas. E ao serem realizados com periodicidade e com fontes de informação de longo
26 Em “http://vlab4u.info/nano2014/” é possível acompanhar os dados utilizados e outros resultados
potenciais.
27 Os dados utilizados para o corpus foram os títulos das publicações ou resumos. O Iramuteq é um programa
de computador para analise textual baseado em estatísticas (utilizando o software estatístico R) que analisa relações e outras características textuais, o posicionamento, frequência e a estruturação de palavras no texto, de forma que sejam retornados indicadores e visualizações sobre a estrutura e ambientes do texto analisado. Há cinco tipos de análises no Iramuteq: estatísticas textuais, especificidades e AFC, CHD, análise de similitude, nuvem de palavras, cada uma com suas características e especificações. O Iramuteq faz as análises textuais pelas proximidades de relações se baseando na construção textual, mas não com base nos significados das palavras (semântica).
28 BASTIAN, M.; HEYMANN, S.; JACOMY, M. Gephi, an open source graph visualization and manipulation
alcance (há dados de publicações desde 1964 na BCL, por exemplo), os indicadores podem propiciar uma utilização mais sistemática das evidências históricas para a formulação de política científica (BELOFF, 1968; CAMPBELL, 2010).
Ainda hoje no Brasil ocorrem mudanças nas formas de organização das atividades científicas e tecnológicas, nas instituições que produzem conhecimento, assim como nos instrumentos, processos e procedimentos que têm por objetivo planejar e gerir as atividades relacionadas à C&T. Todas elas têm gerado um grande grau de incerteza sobre os caminhos mais adequados para planejar, conduzir e avaliar as atividades científicas e tecnológicas (CGEE, 2008).
A Figura 10 sintetiza os principais procedimentos referentes a esta pesquisa na seguinte ordem: os scripts programados, os dados coletados, os potenciais indicadores e as possibilidades de visualização das análises. Nesta representação é possível compreender a dinâmica da principal proposta em questão (elaboração de uma sistemática), ou seja, facilitar a apropriação de informação e conhecimento para sanar necessidades reais de processos como o de tomada de decisão na esfera da C&T.
A análise automatizada é requerida pela necessidade da mineração e seleção de um abrangente conjunto de dados com objetividade (DOWBOR, 2003). É utilizada cada vez mais e principalmente em operações que envolvem grandes capacidades de processamento. O presente trabalho utilizou ferramentas livres para realização da extração de dados e informações de bases de dados de acesso aberto.
A análise humana também foi representada (na Figura 10) e contempla os procedimentos de analise e tratamento realizado por seres humanos, pois é exigida capacidade cognitiva mais sofisticada para criar conexões entre os dados, na qual ressalta-se o empenho de objetividade e foco à resolução de problemas, no caso deste trabalho são aqueles voltados para C&T (TAVARES; PIMENTEL; ARAUJO, 2012).
Fonte: Elaboração própria
Ao passo em que se obtém a junção das análises automatizadas e humanas é possível ressignificar ou até mesmo encontrar novos sentidos para o objeto analisado mediante a construção de indicadores que viabilizam: as representações visuais e suas técnicas de visualização da informação; as análises estatísticas realizadas via softwares específicos em algumas análises (textuais por exemplo); as análises de redes de colaboração mediante a criação de grafos que ilustram conexões e suas frequências; dentre outros. A multiplicidade de indicadores oportunizam uma visão mais holística e integrada do tema abordado, favorecendo análises com maior robustez e completude.
Por fim, indicadores podem alterar o sistema através dos incentivos que estabelecem, e estes efeitos podem ser antecipados. Isso significa que é sempre preferível usar um conjunto de indicadores. O uso de um único indicador pode levar a erros de interpretação. Lembrando que a missão de uma pesquisa e os objetivos da avaliação mudam e o sistema de pesquisa também evolui. Assim, indicadores devem ser revisados e por vezes modificados (HICKS, 2015).Desta maneira todo o detalhamento das informações transformadas em indicadores em C&T apresentado por Aguiar (1991), bem como nesta sistemática, cumprem a função de subsidiar os desenvolvimentos em Ciência e Tecnologia.
Assim, ao se utilizar as fontes de informação e os procedimentos apresentados (Figura 10), descortinam-se oportunidades de apropriação de um conjunto singular de indicadores sobre C&T. É possível manusear dados e informações sobre: as pessoas que compõem a C&T com a Base de Currículos Lattes; o agrupamento dessas pessoas no Diretório de Grupos de Pesquisa; o conhecimento acadêmico pesquisados nas universidades com a Biblioteca Digital Brasileira de Teses e Dissertações; e as aplicações tecnológicas da área com a base de patentes Espacenet. A seguir apresenta-se um exemplo de como isso é possível na prática e para a área objeto deste estudo, a nanotecnologia.