A análise e construção de redes complexas correspondem à etapa 5 dos procedimentos metodológicos ilustrados na Figura 16c.
Figura 16c- Etapa 5 da metodologia Fonte: autoria própria
A modelagem de redes complexas possibilita visualizar o grau de interação entre os indivíduos na comunidade de aprendizagem e especificamente em fóruns de discussão, já
135
que uma rede pode modelar sistemas reais e investigar suas características intrínsecas (NEWMAN, 2003), (NEWMAN; GIRVAN, 2004).
A Figura 21 mostra uma representação visual do tipo de rede complexa que será aplicada neste estudo. Uma rede é constituída de um conjunto de vértices (nós) representados como círculos e um conjunto de arestas (linhas que conectam os vértices) e que estabelecem algum tipo de relação entre eles de acordo com o problema modelado. (METZ et al. 2007). No exemplo, as arestas são direcionadas, ou seja, apresentam uma ligação com direção e sentido (setas que saem de um vértice e entram em outro).
Figura 21- Representação visual de uma rede direcionada
Fonte: Ronqui (2014, p.29)
A construção da estrutura visual das redes complexas permite avaliar o fluxo de mensagens postadas nos fóruns de discussão, (corpus), e, quando necessário, torna-se capaz de identificar os alunos ou grupos de mensagens com maior similaridade entre si. Essa influência em maior ou menor grau é calculada a partir de uma série de medidas como similaridade e centralidade (betweenness centrality) sendo que, a última, que fornece informação de que nós com centralidade alta estão no caminho que conecta comunidades, distintas (MOTTA; LOPES; DE OLIVEIRA, 2009). Esse resultado, aplicado ao estudo dos fóruns, indica que o aluno com centralidade alta, provavelmente, mescla opiniões de comunidades distintas às quais se conecta. (FREEMAN,1977).
O corpus (conjunto de textos que serve como base de análise) é pré-processado com técnicas de mineração de texto, de acordo com a proposta de Feldman e Sanger (2006), incluindo a remoção de termos comuns (stop words) da língua portuguesa, como, preposições e, conjunções, e lematização das palavras restantes, para o agrupamento de conceitos que apresentavam a mesma forma canônica, mas apresentavam flexões diferentes (por exemplo, "fizeram" e "fazem" que correspondem ao lema "fazer"). São removidos
136
também os prefixos ou sufixos de um termo e os verbos transformados para sua forma de infinitivo, outras palavras também são transformadas para um mesmo stem, como por exemplo, as palavras: produzir, produzindo, produção, produto, produtos, passa para o mesmo stem “prod”, e isso reduz a dimensão da Tabela atributo-valor com base em Feinerer (2010).
O próximo passo é calcular a similaridade e para isso é utilizada uma matriz atributo-valor (bag of words) que é gerada com base na frequência relativa (por texto) dos termos (MATSUBARA; MARTINS; MONARD, 2003). Em seguida, para cada grupo de mensagens pertencentes a um mesmo tópico aplicado a uma mesma turma, mensagens são comparadas entre si, segundo a ordem com que foram postadas e considerando a medida de similaridade do cosseno. O cálculo do Cosseno mede basicamente o ângulo entre os vetores que representam textos na forma de bag of words. A medida do Cosseno retorna um valor entre 0 e 1. Quanto mais próximo de 1, maior será a similaridade entre as mensagens dos alunos (i, j) (HUANG, 2008).
Na modelagem dos fóruns em redes complexas, cada palavra é um vértice (um nó) que representa o autor de uma mensagem, um aluno, e as arestas representam a similaridade entre os textos de um autor i e um autor j.
O grau de similaridade está codificado no peso da aresta, pois quanto mais espessa a aresta, maior a similaridade. As arestas são direcionadas seguindo a ordem de postagens dos autores: se um autor i postou antes do autor j então a direção da aresta será de j para i indicando a similaridade do texto de j (citante) em relação ao texto de i (citado).
Um exemplo da ligação entre dois nós é dado na (Figura 22)
Figura 22- Esquema de ligação em redes complexas
Fonte: Adaptado de Sousa (2013, p.32)
Onde: a direção da aresta indica que o aluno i teve parte do seu texto citado pelo aluno j; a espessura da aresta indica o grau de similaridade entre as mensagens.
137
Dessa forma a partir da rede, cria-se uma estrutura visual que permite ao professor observar características, como:
Hubs: os nós de maior grau são chamados de hubs. Em uma rede direcionada (Figura 23) podem existir hubs com alto grau de entrada (arestas que apontam para o nó) ou alto grau de saída (arestas que partem do nó). A análise da presença de hubs na rede informa quais alunos que muito ou pouco contribuíram no tópico.
Peso das arestas: codifica o grau de similaridade entre as mensagens de dois alunos. Esse peso é representado pela espessura da linha (Figura 23), e assim quanto mais espessa a linha, maior a similaridade, indicando o grau de influência do autor/aluno i (para o qual a aresta aponta) na mensagem de um autor j (do qual parte a aresta).
Figura 23: Presença de hubs e pesos das arestas em redes complexas
Fonte: Adaptado de Sousa (2013, p.32)
A Figura 23 ilustra a ocorrência de hubs na rede, e a disposição dos graus de similaridade. Por exemplo, o aluno i possui alto grau de entrada (arestas que chegam até ele), indicando que i influenciou as mensagens de muitos mais alunos se comparado com o aluno j, que possui menor grau de entrada. Já o aluno l apresenta um alto grau de saída em comparação com o aluno k, indicando que sua mensagem recebeu influência de muitos outros alunos. O peso das arestas indica o grau de similaridade entre as mensagens. Assim, uma aresta com peso alto (maior espessura) indica que esse aluno citou muitas palavras de um único aluno (aquele que faz parte da ligação nessa aresta). O alto grau de similaridade pode ser notado na Figura 24, na aresta de maior espessura que sai do aluno l, esse é um exemplo do grau de influência recebida por esse aluno.
138
O esquema de ligação apresentado na Figura 24 é um exemplo de formação de arcos na rede, isso acontece quando mais de uma mensagem de um aluno foi referenciada por outro aluno. Trata-se, portanto, de múltiplas arestas que partem de um mesmo nó origem para um mesmo nó destino e podem indicar a quantidade de postagens de um determinado aluno.
Na Figura 24 nota-se que o aluno j foi altamente influenciado pela mensagem de i, pois a aresta que liga ambos os alunos possui maior espessura, indicando um alto grau de similaridade. O aluno k postou duas mensagens que também influenciaram o texto de j, porém com menor peso, se comparado ao aluno i.
Figura 24: Esquema de ligação entre os nós da rede
Fonte: autoria própria
Na Figura 24 o esquema de ligação entre os nós da rede é assim descrito: o sentido da aresta indica que o nó de origem citou parte do texto do nó de destino; a espessura da aresta indica o grau de similaridade entre as mensagens; a quantidade de arcos indica que determinado autor citou ou foi citado em mais de uma mensagem.
As equações que definem as medidas de similaridade, centralidade e a matriz atributo-valor para as redes complexas desse estudo de caso, são apresentadas no (ANEXO A).
A Figura 25 ilustra as etapas do processo de construção das redes complexas que envolvem o uso de técnicas de mineração de textos, ferramentas e algoritmos para o pré- processamento das mensagens, e para desenvolvimento de cálculos de similaridade e centralidade nas redes complexas.
139
Figura 25- Etapas do processo de construção das redes complexas
Fonte: autoria própria
A proposta deste trabalho é retornar as redes complexas relativas aos fóruns de discussão para auxiliar o professor durante a avaliação dos alunos. Nesse sentido, o próprio grau de similaridade entre mensagens será utilizado para se desvendar um possível grau de relacionamento entre os autores das mensagens dentro de um mesmo tópico de discussão.
Por meio de redes complexas, intenciona-se prover um recurso visual, no qual a estrutura da rede propriamente dita é utilizada de forma a complementar aos dados numéricos, permitindo que o avaliador perceba os possíveis eventos mais relevantes em uma discussão.
No próximo capítulo são apresentados os resultados da análise textual dos dados e da análise estatística descritiva organizados por disciplinas (PO) e (AVA) e por ano (2011, 2012 e 2013).
140 CAPÍTULO 5
5 Resultados