PROFESÖR KADROSUNA ATANMA İÇİN:
8. KURUM DESTEĞİ VE PARASAL KAYNAKLAR
Um dos principais recursos trazidos pelo Modelo e que é implementado pela Arqui- tetura Digital Class é a predição de desempenho do estudante. Nesse estudo foram utilizados duas técnicas para se obter esse resultado. A primeira, Regressão Logística Linear e a segunda SVD++.
Foram utilizados dados que registraram a interação dos estudantes com o sistema. Inicialmente foram coletados os dados de acesso e uso do sistema de ensino virtual de 71 estudantes, do início do semestre letivo 2017.1 até a segunda avaliação bimestral (final do semestre). Ao todo foram abordados 10 temas, que para fins de praticidade na análise, foram codificados na sequência de 1 a 10.
Tabela 2 – Conteúdos abordados. Notação Conteúdo
1 Notação Científica.
2 Metodologia de Investigação: A procura de regularidades e de sinais na interpretação física do mundo. 3 Leis de Newton
4 Movimento retilíneo uniformemente variado. 5 Movimento retilíneo uniforme.
6 Movimentos verticais: Queda livre.
7 Movimentos verticais: Lançamento vertical. 8 Movimentos verticais: Horizontal e oblíquo. 9 Equação de Torricelli.
Os estudantes foram codificados de acordo com o ID usado pelo sistema de ensino, no anexo segue a tabela contendo todos os IDs e nomes dos estudantes que participaram do estudo.
Inicialmente, é necessário calcular uma performance de desempenho com base nos dados observados que o sistema de ensino fornece. Para cada estudante em um determinado conteúdo i, o sistema de ensino fornece três informações básicas:
• q: O número de questões resolvidas no conteúdo i.
• t: Quantidade de tentativas feitas para resolver as n questões no conteúdo i.
• a: Quantidade de acertos dentro das n questões resolvidas desse mesmo conteúdo i. Segue a Tabela 3 temos o exemplo dos estudantes a , b e c no Conteúdo 2:
Tabela 3 – Relação entre estudante × tentativa × acerto de questões IDestudante quesT2 tentC2 acertosC2
a 5 5 5
b 5 9 3
c 2 2 1
A Tabela 3 indica que o estudante a resolveu 5 questões com 5 tentativas e acertou todas as 5 questões, o que indica que ele acertou cada uma das questões na primeira tentativa. Já o estudante b precisou de 9 tentativas para resolver o mesmo numero de questões que o estudante a e, mesmo assim, só acertou 3 questões das 5 totais. Isso indica que o nível de proficiência do estudante b é menor que o do estudante a, no conteúdo em questão. Porém, os aluno a e b indicam ter maior nível de proficiência no conteúdo 2 do que estudante c, que resolveu apenas 2 questões.
Dessa forma, para cada aluno, a performance de desempenho em cada conteúdo foi calculada da seguinte forma
p = a t + q µq
No intuito de padronizar a performance de desempenho de cada estudante dentro do intervalo (0,1), o valor p definido acima foi dividido pelo valor p máximo encontrado dentro dos dados observados Dtreino.
Voltando ao exemplo definido acima, supondo que a média geral µqtenha sido de 6 questões por aluno, as performances de desempenhos dos alunos a, b e c no conteúdo 2 ficariam: Tabela 4 – Relação entre estudante x tentativa x acerto de questões x nota Geral x Nota Padroni-
zada
IDestudante quesT2 tentC2 acertosC2 notaGeral notaPadr
a 5 5 5 1,83 1
b 5 9 3 1,17 0,64
c 2 2 1 0,83 0,45
Assim sendo, segue a Tabela 5 contendo a matriz X de performances observadas e não observadas:
Tabela 5 – Matriz esparsa com as 10 primeiras observações das performances observadas. ID estud. notat2 notat4 notat15 notat85 notat86 notat87 notat88 notat89 notat90 notat91
6 0,15 0,1 0,31 0,05 0,11 11 0,38 0,15 0,54 0,05 12 0,37 0,36 0,49 0,72 0,23 13 0,36 14 0,22 0,35 0,15 0,21 15 0,48 0,05 0,05 16 0,42 17 0,4 19 0,27 24 0,44 .. . ... ... ... ... ... ... ... ... ... ...
Tem-se que 65,77% dos dados observados são desconhecidos.
A Técnica SVD++
Para a construção do modelo de previsão, a implementação do algoritmo foi feita com os dados observados e importados em forma de lista. Para o conjunto de treinamento foram usadas 196 observações (performances observadas). Do total de 75 estudantes considerados no estudo, foi verificado que, para cada tema, há no mínimo 2 observações de desempenho e no máximo 62 observações.
Tabela 6 – Número de performances observadas por cada conteúdo
Temas c1 c2 c3 c4 c5 c6 c7 c8 c9 c10
Node
obs 62 24 15 28 32 1 26 1 5 2
A Tabela 7 exibe algumas tuplas do conjunto de dados de treinamento, Dtreino.
Tabela 7 – Amostra de tuplas dos dados que do conjunto de treinamento Dtreino Observação IDestudante IDconteudo notaPad
(tupla) 1 13 1 0,36184211 2 16 1 0,41596639 3 17 1 0,39731682 4 19 1 0,27244582 5 24 1 0,43785935 6 27 1 0,30650155 ... ... ... ... 196 94 10 0,48529412
De forma semelhante, 54 observações foram designadas para compor o conjunto de validação. A Tabela 8 exibe algumas observações do conjunto Dvalidação:
Tabela 8 – Amostra de tuplas dos dados do conjunto de validação Dvalidação Observação IDestudante IDconteudo notaPad
(tupla) 1 6 1 0,15 2 11 1 0,38 3 12 1 0,37 4 15 1 0,48 5 31 1 0,05 6 34 1 0,22 ... ... ... ... 54 91 10 0,34
A implementação do algoritmo de previsão de desempenho escolar foi feita no SoftwareLivre R, versão 3.4.0. O algoritmo segue a sequência abaixo:
• Linha 01 à linha 30: São definidos os parâmetros do modelo com valores iniciais calculados à partir dos dados observados em Dtreino.
• Linha 32 à linha 47: os valores iniciais dos parâmetros são atualizados, de forma que em cada iteração, tem-se:
– Linha 34: Sorteia-se aleatoriamente uma tupla de Dtreino. Dessa tupla extrai-se os valores que preencheram as linhas 35,36 e 37.
– Linha 35: Define-se aleatoriamente um estudante u. – Linha 36: Define-se aleatoriamente um conteúdo i.
– Linha 37: Define-se aleatoriamente um performance de desempenho observada pui. – Linha 38: Estima-se uma performance ˆpui com base na média geral µ, o viés do aluno u e do conteúdo i, definidos nas linhas 35 e 36 e do produto interno da u-ésima linha de W com a i-ésima linha de H. Tal que ˆpui= µ + bu+ bi+ ∑Kk=1wukhik – Linha 39: Calcula o valor o erro de estimação entre pui e ˆpui.
– Linha 40: Atualiza o valor da média geral µ.
– Linha 41: Atualiza o valor do viés de variação do estudante u sorteado. – Linha 42: Atualiza o valor do viés de variação do conteúdo i sorteado
– Linhas 43-46: Atualiza o valor dos elementos wuie huide W e H, respectivamente. – Linhas 48-52: Após o processo acima repetir-se iter vezes até a ocorrência da convergência do valor do erro de estimação, o algoritmo fornece os valores dos parâmetros ótimos para a previsão das performances de desempenho.
Figura 41 – Algoritmo SVD++utilizado para modelar a sistemática de predição.
Fonte – Pesquisa do trabalho