• Sonuç bulunamadı

PROFESÖR KADROSUNA ATANMA İÇİN:

8. KURUM DESTEĞİ VE PARASAL KAYNAKLAR

Um dos principais recursos trazidos pelo Modelo e que é implementado pela Arqui- tetura Digital Class é a predição de desempenho do estudante. Nesse estudo foram utilizados duas técnicas para se obter esse resultado. A primeira, Regressão Logística Linear e a segunda SVD++.

Foram utilizados dados que registraram a interação dos estudantes com o sistema. Inicialmente foram coletados os dados de acesso e uso do sistema de ensino virtual de 71 estudantes, do início do semestre letivo 2017.1 até a segunda avaliação bimestral (final do semestre). Ao todo foram abordados 10 temas, que para fins de praticidade na análise, foram codificados na sequência de 1 a 10.

Tabela 2 – Conteúdos abordados. Notação Conteúdo

1 Notação Científica.

2 Metodologia de Investigação: A procura de regularidades e de sinais na interpretação física do mundo. 3 Leis de Newton

4 Movimento retilíneo uniformemente variado. 5 Movimento retilíneo uniforme.

6 Movimentos verticais: Queda livre.

7 Movimentos verticais: Lançamento vertical. 8 Movimentos verticais: Horizontal e oblíquo. 9 Equação de Torricelli.

Os estudantes foram codificados de acordo com o ID usado pelo sistema de ensino, no anexo segue a tabela contendo todos os IDs e nomes dos estudantes que participaram do estudo.

Inicialmente, é necessário calcular uma performance de desempenho com base nos dados observados que o sistema de ensino fornece. Para cada estudante em um determinado conteúdo i, o sistema de ensino fornece três informações básicas:

• q: O número de questões resolvidas no conteúdo i.

• t: Quantidade de tentativas feitas para resolver as n questões no conteúdo i.

• a: Quantidade de acertos dentro das n questões resolvidas desse mesmo conteúdo i. Segue a Tabela 3 temos o exemplo dos estudantes a , b e c no Conteúdo 2:

Tabela 3 – Relação entre estudante × tentativa × acerto de questões IDestudante quesT2 tentC2 acertosC2

a 5 5 5

b 5 9 3

c 2 2 1

A Tabela 3 indica que o estudante a resolveu 5 questões com 5 tentativas e acertou todas as 5 questões, o que indica que ele acertou cada uma das questões na primeira tentativa. Já o estudante b precisou de 9 tentativas para resolver o mesmo numero de questões que o estudante a e, mesmo assim, só acertou 3 questões das 5 totais. Isso indica que o nível de proficiência do estudante b é menor que o do estudante a, no conteúdo em questão. Porém, os aluno a e b indicam ter maior nível de proficiência no conteúdo 2 do que estudante c, que resolveu apenas 2 questões.

Dessa forma, para cada aluno, a performance de desempenho em cada conteúdo foi calculada da seguinte forma

p = a t + q µq 

No intuito de padronizar a performance de desempenho de cada estudante dentro do intervalo (0,1), o valor p definido acima foi dividido pelo valor p máximo encontrado dentro dos dados observados Dtreino.

Voltando ao exemplo definido acima, supondo que a média geral µqtenha sido de 6 questões por aluno, as performances de desempenhos dos alunos a, b e c no conteúdo 2 ficariam: Tabela 4 – Relação entre estudante x tentativa x acerto de questões x nota Geral x Nota Padroni-

zada

IDestudante quesT2 tentC2 acertosC2 notaGeral notaPadr

a 5 5 5 1,83 1

b 5 9 3 1,17 0,64

c 2 2 1 0,83 0,45

Assim sendo, segue a Tabela 5 contendo a matriz X de performances observadas e não observadas:

Tabela 5 – Matriz esparsa com as 10 primeiras observações das performances observadas. ID estud. notat2 notat4 notat15 notat85 notat86 notat87 notat88 notat89 notat90 notat91

6 0,15 0,1 0,31 0,05 0,11 11 0,38 0,15 0,54 0,05 12 0,37 0,36 0,49 0,72 0,23 13 0,36 14 0,22 0,35 0,15 0,21 15 0,48 0,05 0,05 16 0,42 17 0,4 19 0,27 24 0,44 .. . ... ... ... ... ... ... ... ... ... ...

Tem-se que 65,77% dos dados observados são desconhecidos.

A Técnica SVD++

Para a construção do modelo de previsão, a implementação do algoritmo foi feita com os dados observados e importados em forma de lista. Para o conjunto de treinamento foram usadas 196 observações (performances observadas). Do total de 75 estudantes considerados no estudo, foi verificado que, para cada tema, há no mínimo 2 observações de desempenho e no máximo 62 observações.

Tabela 6 – Número de performances observadas por cada conteúdo

Temas c1 c2 c3 c4 c5 c6 c7 c8 c9 c10

Node

obs 62 24 15 28 32 1 26 1 5 2

A Tabela 7 exibe algumas tuplas do conjunto de dados de treinamento, Dtreino.

Tabela 7 – Amostra de tuplas dos dados que do conjunto de treinamento Dtreino Observação IDestudante IDconteudo notaPad

(tupla) 1 13 1 0,36184211 2 16 1 0,41596639 3 17 1 0,39731682 4 19 1 0,27244582 5 24 1 0,43785935 6 27 1 0,30650155 ... ... ... ... 196 94 10 0,48529412

De forma semelhante, 54 observações foram designadas para compor o conjunto de validação. A Tabela 8 exibe algumas observações do conjunto Dvalidação:

Tabela 8 – Amostra de tuplas dos dados do conjunto de validação Dvalidação Observação IDestudante IDconteudo notaPad

(tupla) 1 6 1 0,15 2 11 1 0,38 3 12 1 0,37 4 15 1 0,48 5 31 1 0,05 6 34 1 0,22 ... ... ... ... 54 91 10 0,34

A implementação do algoritmo de previsão de desempenho escolar foi feita no SoftwareLivre R, versão 3.4.0. O algoritmo segue a sequência abaixo:

• Linha 01 à linha 30: São definidos os parâmetros do modelo com valores iniciais calculados à partir dos dados observados em Dtreino.

• Linha 32 à linha 47: os valores iniciais dos parâmetros são atualizados, de forma que em cada iteração, tem-se:

– Linha 34: Sorteia-se aleatoriamente uma tupla de Dtreino. Dessa tupla extrai-se os valores que preencheram as linhas 35,36 e 37.

– Linha 35: Define-se aleatoriamente um estudante u. – Linha 36: Define-se aleatoriamente um conteúdo i.

– Linha 37: Define-se aleatoriamente um performance de desempenho observada pui. – Linha 38: Estima-se uma performance ˆpui com base na média geral µ, o viés do aluno u e do conteúdo i, definidos nas linhas 35 e 36 e do produto interno da u-ésima linha de W com a i-ésima linha de H. Tal que ˆpui= µ + bu+ bi+ ∑Kk=1wukhik – Linha 39: Calcula o valor o erro de estimação entre pui e ˆpui.

– Linha 40: Atualiza o valor da média geral µ.

– Linha 41: Atualiza o valor do viés de variação do estudante u sorteado. – Linha 42: Atualiza o valor do viés de variação do conteúdo i sorteado

– Linhas 43-46: Atualiza o valor dos elementos wuie huide W e H, respectivamente. – Linhas 48-52: Após o processo acima repetir-se iter vezes até a ocorrência da convergência do valor do erro de estimação, o algoritmo fornece os valores dos parâmetros ótimos para a previsão das performances de desempenho.

Figura 41 – Algoritmo SVD++utilizado para modelar a sistemática de predição.

Fonte – Pesquisa do trabalho

Benzer Belgeler