1 相关工作
1.1 知识追踪
1.2 融通机制
1.3 稀疏自注意力机制
2 模型设计
2.1 问题定义
2.2 模型设计
2.2.1 输入模块
2.2.2 编码器与解码器模块
2.2.3 学习能力提取模块与预测模块
3 实验
3.1 数据集
表1 数据集详细信息 |
数据信息 | Riiid2020 | EdNet |
---|---|---|
交互信息 | 99 271 300 | 95 293 926 |
学生 | 393 656 | 784 309 |
习题 | 13 523 | 18 143 |
知识点 | 127 | 189 |
3.2 实验设置
表2 实验超参数设置 |
参数 | Riiid2020 | EdNet |
---|---|---|
Embedding_dim | 256 | 256 |
Model_dim | 256 | 256 |
Head_num | 8 | 8 |
Encoder_num | 2 | 2 |
Decoder_num | 2 | 2 |
Encoder_layer | 2 | 2 |
Seq_len | 100 | 100 |
Batch_size | 64 | 64 |
Learning_rate | 0.000 5 | 0.000 5 |
Sampling_factor | 5 | 5 |
3.3 对比实验
表3 AUC值的对比实验结果 (%) |
模型 | EdNet | Riiid2020 |
---|---|---|
DKT | 76.38 | — |
DKVMN | 76.68 | — |
SAKT | 76.63 | 78.32 |
SAINT | 78.16 | — |
AKT | — | 79.01 |
SAINT+ | 79.13 | 79.56 |
LANA | 80.59 | 80.56 |
LTKT | 84.37 | 84.48 |
3.4 消融实验
表4 消融实验结果 (%) |
方法 | AUC | 增长量 |
---|---|---|
Base | 78.63 | — |
Base+KI | 79.76 | 1.13 |
Base+LAE | 80.51 | 1.88 |
Base+SA | 81.26 | 2.63 |
Base+KI+LAE | 80.67 | 2.04 |
Base+KI+SA | 82.53 | 3.90 |
Base+LAE+SA | 84.10 | 5.47 |
Base+KI+LAE+SA | 84.48 | 5.85 |