期刊介绍
期刊导读
- 07/30内蒙古高校实力排行,内蒙古大学勇夺桂冠,内
- 07/30便捷就医 内蒙古开出首张医疗收费电子票据
- 07/30中华儿慈会教育与医疗公益项目推介会暨内蒙古
- 07/28内蒙古济生中医医院开展爱心义诊活动
- 07/27了解内蒙古?走进内蒙古?爱上内蒙古
面向教育的中文知识图谱自动构建技术(2)
Shyi-Ming Chen 等人提出了一种基于数据挖掘技术的自适应学习系统自动构建概念图[14],他们使用Apriori 算法分析学生答题结果,从而挖掘关联规则,进而生成知识图谱。但是该方法在某些情况下无法正确构造概念图,Shyi-Ming Chen 等人在该工作的基础上提出了一种改进Apriori 算法[15],分析学生答题结果,生成知识图谱。Huang 等人在Apriori 算法的基础上引入了分类算法[16],首先学生测试记录的分类,以降低应用数据挖掘过程之前的计算复杂性,然后每个子集进行数据挖掘计算各个子集的概念之间的相关度。上述工作都只用到了单一形式的数据,没有考虑到数据的多源化,单一形式的数据可能造成所生成的知识图谱包含的知识点不完全,不能生成准确的知识图谱。
文献[17]提出了KnowEdu 系统来自动构建教育领域的知识图。该系统对教学数据采用神经序列标记算法来提取关键概念,并对学习评估数据采用概率关联规则挖掘来识别与教育意义的关系,取得了不错的结果。该工作在构建知识图谱的过程中虽然使用了教材和学生成绩数据,但由于是在不同的阶段分别进行使用的,没有实现两种数据的知识融合。
本文使用教师上课常用的教学工具(即教材和PPT演示文稿),考虑了数据的多源性,并且利用了不同数据的各自特点来构建知识图谱。
三、技术整体框架
针对现有中文知识图谱自动构建技术的不足,本文提出了计算机领域的面向教育的知识自动图谱构建方法。该方法包含三个主要部分:①基于计算机类教材构建知识图谱。②基于PPT 演示文稿构建知识图谱。③将基于教材构建的知识图谱和基于PPT 演示文稿构建的知识图谱相融合。
教育知识图谱构建的关键在于利用知识抽取、知识融合等技术抽取出教育领域中的实体,并建立知识之间的联系[18]。知识图谱的基本构建过程如图1 所示,从非结构化的数据源(教材和PPT 演示文稿)开始,经过知识抽取、知识表示、知识融合等步骤,使得初始数据通过概念抽取和关系抽取转换成三元组(Resource Description Framework,RDF)形式,用于知识的初步表示。RDF 数据再经过实体对齐,加入数据模型,形成标准的知识表示。知识融合的过程中如产生新的关系组合,则对这些新的关系组合进行知识推理,进而形成新的知识形态,最后与原有知识共同经过质量评估,完成知识融合,形成完整形态的知识图谱[19]。
图1 知识图谱构建过程
1.KG-T:基于计算机类教材构建知识图谱技术
(1)预处理
由于计算机类教材中有许多例题和算法例子,经调研发现这些例子占了很大文本篇幅,并且例子中包含的关键概念较少,所以在预处理过程中,本文首先去除掉文本中的例题、图片、算法例子以及表格等内容。这个过程大大缩小了正式工作中所要处理的文本内容。
(2)关键概念及关系抽取
基于教材文本构建知识图谱的工作中,本文首先导入计算机领域专用词典( 算法(N-Best)的隐马尔可夫模型作为基础算法模型。由低一层的隐马尔可夫模型输出最好的若干个关键概念作为下一层隐马尔可夫模型的输入,最终由最高层隐马尔可夫模型在低层级隐马尔可夫模型输出结果的基础之上进行最终的关键概念的识别。
本文选择使用了较新的Transformer 模型提取关键概念关系( 所示。将关键概念所在文本与关键概念进行词向量处理,通过Encoder 对文本和关键概念信息进行编码。再使用Multi-Head Attention模块抽取文本中重要的特征,并通过将残差网络叠加的方法,将注意力层得到的输出与输入拼接并进行正则化。使用堆叠的多层注意力机制,能够有效抽取句子中的关键信息。最后将Transformer 的结果连接至全连接层得到最终的概念间关系的分类结果。
图2 Transformer 模型架构[20]
2.KG-S:基于教学PPT 演示文稿构建知识图谱技术
基于教学PPT 演示文稿构建知识图谱同样包括关键概念提取和概念关系提取两个问题。先前的研究大都独立考虑这两个子问题,虽然已经获得了一定的成果,但基于PPT 演示文稿层次结构的特点,独立解决这两个任务不利于对PPT 演示文稿层次结构的利用。本文提出的KG-S 技术充分利用PPT 演示文稿层次结构清晰的特点,考虑上下层关系,把PPT 演示文稿的概念提取和关系提取两者结合进行,具体过程如图3 所示。
图3 基于PPT 演示文稿构建知识图谱的过程
文章来源:《内蒙古教育》 网址: http://www.nmgjyzzs.cn/qikandaodu/2021/0730/1179.html
上一篇:浅谈儿童乐园的景观设计
下一篇:基于技术的基础教育资源平台建设研究