中学数学知识点实体识别
⚠️ 所有有关智慧教育的项目已完结停更,不再维护,感谢您的支持
构建中学数学知识图谱的第一步是完成数学命名实体识别。
1. Overview
本文定义是:中学数学学科知识点指客观存在的数学知识实体及其对应的抽象内容。客观存在的实体即例如“三角形”、“数列”、“平面向量”等指代一个数学的概念;抽象是指基于这些客观实体的一些数学“方法”、“定理”等,例如“边角边定理”是基于三角形的全等的定理,“裂项相消法”是基于“数列”求和的一种方法,“共线定理”则是基于“平面向量”的法则。本文设定“KNOW”表示概念实体,“PRIN”表示法则实体,“O”则表示非实体。对于中文汉字,首字符用“B”作为前缀,其余用“I”。
2. Algorithm
我们提供了训练数学实体识别的程序,可在Github上下载:Mathematical-Knowledge-Entity-Recognition,训练和测试方法请查看相应的README.md
3. Datasets
我们依然提供了数据集及对应的词向量。下载地址为:中学学科知识点数据集。请在中学数学或高中数学一行中选择相应的语料。数据集中仅需要使用ner_train_data和ner_test_data即可。