基于知识库的中文问答系统(biLSTM)
基于知识库的中文问答系统. 整体流程如下:
根据Background和Question寻找到最相关的K个Knowledge,K Knowledge+Background+Question
构成一个大问题
.
正确选项
分别与该问题中所有错误选项
组合,构成3个答案组合,分别与大问题
组合构成3个样例,采用余弦距离计算大问题
与正确选项
和错误选项
的相似度.
正确选项相似度为t_sim, 错误选项相似度为f_sim,损失函数为
loss = max(0, margin - t_sim + f_sim)
knowledge
地球是宇宙中的一颗行星,有自己的运动规律。
地球上的许多自然现象都与地球的运动密切相关。
地球具有适合生命演化和人类发展的条件,因此,它成为人类在宇宙中的唯一家园。
...
train&test
问题为选择题,每个问题的格式为
Background, Question, Right, Wrong, Wrong, Wrong
.
B:近年来,我国有些农村出现了“有院无人住,有地无人种”的空心化现象。
Q:“有院无人住,有地无人种”带来
R:土地资源浪费
W:农业发展水平提高
W:城乡协调发展
W:农村老龄化程度降低
B:广东省佛山市三水区被称为“中国饮料之都”。除青岛啤酒、伊利等国内著名饮料企业抢先布局外,百威、红牛、可口可乐、杨协成等国际巨头也先后落户于此,作为其在中国布局中的重要一环。
Q:众多国际饮料企业选址三水的主导区位因素是
R:市场
W:技术
W:劳动力
W:原料
B:凡是大气中因悬浮的水汽凝结,能见度低于1千米时,气象学称这种天气现象为雾
Q:深秋到第二年初春,晴朗的夜晚容易形成雾,这主要是因为
R:晴朗的夜晚大气逆辐射弱,近地面降温快
W:晴天大气中的水汽含量多
W:晴朗的夜晚地面水汽蒸发强
W:晴天大气中的凝结核物质较少
...
python3 train.py
该数据集下最佳参数为