SMP2018中文人机对话技术评测(ECDT)
通过SMP2018,展现处理中文文本分类的一般方法。特别是 Keras 和中文分词工具 jieba 的联合使用
SMP2018中文人机对话技术评测由中国中文信息学会社会媒体处理专委会主办,哈尔滨工业大学、科大讯飞股份有限公司承办,讯飞公司提供数据,华为公司提供奖金。旨在促进中文人机对话系统相关研究的发展,为人机对话技术相关的学术研究人员和产业界从业人员提供一个良好的沟通平台。在此,评测会务组诚邀各个单位参加本次人机对话技术评测活动!
在人机对话系统的应用过程中,用户可能会有多种意图,相应地会触发人机对话系统中的多个领域(domain) ,其中包括任务型垂直领域(如查询机票、酒店、公交车等)、知识型问答以及闲聊等。因而,人机对话系统的一个关键任务就是正确地将用户的输入分类到相应的领域(domain)中,从而才能返回正确的回复结果。
例如
1) 你好啊,很高兴见到你! — 闲聊类
2) 我想订一张去北京的机票。 — 任务型垂类(订机票)
3) 我想找一家五道口附近便宜干净的快捷酒店 — 任务型垂类(订酒店)
标题 | 说明 |
---|---|
CodaLab评测主页 | 数据下载 |
CodaLab 评测教程 | |
评测排行榜 | |
SMP2018-ECDT评测主页 | |
SMP2018-ECDT评测成绩公告链接 |
# 词嵌入的维度
embedding_word_dims = 32
# 批次大小
batch_size = 30
# 周期
epochs = 20