(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211317437.9
(22)申请日 2022.10.26
(71)申请人 上海交通大 学
地址 200240 上海市闵行区东川路80 0号
(72)发明人 朱亚杰 卢宏涛
(74)专利代理 机构 上海段和段律师事务所
31334
专利代理师 韩成玲
(51)Int.Cl.
G06F 16/332(2019.01)
G06F 16/35(2019.01)
G06F 16/33(2019.01)
G06F 40/30(2020.01)
G06K 9/62(2022.01)
G06N 3/04(2006.01)G06N 3/08(2006.01)
(54)发明名称
面向任务的基 于1+N的多轮对话方法及系统
(57)摘要
本发明提供了一种面向任务的基于1+N的多
轮对话方法及系统, 包括: 根据业务需求构建任
务型对话的领域分类模型、 意图识别模型和词槽
语义填充模型; 进行单轮对话任务, 通过领域分
类模型获得文本所属领域, 如果文本所属领域并
非预设领域, 通过闲聊信源服务进行回复; 如果
该领域为预设领域, 使用词槽通过该意图对应的
信源服务给出回复; 进行多轮对话, 用户文本同
时进入上轮对话的意图识别模型和领域分类模
型, 如果和上轮对话识别的意图一致, 则进入多
轮对话任务给出回复; 如果不一致, 则切换成单
轮对话任务给出回复。 本发明通过采 取任务型对
话的领域分类模型和上轮的意图识别模型保证
任务型多轮对话的正确性且具有较好的性能, 提
升用户的交 互体验。
权利要求书5页 说明书14页 附图6页
CN 115525753 A
2022.12.27
CN 115525753 A
1.一种面向任务的基于1+N的多轮对话方法, 其特 征在于, 包括:
步骤S1: 根据业务需求构建任务型对话的领域分类模型、 意图识别模型和词槽语义填
充模型;
步骤S2: 进行单轮对话任务, 通过领域分类模型获得文本所属领域, 如果文本所属领域
并非预设领域, 通过闲聊 信源服务进行回复;
如果该领域为预设领域, 首先通过意图识别模型识别该文本对应意图, 然后通过词槽
语义填充模型对该文本进行词槽填充, 抽取该文本的词槽, 使用 词槽通过该意图对应的信
源服务给出回复;
步骤S3: 进行多轮对话, 用户文本同时进入上轮对话的意图识别 模型和领域分类模型,
如果当前文本通过上轮对话的意图识别模型识别的意图和上轮对话识别的意图一致, 则进
入多轮对话任务给 出回复;
如果当前文本通过上轮的意图识别模型识别的意图和上轮对话识别的意图不一致, 则
多轮对话任务切换成单轮对话任务, 跳转至步骤S2给 出回复。
2.根据权利要求1所述的面向任务的基于1+N的多轮对话方法, 其特征在于, 在所述步
骤S1中:
根据业务需求收集相应用户语料并进行 预处理;
步骤S1.1: 语料收集: 通过生产环境线上日志收集用户语料;
步骤S1.2: 语料 预处理: 清洗没有实际语义的用户语料;
步骤S1.3: 根据所述用户语料定义相应领域、 相应意 图、 词槽标签: 通过用户语料确定
语料所对应的领域, 结合 业务需求定义相应意图和词槽标签;
所述领域包括: 任务导向型对话领域、 闲聊型对话领域以及问答型对话领域, 任务导向
型对话领域通过自然语言交互的形式帮助用户完成某个特定的任务; 闲聊型对话领域模拟
人的聊天行为; 问答型对话领域旨在基于特定的知识, 回答用户特定的问题, 以帮助用户获
取其关注的信息;
标注领域、 意图和词槽: 根据用户语料信息标注相应的领域、 意图和词槽;
步骤S1.4: 训练和优化领域分类模型、 意图识别模型、 词槽语义 填充模型:
每个领域的语料按照8:1:1的比例进行划分, 把每个领域语料的8份作为训练集, 每个
领域语料的1份作为验证集, 另每 个领域语料的1份作为测试集;
步骤S1.5: 领域分类、 意图识别和词槽语义 填充模型的优化:
通过测试集的结果, 分析该模型对每个领域语料识别效果, 从语料话术、 算法和参数迭
代优化模型。
3.根据权利要求1所述的面向任务的基于1+N的多轮对话方法, 其特征在于, 在所述步
骤S2中:
对领域分类、 意图识别和词槽语义 填充模型进行推理;
对于领域分类模型, 使用TextCNN模型输入文本, 输出该文本所对应的领域, 获取并处
理输入的语言文本信息, 进行基于字符语句的向量化处理, 以得到基于字符语句的初始向
量; 进行多个卷积核处理、 多个窗口池化处理、 RELU激活函数处理和级 联处理获得优化的基
于字符语句向量; 进行部分元素丢弃和变换以获得基于字符语句的目标向量; 经过神经网
络的全连接层进行计算以识别得到与语言文本信息对应的文本领域和相 应的文本领域概权 利 要 求 书 1/5 页
2
CN 115525753 A
2率;
对于意图识别模型, 意图识别是领域识别的子任务, 同样使用TextCNN模型输入文本,
输出该文本所对应的意图; 意图识别的目的在于提取用户的实际意图; 获取并处理输入的
语言文本信息, 进 行基于字符语句的向量化处理, 以得到基于字符语句的初始向量; 进行多
个卷积核处理、 多个窗口池化处理、 RELU激活函数处理和级联处理获得优化的基于字符语
句向量; 进行部分元素丢弃和变换以获得基于字符语句的目标向量; 经过神经网络的全连
接层进行计算以识别得到与语言文本信息对应的文本意图和相应的文本意图概 率;
对于词槽语义填充模型, 输入文本, 输出词槽; 槽填充的目的在于分析自然语言中所包
含的实体信息; 获取并处理输入的语言文本信息, 进 行基于字符语句的向量化处理, 以得到
基于字符语句的初始向量; 进 行双向LSTM优化处理和级联处理获得优化的基于字符语句向
量; 进行部分元素丢弃和变换以获得基于字符语句的目标向量; 经过神经网络的全连接层
进行计算以识别得到与语言文本词槽信息对应的词槽值, 最后经 过CRF得到合法的词槽;
通过领域分类、 意图识别和词槽语义填充模型识别该用户语料的领域、 意图和提取相
应词槽;
用户说话的文本通过领域分类模型获得某个领域, 如果该领域不为预设领域种类, 则
通过闲聊信源服务进 行回复, 否则, 再通过意图识别模型识别该领域的某个意图, 通过词槽
语义填充模型抽取 该意图相应的词槽, 使用该词槽通过 该意图对应的信源服 务给出回复;
单轮对话评价指标: 用户文本对应的领域、 意图和所有词槽都为正确, 领域分类、 意图
识别和词槽语义 填充的评价指标分别如下:
领域分类任务: 使用领域分类准确率Pdomai n来评价领域分类模型:
Pdomain=领域分类正确的语句数/语句总数
意图识别任务: 使用意图识别的分类准确率Pi ntent来评价 意图识别模型:
Pintent=意图识别正确的语句数/语句总数
词槽填充任务: 使用句子级词槽填充准确率Psl ot来评价词槽填充模型:
Pslot=词槽填充正确的语句数/语句总数
4.根据权利要求1所述的面向任务的基于1+N的多轮对话方法, 其特征在于, 在所述步
骤S3中:
多轮任务判别: 当多轮对话时, 用户说话的文本同时进入上轮领域的意图识别模型和
领域分类模型, 如果当前文本通过上轮的意图识别模型识别的意图和上轮意图一致, 则进
入多轮, 通过该意图对应的词槽语义填充模型抽取该意图相 应的词槽, 并使用该词槽通过
该意图对应的信源服务给出回复, 如果当前文本通过上轮的意图识别模型识别的意图和上
轮意图不 一致, 则多轮对话任务切换成单轮, 进行相应的回复;
多轮对话评价指标: 用户每轮文本对应的领域、 意图和句子级词槽都为正确, 多轮对话
的评价指标如下:
使用多轮准确率Pmrd来评价多轮对话系统:
Pmrd=多轮对话 正确数/多轮对话总数
5.根据权利要求1所述的面向任务的基于1+N的多轮对话方法, 其特 征在于:
对话状态包括单轮对话和多轮对话, 对话状态以key和value的形式存储在阿里云的
Redis数据库中并存储时间为常量k, k为 自定义的定时器, 如果对话状态存储 时间为常量k权 利 要 求 书 2/5 页
3
CN 115525753 A
3
专利 面向任务的基于1+N的多轮对话方法及系统
文档预览
中文文档
26 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共26页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:24:12上传分享