专利面向任务的基于1+N的多轮对话方法及系统 -在线下载 -pdf文件-bbs.720life.cn

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202211317437.9 (22)申请日 2022.10.26 (71)申请人上海交通大学地址 200240 上海市闵行区东川路80 0号 (72)发明人朱亚杰　卢宏涛　 (74)专利代理机构上海段和段律师事务所 31334 专利代理师韩成玲 (51)Int.Cl. G06F 16/332(2019.01) G06F 16/35(2019.01) G06F 16/33(2019.01) G06F 40/30(2020.01) G06K 9/62(2022.01) G06N 3/04(2006.01)G06N 3/08(2006.01) (54)发明名称面向任务的基于1+N的多轮对话方法及系统 (57)摘要本发明提供了一种面向任务的基于1+N的多轮对话方法及系统，包括：根据业务需求构建任务型对话的领域分类模型、意图识别模型和词槽语义填充模型；进行单轮对话任务，通过领域分类模型获得文本所属领域，如果文本所属领域并非预设领域，通过闲聊信源服务进行回复；如果该领域为预设领域，使用词槽通过该意图对应的信源服务给出回复；进行多轮对话，用户文本同时进入上轮对话的意图识别模型和领域分类模型，如果和上轮对话识别的意图一致，则进入多轮对话任务给出回复；如果不一致，则切换成单轮对话任务给出回复。本发明通过采取任务型对话的领域分类模型和上轮的意图识别模型保证任务型多轮对话的正确性且具有较好的性能，提升用户的交互体验。权利要求书5页说明书14页附图6页 CN 115525753 A 2022.12.27 CN 115525753 A 1.一种面向任务的基于1+N的多轮对话方法，其特征在于，包括：步骤S1：根据业务需求构建任务型对话的领域分类模型、意图识别模型和词槽语义填充模型；步骤S2：进行单轮对话任务，通过领域分类模型获得文本所属领域，如果文本所属领域并非预设领域，通过闲聊信源服务进行回复；如果该领域为预设领域，首先通过意图识别模型识别该文本对应意图，然后通过词槽语义填充模型对该文本进行词槽填充，抽取该文本的词槽，使用词槽通过该意图对应的信源服务给出回复；步骤S3：进行多轮对话，用户文本同时进入上轮对话的意图识别模型和领域分类模型，如果当前文本通过上轮对话的意图识别模型识别的意图和上轮对话识别的意图一致，则进入多轮对话任务给出回复；如果当前文本通过上轮的意图识别模型识别的意图和上轮对话识别的意图不一致，则多轮对话任务切换成单轮对话任务，跳转至步骤S2给出回复。 2.根据权利要求1所述的面向任务的基于1+N的多轮对话方法，其特征在于，在所述步骤S1中：根据业务需求收集相应用户语料并进行预处理；步骤S1.1：语料收集：通过生产环境线上日志收集用户语料；步骤S1.2：语料预处理：清洗没有实际语义的用户语料；步骤S1.3：根据所述用户语料定义相应领域、相应意图、词槽标签：通过用户语料确定语料所对应的领域，结合业务需求定义相应意图和词槽标签；所述领域包括：任务导向型对话领域、闲聊型对话领域以及问答型对话领域，任务导向型对话领域通过自然语言交互的形式帮助用户完成某个特定的任务；闲聊型对话领域模拟人的聊天行为；问答型对话领域旨在基于特定的知识，回答用户特定的问题，以帮助用户获取其关注的信息；标注领域、意图和词槽：根据用户语料信息标注相应的领域、意图和词槽；步骤S1.4：训练和优化领域分类模型、意图识别模型、词槽语义填充模型：每个领域的语料按照8:1:1的比例进行划分，把每个领域语料的8份作为训练集，每个领域语料的1份作为验证集，另每个领域语料的1份作为测试集；步骤S1.5：领域分类、意图识别和词槽语义填充模型的优化：通过测试集的结果，分析该模型对每个领域语料识别效果，从语料话术、算法和参数迭代优化模型。 3.根据权利要求1所述的面向任务的基于1+N的多轮对话方法，其特征在于，在所述步骤S2中：对领域分类、意图识别和词槽语义填充模型进行推理；对于领域分类模型，使用TextCNN模型输入文本，输出该文本所对应的领域，获取并处理输入的语言文本信息，进行基于字符语句的向量化处理，以得到基于字符语句的初始向量；进行多个卷积核处理、多个窗口池化处理、 RELU激活函数处理和级联处理获得优化的基于字符语句向量；进行部分元素丢弃和变换以获得基于字符语句的目标向量；经过神经网络的全连接层进行计算以识别得到与语言文本信息对应的文本领域和相应的文本领域概权　利　要　求　书 1/5 页 2 CN 115525753 A 2率；对于意图识别模型，意图识别是领域识别的子任务，同样使用TextCNN模型输入文本，输出该文本所对应的意图；意图识别的目的在于提取用户的实际意图；获取并处理输入的语言文本信息，进行基于字符语句的向量化处理，以得到基于字符语句的初始向量；进行多个卷积核处理、多个窗口池化处理、 RELU激活函数处理和级联处理获得优化的基于字符语句向量；进行部分元素丢弃和变换以获得基于字符语句的目标向量；经过神经网络的全连接层进行计算以识别得到与语言文本信息对应的文本意图和相应的文本意图概率；对于词槽语义填充模型，输入文本，输出词槽；槽填充的目的在于分析自然语言中所包含的实体信息；获取并处理输入的语言文本信息，进行基于字符语句的向量化处理，以得到基于字符语句的初始向量；进行双向LSTM优化处理和级联处理获得优化的基于字符语句向量；进行部分元素丢弃和变换以获得基于字符语句的目标向量；经过神经网络的全连接层进行计算以识别得到与语言文本词槽信息对应的词槽值，最后经过CRF得到合法的词槽；通过领域分类、意图识别和词槽语义填充模型识别该用户语料的领域、意图和提取相应词槽；用户说话的文本通过领域分类模型获得某个领域，如果该领域不为预设领域种类，则通过闲聊信源服务进行回复，否则，再通过意图识别模型识别该领域的某个意图，通过词槽语义填充模型抽取该意图相应的词槽，使用该词槽通过该意图对应的信源服务给出回复；单轮对话评价指标：用户文本对应的领域、意图和所有词槽都为正确，领域分类、意图识别和词槽语义填充的评价指标分别如下：领域分类任务：使用领域分类准确率Pdomai n来评价领域分类模型： Pdomain＝领域分类正确的语句数/语句总数意图识别任务：使用意图识别的分类准确率Pi ntent来评价意图识别模型： Pintent＝意图识别正确的语句数/语句总数词槽填充任务：使用句子级词槽填充准确率Psl ot来评价词槽填充模型： Pslot＝词槽填充正确的语句数/语句总数 4.根据权利要求1所述的面向任务的基于1+N的多轮对话方法，其特征在于，在所述步骤S3中：多轮任务判别：当多轮对话时，用户说话的文本同时进入上轮领域的意图识别模型和领域分类模型，如果当前文本通过上轮的意图识别模型识别的意图和上轮意图一致，则进入多轮，通过该意图对应的词槽语义填充模型抽取该意图相应的词槽，并使用该词槽通过该意图对应的信源服务给出回复，如果当前文本通过上轮的意图识别模型识别的意图和上轮意图不一致，则多轮对话任务切换成单轮，进行相应的回复；多轮对话评价指标：用户每轮文本对应的领域、意图和句子级词槽都为正确，多轮对话的评价指标如下：使用多轮准确率Pmrd来评价多轮对话系统： Pmrd＝多轮对话正确数/多轮对话总数 5.根据权利要求1所述的面向任务的基于1+N的多轮对话方法，其特征在于：对话状态包括单轮对话和多轮对话，对话状态以key和value的形式存储在阿里云的 Redis数据库中并存储时间为常量k， k为自定义的定时器，如果对话状态存储时间为常量k权　利　要　求　书 2/5 页 3 CN 115525753 A 3

专利 面向任务的基于1+N的多轮对话方法及系统

专利面向任务的基于1+N的多轮对话方法及系统