(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211324149.6
(22)申请日 2022.10.27
(71)申请人 国家电网有限公司大 数据中心
地址 100031 北京市西城区宣武门内大街8
号
(72)发明人 刘俊健 李博 朱天佑 刘普凡
李继伟 陈振宇 边靖宸 吕宏伟
郑飞 陈飞 江丽娜
(74)专利代理 机构 北京品源专利代理有限公司
11332
专利代理师 侯军洋
(51)Int.Cl.
G06F 16/36(2019.01)
G06F 16/35(2019.01)
G06N 3/04(2006.01)G06N 3/08(2006.01)
(54)发明名称
一种实体关系抽取方法、 装置、 设备及存储
介质
(57)摘要
本发明公开了一种实体关系抽取方法、 装
置、 设备及存储介质。 通过将句子样本集输入初
始实体关系抽取模型得到至少一个第一实体关
系集群, 以及第一实体关系集群所包含的句子样
本的伪标签; 根据具有伪标签的句子样本更新句
子样本集, 将更新后的句子样 本集输入初始实体
关系抽取模 型得到至少一个第二实体 关系集群,
以及第二实体关系集群所包含的句子样本的预
测标签; 根据句子样本对应的伪标签和预测标签
计算损失函数值, 并基于损失函数值对初始实体
关系抽取模 型中的网络参数进行迭代调整, 得到
目标实体关系抽取模型, 能够实现无需人工标记
的实体关系抽取方法。
权利要求书2页 说明书12页 附图4页
CN 115544273 A
2022.12.30
CN 115544273 A
1.一种实体关系抽取模型的训练方法, 其特 征在于, 包括:
将句子样本集输入初始实体关系抽取模型, 其中, 所述关系抽取模型包括: 预训练的关
系编码模块和聚类模块; 所述句子样本集由未 标记的句子样本构成;
通过所述关系编码模块对所述句子样本集中的句子样本进行实体关系预测得到实体
关系图, 将所述实体关系图输入所述聚类模块;
通过所述聚类模块基于所述实体关系图中的实体之间的相似度进行聚类得到至少一
个第一实体关系集群, 以及所述第一 实体关系集群所包含的句子样本的伪标签; 其中, 同一
第一实体关系集群所包 含的句子样本标记有相同的伪标签;
根据具有伪标签的句子样本更新所述句子样本集, 将更新后的句子样本集输入所述初
始实体关系抽取模型得到至少一个第二 实体关系集群, 以及所述第二实体关系集群所包含
的句子样本的预测标签;
根据所述句子样本对应的伪标签和预测标签计算损失函数值, 并基于所述损失函数值
对所述初始实体关系抽取模型中的网络参数进行迭代调整, 得到目标实体关系抽取模型。
2.根据权利要求1所述的方法, 其特征在于, 所述关系编码模块包括: 预设数量个并列
的卷积梯形网络, 每个所述卷积梯形网络包括: 嵌入层、 编 码层、 解码层和预测层; 所述编码
层包括: 加噪编码器和去噪编码器; 所述 解码层包括第一 解码器和第二 解码器。
3.根据权利要求2所述的方法, 其特征在于, 通过所述关系编码模块对所述句子样本集
中的句子样本进行实体关系预测得到实体关系图, 包括:
对于每个所述卷积梯形网络, 通过所述嵌入层对输入的所述句子样本进行特征提取得
嵌入向量, 将所述嵌入向量输入加噪编码器;
通过所述加噪编码器对所述嵌入向量进行带 噪编码得到带 噪编码特征向量; 将所述带
噪编码特 征向量输入所述 解码层中的第一 解码器进行 带噪解码得到带噪解码特 征向量;
将所述带 噪解码特征向量输入所述去噪编码器进行降噪编码得到去噪编码特征向量,
将所述去噪编码特征向量输入所述解码层中的第二解码器进行降噪解码得到降噪编码特
征向量;
将所述降噪编码特 征向量输入所述预测层得到实体关系图。
4.根据权利要求2所述的方法, 其特征在于, 所述聚类模块包括: 融合网络和聚类网络;
相应的, 通过所述聚类模块基于所述 实体关系图中的实体之间的相似度进 行聚类得到至少
一个第一实体关系集群包括:
通过所述融合网络对所述关系编码模块中每个卷积梯形网络所输出的实体关系图进
行融合得到实体关系相似图, 将所述实体关系相似图输入所述聚类网络;
通过所述聚类网络对所述实体关系相似图中实体关系的相似度大于预设置信度的句
子样本进行聚类, 得到 至少一个第一实体关系集群。
5.根据权利要求1所述的方法, 其特征在于, 基于所述损失函数值对所述初始实体关系
抽取模型中的网络参数进行迭代调整, 得到目标实体关系抽取模型, 包括:
基于所述损失函数值对所述初始实体关系抽取模型中的网络参数进行调整;
将所述句子样本的预测标签确定为所述句子样本的伪标签;
返回执行根据 具有伪标签的句子样本更新所述句子样本集, 将更新后的所述句子样本
集输入所述初始实体关系抽取模型 得到至少一个第二实体关系集群的步骤;权 利 要 求 书 1/2 页
2
CN 115544273 A
2直到所述损失函数值为最小值 时, 将所述损失函数值对应的初始实体关系抽取模型确
定为目标实体关系抽取模型。
6.一种实体关系抽取 方法, 其特 征在于, 包括:
获取待抽取句子;
将所述待抽取句子输入采用权利要求1 ‑5任一所述的实体关系抽取模型的训练方法训
练得到的目标实体关系抽取模型;
获取所述目标实体关系抽取模型输出的所述待抽取句子的实体关系类别。
7.一种实体关系抽取模型的训练装置, 其特 征在于, 包括:
输入模块, 用于将句子样本集输入初始实体关系抽取模型, 其中, 所述关系抽取模型包
括: 预训练的关系编码模块和聚类模块; 所述句子样本集由未 标记的句子样本构成;
关系编码模块, 用于对所述句子样本集中的句子样本进行实体关系预测得到实体关系
图, 将所述实体关系图输入所述聚类模块;
聚类模块, 用于基于所述实体关系图中的实体之间的相似度进行聚类得到至少一个第
一实体关系集群, 以及所述第一 实体关系集群所包含的句子样本的伪标签; 其中, 同一 实体
关系集群所包 含的句子样本标记有相同的伪标签;
更新模块, 用于根据具有伪标签的句子样本更新所述句子样本集, 将更新后的句子样
本集输入所述初始实体关系抽取模型得到至少一个第二 实体关系集群, 以及所述第二实体
关系集群所包 含的句子样本的预测标签;
调整模块, 用于根据所述句子样本对应的伪标签和预测标签计算损 失函数值, 并基于
所述损失函数值对所述初始实体关系抽取模型中的网络参数进行迭代调整, 得到目标实体
关系抽取模型。
8.一种实体关系抽取装置, 其特 征在于, 包括:
句子获取模块, 用于获取待抽取句子;
输入模块, 用于将所述待抽取句子输入采用权利要求1 ‑6任一所述的实体关系抽取模
型的训练方法训练得到的目标实体关系抽取模型;
结果获取模块, 用于获取所述目标实体关系抽取模型输出的所述待抽取句子的实体关
系抽取结果。
9.一种电子设备, 其特 征在于, 所述电子设备包括:
至少一个处 理器; 以及
与所述至少一个处 理器通信连接的存 储器; 其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序, 所述计算机程序被所
述至少一个处理器执行, 以使所述至少一个处理器能够执行权利要求1 ‑5中任一项所述的
实体关系抽取模型的训练方法, 或者权利要求6所述的实体关系抽取 方法。
10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质存储有计算机指
令, 所述计算机指令用于使处理器执行时实现权利要求1 ‑5中任一项所述的实体关系抽取
模型的训练方法, 或者权利要求6所述的实体关系抽取 方法。权 利 要 求 书 2/2 页
3
CN 115544273 A
3
专利 一种实体关系抽取方法、装置、设备及存储介质
文档预览
中文文档
19 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:24:09上传分享