国家标准网
文库搜索
切换导航
首页
频道
仅15元无限下载
联系我们
首页
仅15元无限下载
联系我们
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211351675.1 (22)申请日 2022.10.31 (71)申请人 中国电信股份有限公司 地址 100033 北京市西城区金融大街31号 (72)发明人 刘珮 钱兵 谢汉垒 薛艳茹 马冲 (74)专利代理 机构 北京律智知识产权代理有限 公司 11438 专利代理师 孙宝海 (51)Int.Cl. G06F 16/36(2019.01) G06N 3/08(2006.01) G06N 3/04(2006.01) (54)发明名称 事件抽取模 型训练方法、 事件抽取方法以及 相关设备 (57)摘要 本发明提供了事件抽取模型训练方法、 事件 抽取方法以及相关设备, 事件抽取模型训练方 法, 包括: 基于指导信息、 专家 案例以及通信字典 生成知识图谱; 对所述知识图谱进行编码获得知 识图谱编码; 将事件案例进行编码, 获得文本编 码; 将所述知识图谱编码以及所述文本编码进行 融合, 获得融合编码; 将所述融合编码输入第一 抽取模型, 获得所述事件案例的伪数据标签; 基 于所述事件案例以及所述伪数据标签训练第二 抽取模型。 本发明在样本数据小的情况下, 提高 事件抽取模型的泛化能力以及抽取准确性。 权利要求书2页 说明书9页 附图6页 CN 115525776 A 2022.12.27 CN 115525776 A 1.一种事 件抽取模型训练方法, 其特 征在于, 包括: 基于指导信息、 专 家案例以及通信字典生成知识图谱; 对所述知识图谱进行编码获得知识图谱编码; 将事件案例进行编码, 获得文本编码; 将所述知识图谱编码以及所述文本编码进行融合, 获得融合编码; 将所述融合编码输入第一抽取模型, 获得 所述事件案例的伪数据标签; 基于所述事 件案例以及所述伪数据标签训练第二抽取模型。 2.根据权利要求1所述的事件抽取模型训练方法, 其特征在于, 所述基于指导信息、 专 家案例以及通信字典生成知识图谱 包括: 对所述指导信息进行格式转换, 以获得知识块; 基于所述文本数据生成知识块树形结构, 所述知识块树形结构的根节点为文件名, 所 述知识块树形结构的叶子节点为知识块, 所述知识 块树形结构除了根节点和叶子节点之外 的节点为多级标题。 3.根据权利要求1所述的事件抽取模型训练方法, 其特征在于, 所述对所述知识图谱进 行编码获得知识图谱编码包括: 抽取所述专家案例的第一实体; 基于所述第一实体自所述知识图谱中搜索关联的实体以及实体关系; 对所述实体以及实体关系进行编码。 4.根据权利要求3所述的事件抽取模型训练方法, 其特征在于, 所述对所述实体以及实 体关系进行编码包括: 利用图神经网络或者TransE算法对所述实体以及实体关系进行编码。 5.根据权利要求1所述的事件抽取模型训练方法, 其特征在于, 所述将所述知识图谱编 码以及所述文本编码进行融合, 获得融合编码包括: 对所述知识图谱编码以及所述文本编码进行拼接、 相乘、 相加或者加权求和, 获得融合 编码。 6.根据权利要求1所述的事件抽取模型训练方法, 其特征在于, 所述第 一抽取模型为基 于DMCNN的事件抽取模型, 或者 为ALBERT、 Bi LSTM、 CRF的复合事 件抽取模型。 7.根据权利要求1所述的事件抽取模型训练方法, 其特征在于, 所述第 二抽取模型为基 于完全子图搜索的事 件抽取模型。 8.一种事 件抽取方法, 其特 征在于, 包括: 将待抽取事件输入至第二抽取模型, 所述第二抽取模型经由如权利要求1至7任一项所 述的事件抽取模型训练方法训练; 获得所述第二抽取模型输出的实体。 9.一种事 件抽取模型训练装置, 其特 征在于, 包括: 知识图谱生成模块, 配置成基于指导信息、 专 家案例以及通信字典生成知识图谱; 知识图谱编码模块, 配置成对所述知识图谱进行编码获得知识图谱编码; 事件编码模块, 配置成将事 件案例进行编码, 获得文本编码; 融合模块, 配置成将所述知识图谱编码以及所述文本编码进行融合, 获得融合编码; 伪数据标签获取模块, 配置成将所述融合编码输入第一抽取模型, 获得所述事件案例权 利 要 求 书 1/2 页 2 CN 115525776 A 2的伪数据标签; 训练模块, 配置成基于所述事 件案例以及所述伪数据标签训练第二抽取模型。 10.一种事 件抽取装置, 其特 征在于, 包括: 输入模块, 配置成将待抽取事件输入至第二抽取模型, 所述第二抽取模型经由如权利 要求1至7任一项所述的事 件抽取模型训练方法训练; 抽取模块, 配置成获得 所述第二抽取模型输出的实体。 11.一种处 理设备, 其特 征在于, 包括: 处理器; 存储器, 其中存 储有所述处 理器的可 执行指令; 其中, 所述处 理器配置为经由执 行所述可执行指令来执 行: 权利要求1至7任意 一项所述事 件抽取模型训练方法; 和/或 权利要求8所述事 件抽取模型训练方法。 12.一种计算机可读存 储介质, 用于存 储程序, 其特 征在于, 所述 程序被执 行时实现: 权利要求1至7任意 一项所述事 件抽取模型训练方法; 和/或 权利要求8所述事 件抽取模型训练方法。权 利 要 求 书 2/2 页 3 CN 115525776 A 3
专利 事件抽取模型训练方法、事件抽取方法以及相关设备
文档预览
中文文档
18 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 SC 于
2024-02-18 22:24:06
上传分享
举报
下载
原文档
(1009.9 KB)
分享
友情链接
T-CSTM 00461—2022 晶体硅光伏电池电极剥离强度测试方法.pdf
国家密码局 信息安全等级保护 商用密码技术实施要求 2009.pdf
NY-T 4196.1-2022 农药登记环境风险评估标准场景 第1部分:场景构建方法.pdf
GB-T 42316-2023 分布式储能集中监控系统技术规范.pdf
法律法规 中华人民共和国技术进出口管理条例2020-11-29.pdf
中国移动通信企业标准 QB-018-2008 通信用不间断电源-UPS-V1.0.0 .pdf
思度安全-DSMM-001 数据安全管理总纲V1.0.pdf
互联网信息服务管理办法(修订草案征求意见稿).pdf
T-WAPIA 045.1—2021 信息技术 系统间远程通信和信息交换 原子密钥建立与实体鉴别 第1部分:服务和协议.pdf
MZ-T 120-2018 自立式辅助起床架.pdf
GB-Z 42759-2023 智慧城市 人工智能技术应用场景分类指南.pdf
GB-T 13749-2022 冲击式打桩机 安全操作规程.pdf
GB-T 19113-2022 桑蚕鲜茧分级 茧层量法.pdf
GB-T 18018-2019 信息安全技术 路由器安全技术要求.pdf
GB-T 38129-2019智能工厂安全控制要求.pdf
T-JSIA 0001—2022 能源大数据 数据分类分级指南.pdf
GB-T 27912-2011 金融服务 生物特征识别 安全框架.pdf
GB-T 38186-2019 商用车辆自动紧急制动系统 AEBS 性能要求及试验方法.pdf
GB-T 31507-2015 信息安全技术 智能卡通用安全检测指南.pdf
奇安信 API安全能力建设桔皮书.pdf
1
/
18
评价文档
赞助2.5元 点击下载(1009.9 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
点击进入官方售后微信群
支付 完成后 如未跳转 点击这里下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。