国家标准网
文库搜索
切换导航
首页
频道
仅15元无限下载
联系我们
首页
仅15元无限下载
联系我们
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211472983.X (22)申请日 2022.11.23 (71)申请人 中国人民解 放军国防科技大 学 地址 410073 湖南省长 沙市开福区德雅路 109号 (72)发明人 谭立君 胡艳丽 周庄易 朱煜琛 张馨予 李宏阳 蔡琦 (74)专利代理 机构 长沙大珂知识产权代理事务 所(普通合伙) 4323 6 专利代理师 伍志祥 (51)Int.Cl. G06F 16/35(2019.01) G06F 40/211(2020.01) G06F 40/247(2020.01) G06F 40/284(2020.01)G06F 40/30(2020.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 基于信息融合和数据增强的篇章级事件检 测方法 (57)摘要 本发明公开了基于信息融合和数据增强的 篇章级事件检测方法, 步骤包括: 预训练得到句 子的词嵌入向量; 将向量输入编码层提取句子的 序列特征, 并通过自注意力机制获得语句上下文 信息; 将词向量、 语句序列信息和上下文信息解 码得到每个token对应的事件标签向量; 将事件 标签向量进行句子级的信息聚合, 将聚合后的前 后相邻句语义信息作为当前语句的输入再次解 码; 将解码层每次迭代得到的语句信息加权求和 后, 通过Softmax层得到序列标注结果。 本发明基 于信息融合和数据增强的事件检测方法, 应用神 经网络模型充分地提取了文档级的上下文信息 及事件相关性, 实现语义信息的跨句传播, 有效 提升了模型的稳定性和准确性。 权利要求书4页 说明书11页 附图2页 CN 115510236 A 2022.12.23 CN 115510236 A 1.基于信息融合和数据增强的篇 章级事件检测方法, 其特 征在于, 包括以下步骤: 使用词嵌入层, 通过语句预训练得到词嵌入向量; 将所述词嵌入向量输入编码层提取句子的序列 特征, 并通过自注意力 机制获得语句上 下文信息; 将所述序列 特征和上下文信 息输入解码层以综合解码层信 息处理的结果, 解码得到每 个token对应的事 件标签向量; 将所述事件标签向量输入信 息融合模块进行句子级的信 息聚合, 并将聚合后的前一句 和后一句的事 件信息作为当前语句的输入再次解码, 通过迭代, 实现跨句信息的不断传播; 将每次迭代得到的语句信息加权求和, 并通过Softmax层得到最后的序列标注结果; 将数据集 通过同义词替换增强后, 加入 模型进行训练。 2.根据权利要求1所述的基于信息融合和数据增强的篇章级事件检测方法, 其特征在 于, 将事件检测任务视为一个序列到序列的标注问题, 并使用BIO标注模式进行建模, 其中 “B”为begin,“B‑X”表示此元素在片段的开始位置且所在的片段属于X类型; “I”为inside, “I‑Y”表示此元素在片段的中间位置且所在的片段属于Y类型, “O”为outside, 表示所在的 片段不属于任何类型。 3.根据权利要求1所述的基于信息融合和数据增强的篇章级事件检测方法, 其特征在 于, 通过串 联每个token的词嵌入和NER类型嵌入得到其 综合的词向量表 示, 其中, 词嵌入矩 阵由Skip ‑gram模型预训练, NER类型嵌入矩阵在训练过程中随机初始化和更新; 对于给定 的token , 其综合嵌入向量表示 为 。 4.根据权利要求1所述的基于信息融合和数据增强的篇章级事件检测方法, 其特征在 于, 将BiLSTM模型应用于句子级语义编码, 获取每个token的序列信息和上下文信息, 编码 后的向量表示 为 。 5.根据权利要求1所述的基于信息融合和数据增强的篇章级事件检测方法, 其特征在 于, 对于每个token , 使用自注意力机制将句子中所有token的语 义信息加权平均后, 作为 其远距离的上 下文表示; 注意力权值 为: 其中 是当前时刻t第j个token的注意力权重, 是第j个token的得分值, 是任一token的得分值, 是当前时刻t的目标状态, 是所有的源状态, 是参数矩 阵, 是偏置项; 由此, 的上下文表示为 , 连接 的词嵌入和上下文表示 得到 的最终语义表示为: , 其中 是第j个token的经过BiLSTM编码的语义 向量, 是 经过注意力机制加权的语义向量, 是 的词嵌入表示;权 利 要 求 书 1/4 页 2 CN 115510236 A 2将上下文向量c直接转化为 , 这等价于用退化的注意力权值表示, 即: , 是t时刻第 个token的注意力权重, 是t时 刻 的注意力权 重; 先前涉及的事件信息辅助确定由第t个token触发的事件类型, 这种关联由前向解码获 取: 其中, 是前向RNN, 是前向RNN的状态值序列, 是前向事件 标签向量序列, t为对应时刻, 是参数矩阵, 是偏置项, 是操作函数; 如果当前句子的后续语句提到关联事 件, 通过后向解码来捕获这种依赖关系: 其中 是后向RNN, 是后向RNN的状态值序列, 是后向事件标签向量序列, t 为对应时刻; 通过将 和 连接起来, 利用双向解码来对句子中的事件相互关联性进行建模, 得到事件标签向量 , 从而获取了双向事件的关联关系; 由于 为间接输 入, 因此 还携带了语义信息和事 件相关的实体信息 。 6.根据权利要求5所述的基于信息融合和数据增强的篇章级事件检测方法, 其特征在 于, 将所述事 件标签向量输入信息融合模块进行句子级的信息聚合, 包括: 对当前句子 , 采用另一个以事件标记向量 作为输入的LSTM层, 则第t个token处的 信息为: 为第t‑1个token处的信息, 将最后一个状态 作为一个句子的综合表示, 即 。 7.根据权利要求1所述的基于信息融合和数据增强的篇章级事件检测方法, 其特征在 于, 通过用 和 扩展输入来整合跨句信息, 是第 个句子的综合表示, 是 第 个句子的综合表示, 并通过循环将相邻句子的信息迭代地聚合到当前句子, 实现语 句信息的跨句传播: 一个迭代结构由解码层和信息融合模块组成; 对于给定的句子 , 第k次迭代的输出用 下式计算:权 利 要 求 书 2/4 页 3 CN 115510236 A 3
专利 基于信息融合和数据增强的篇章级事件检测方法
文档预览
中文文档
18 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 SC 于
2024-02-18 22:23:45
上传分享
举报
下载
原文档
(749.8 KB)
分享
友情链接
GB-T 7826-2012 系统可靠性分析技术 失效模式和影响分析 FMEA 程序.pdf
GB-T 35361-2017 潜水器钛合金对接焊缝超声波检测及质量分级.pdf
NIST评估信息安全持续监控项目指南评估方法一 .pdf
T-ZSA 164—2023 人工智能应用创新 智能云基础设施技术规范.pdf
MITRE 世界一流的网络安全运营中心的11项战略 英文版.pdf
逐浪大模型:互联网巨头的AI野望.pdf
NB-T 10682-2021 数字化继电保护现场系统级检测规范.pdf
T-CIATCM 016—2019 针灸科电子病历基本数据集.pdf
WS-T 795-2022 儿科输血指南.pdf
DB65-T 4529—2022 三相异步电动机节能监测 新疆维吾尔自治区.pdf
DB3301-T 0213-2018 城市道路防沉降检查井盖和雨水口技术管理规范 杭州市.pdf
GB-T 22102-2008 防腐木材.pdf
拐点 站在AI颠覆世界的前夜 万维钢.pdf
ISO 31000-2018.pdf
GM-T 0057-2018 基于IBC技术的身份鉴别规范.pdf
GB-T 12603-2005 金属热处理工艺分类及代号.pdf
T-GDNAS 003—2022 ECMO导管维护技术规范.pdf
GB-T 21141-2007 防沙治沙技术规范.pdf
DB11-T 1190.2-2018 古建筑结构安全性鉴定技术规范 第2部分:石质构件 北京市.pdf
GB-T 7965-2002 声学 水声换能器测量.pdf
1
/
18
评价文档
赞助2.5元 点击下载(749.8 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
点击进入官方售后微信群
支付 完成后 如未跳转 点击这里下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。