国家标准网
文库搜索
切换导航
首页
频道
仅15元无限下载
联系我们
首页
仅15元无限下载
联系我们
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211282420.4 (22)申请日 2022.10.19 (71)申请人 中国农业银行股份有限公司 地址 100005 北京市东城区建国门内大街 69号 (72)发明人 康嘉玮 (74)专利代理 机构 北京集佳知识产权代理有限 公司 11227 专利代理师 杨傥月 (51)Int.Cl. G06F 16/36(2019.01) G06F 16/35(2019.01) G06F 40/295(2020.01) G06F 40/30(2020.01) G06N 3/04(2006.01)G06N 3/08(2006.01) G06Q 40/00(2012.01) (54)发明名称 一种金融标准化领域知识图谱的构建方法 及装置 (57)摘要 本申请提供一种金融标准化领域知识图谱 的构建方法及装置, 基于金融标准文件获取待识 别文本; 所述待识别文本包括多个实体; 对所述 待识别文本进行命名实体识别, 得到命名实体; 所述命名实体包括实体和所述实体的标签; 根据 所述待识别文本和所述命名实体进行关系抽取, 得到命名实体的关系信息, 并根据所述命名实体 的关系信息构建知识图谱。 对金融标准文件构建 知识图谱, 根据知识图谱中包括的命名实体的关 系信息, 对一种金融标准文件进一步分析金融标 准文件以后的改进, 提前布局相关领域, 抢占先 机, 通过知识图谱可以获取到仅仅通过阅读金融 标准文件无法发现关联的关系信息, 提高用户对 金融标准文件的理解程度, 以便用户正确使用金 融标准文 件。 权利要求书2页 说明书11页 附图4页 CN 115438195 A 2022.12.06 CN 115438195 A 1.一种金融标准 化领域知识图谱的构建方法, 其特 征在于, 包括: 基于金融标准文件获取待识别文本; 所述待识别文本包括多个实体; 对所述待识别文本进行命名实体识别, 得到命名实体; 所述命名实体包括实体和所述 实体的标签; 根据所述待识别文本和所述命名实体进行关系抽取, 得到命名实体的关系信息, 并根 据所述命名实体的关系信息构建知识图谱。 2.根据权利要求1所述的方法, 其特征在于, 在所述待识别文本的数据量小于第 一阈值 时, 所述对所述待识别文本进行命名实体识别, 得到命名实体, 包括: 将所述待识别文本和预设规则模板进行匹配, 得到命名实体。 3.根据权利要求2所述的方法, 其特征在于, 所述金融标准文件为TXT文档格 式的论文, 所述预设规则模板包括多个标签, 所述多个标签包括标题、 作者和摘要, 所述将所述待识别 文本和预设规则模板进行匹配, 得到命名实体, 包括: 获取所述待识别文本中第一个非空行及第一个非空行之后的多个连续非空行的第一 文本, 作为标签为标题时对应的第一实体; 将所述标签为标题时对应的第一实体和标题标签作为第一命名实体; 获取所述第 一实体的下一个非空行中的第 二文本, 并以所述第 二文本之间的逗号作为 分隔符划分得到多个第三文本, 将所述多个第三文本作为标签为作者时对应的第二实体; 将所述标签为作者时对应的第二实体和作者标签作为第二命名实体; 通过正则的方式对所述待识别文本进行abstract字段的匹配, 将所述待识别文本中 abstract之后的多个连续的非空行的内容, 作为标签为摘要时对应的第三实体; 将所述标签为摘要时对应的第三实体和所述摘要标签作为第三命名实体。 4.根据权利要求1所述的方法, 其特征在于, 在所述待识别文本的数据量大于或等于第 一阈值时, 所述对所述待识别文本进行命名实体识别, 得到命名实体, 包括: 基于BERT ‑BiLSTM‑CRF模型对所述待识别文本进行命名实体识别, 得到命名实体。 5.根据权利要求1 ‑4任意一项所述的方法, 其特征在于, 在所述待识别文本的数据量小 于第二阈值时, 所述根据所述待识别文本和所述命名实体进行关系抽取, 得到命名实体的 关系信息, 包括: 基于依存句法分析对所述待识别文本和所述命名实体进行关系抽取, 得到命名实体的 关系信息 。 6.根据权利要求1 ‑4任意一项所述的方法, 其特征在于, 在所述待识别文本的数据量大 于或等于第二阈值时, 所述根据所述待识别文本和所述命名实体进行关系抽取, 得到命名 实体的关系信息, 包括: 基于PCNN对所述待识别文本和所述命名实体进行关系抽取, 得到命名实体的关系信 息。 7.根据权利要求1 ‑4任意一项所述的方法, 其特 征在于, 所述方法还 包括: 获取用户输入的查询语句中的实体指称项; 将所述实体指称项与所述知识图谱中的实体进行匹配, 得到候选实体列表; 所述候选 实体列表包括多个实体; 对所述候选实体列表中的多个实体进行相关性排序, 将相关性最大的实体作为目标链权 利 要 求 书 1/2 页 2 CN 115438195 A 2接实体, 并向所述用户展示。 8.一种金融标准 化领域知识图谱的构建装置, 其特 征在于, 包括: 获取单元, 用于基于金融标准文件获取待识别文本; 所述待识别文本包括多个实体; 识别单元, 用于对所述待识别文本进行命名实体识别, 得到命名实体; 所述命名实体包 括实体和所述实体的标签; 构建单元, 用于根据所述待识别文本和所述命名实体进行关系抽取, 得到命名实体的 关系信息, 并根据所述命名实体的关系信息构建知识图谱。 9.一种计算机设备, 其特 征在于, 所述计算机设备包括处 理器以及存 储器: 所述存储器用于存 储程序代码, 并将所述 程序代码传输给 所述处理器; 所述处理器用于根据所述程序代码中的指令执行权利要求1 ‑7中任意一项所述的方 法。 10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质用于存储计算机 程序, 所述计算机程序用于执 行权利要求1 ‑7中任意一项所述的方法。权 利 要 求 书 2/2 页 3 CN 115438195 A 3
专利 一种金融标准化领域知识图谱的构建方法及装置
文档预览
中文文档
18 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 SC 于
2024-02-18 22:24:27
上传分享
举报
下载
原文档
(795.8 KB)
分享
友情链接
思度安全-DSMM-002 岗位职责说明书V1.0.pdf
AQ 2003-2018 轧钢安全规程.pdf
T-CTS 14—2023 城市道路交通安全风险隐患数字化排查指标体系.pdf
GB-T 19536-2015 集装箱底板用胶合板.pdf
GB-T 30277-2013 信息安全技术 公钥基础设施 电子认证机构标识编码规范.pdf
奇安信 2022中国工业数据勒索形势分析报告.pdf
GB-T 30127-2013 纺织品 远红外性能的检测和评价.pdf
民航 E-014 关于燃油箱结构闪电防护要求(CCAR25.981(a)(3))的豁免.pdf
T-ZAWS 002—2023 弧焊设备 物联控制终端 模组 技术要求.pdf
GB-T 34079.1-2021 基于云计算的电子政务公共平台服务规范 第1部分:服务分类与编码.pdf
汽车数据安全管理若干规定(试行).pdf
GB-T 41629.1-2022 额定电压500 kV(Um=550 kV)交联聚乙烯绝缘大长度交流海底电缆及附件 第1部分:试验方法和要求.pdf
GB-T 38129-2019智能工厂安全控制要求.pdf
GB-T 29070-2012 无损检测 工业计算机层析成像 CT 检测 通用要求.pdf
GB-T 33734-2017 机织婴幼儿床上用品.pdf
DB11-T 2111-2023 信息系统运行维护服务 用户单位实施要求 北京市.pdf
GB-T 36681-2018 展览场馆服务管理规范.pdf
DB61-T 1571-2022 城镇污水处理厂污泥处理处置技术规范 陕西省.pdf
GB-T 7932-2017 气动 对系统及其元件的一般规则和安全要求.pdf
GB-T 4990-2010 热电偶用补偿导线合金丝.pdf
1
/
18
评价文档
赞助2.5元 点击下载(795.8 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
点击进入官方售后微信群
支付 完成后 如未跳转 点击这里下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。