(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211323097.0 (22)申请日 2022.10.27 (71)申请人 南京华苏 科技有限公司 地址 211300 江苏省南京市高淳区淳溪街 道宝塔路258号苏宁雅居39幢10号 (72)发明人 李鹏博 陈大龙 贺尔欣 孟维  (74)专利代理 机构 南京北辰联和知识产权代理 有限公司 323 50 专利代理师 陆中丹 (51)Int.Cl. G06F 16/36(2019.01) G06F 16/35(2019.01) G06F 16/2458(2019.01) G06F 17/16(2006.01) G06N 3/04(2006.01)G06N 3/08(2006.01) G06Q 50/04(2012.01) (54)发明名称 基于注意力机制的化工事故原因知识图谱 构建方法 (57)摘要 本发明公开了一种基于注意力机制的化工 事故原因知识图谱构建方法, 具体包括以下步 骤: S1: 采集化工事故记录 数据, 对采集到的化工 事故记录数据进行数据清洗; S2: 构建出知识图 谱的模式层; S3: 利用注意力机制构建出知识图 谱的数据层; S4: 形成知识图谱的完善模式层; S5: 将知识图谱中的知识以原因、 实体和 因果关 系三元组的形式导入到知识图谱的数据库中; S6: 对致因要素之间存在的关联关系进行分析, 从而得出关键致因要素, 并针对关键致因要素输 出相应的建议显示结果。 通过模式层、 数据层、 完 善模式层的步骤构建了化工原因事故知识图谱。 该方法可实现自动化抽取文章中的原因实例, 并 构建化工事故原因知识图谱。 权利要求书3页 说明书7页 附图2页 CN 115544272 A 2022.12.30 CN 115544272 A 1.一种基于注意力机制的化工事故原因知识图谱构建方法, 其特征在于, 具体包括以 下步骤: S1: 采集化工事故记录数据, 对 采集到的化工事故记录数据进行 数据清洗; S2: 结合所述 步骤S1化工事故的原因和事故中的元 素, 构建出知识图谱的模式层; S3: 根据原因抽取的流程: 原因识别、 原因元素识别、 原因关系识别, 抽取知识图谱中的 原因、 实体和因果关系, 利用注意力机制构建出知识图谱的数据层; S4: 对所述步骤S3中知识图谱的数据层中的原因实例进行聚类得到了致因要素, 结合 事故原因分类 体系, 挖掘致因要素之间存在的关联关系, 形成知识图谱的完 善模式层; S5: 将知识图谱中的知识以原因、 实体和因果关系三元组的形式导入到知识图谱的数 据库中; S6: 对致因要素之间存在的关联关系进行分析, 从而得出关键致因要素, 并针对关键致 因要素输出相应的建议显示结果。 2.根据权利要求1所述的基于注意力机制的化工事故原因知识图谱构建方法, 其特征 在于, 在所述步骤S2中, 采用SEM事件表示模型确定化工事故的原因和事故中的元素, 所述 SEM事件表 示模型有10种原因属性关系类型: 人的不安全 行为, 行为人, 人物; 人的不安全 行 为, 违反, 规章制度; 物的不安全状态, 主体, 设备; 物的不安全状态, 主体, 危化品; 企业决策 原因, 决策企业, 企业; 组织外部原因, 监管组织, 机构组织; 管理体系原因, 存在问题, 规章 制度; 事故, 发生时间, 时间; 事故, 发生地点, 地点; 事故, 事故的类型, 类型; 其中, 与事故之 间存在的关系有: 直接导 致, 间接导 致和根本原因。 3.根据权利要求1所述的基于注意力机制的化工事故原因知识图谱构建方法, 其特征 在于, 在所述 步骤S4中, 具体处 理步骤为: S4‑1: 首先计算两个句子中所有词 汇间的相似度矩阵, 然后遍历相似度特征矩阵, 取出 相似度最大 的词语组合; 将该相似度所属行和列从相似度特征矩阵中删除, 并用列表记录 下该相似度, 再继续选取余下矩阵中的最大相似度, 然后删除, 直到矩阵中没有元素, 此时 可得到子句中词语相似度最大组合列表: MaxL=[Sim Wmax1, Sim Wmax2,…, Sim Wmaxk]   (1); 其中, Sim Wmax1, Sim Wmax2,…, Sim Wmaxk表示1...k个最大相似度特 征矩阵; 句子s1、 s2的相似度计算公式如下: 其中, k表示最大相似度特征矩阵的数量, i表示1...k中的第i个, 表示第i个最 大相似度特 征矩阵; S4‑2: 对于原因实例聚类使用sklearn提供的评价函数来评价聚类效果, Calinski ‑ Harabasz分数值s的计算公式如下: 其中的m为样本数, k为聚簇数, Bk为聚簇之间的协方差矩阵, Wk为聚簇内数据的协方差 矩阵, tr表示矩阵的迹;权 利 要 求 书 1/3 页 2 CN 115544272 A 2S4‑3: 对所有原因实例进行了聚类, 泛化得到抽象的致因要素, 基于数据驱动的方式将 化工事故中的致因要素完整的罗 列了出来; 根据知识图谱的模式层本体模型构建的流程, 整理致因要 素、 构建本体的分类体系; 对各要素进 行整理, 合并内容相似的要 素得到致因要 素之间的上 下位关系, 并给 出每个致因要素的定义, 构建出化工事故的致因要素分类 体系; 其中, 使用Apriori算法挖掘致因要素之间存在的关联关系, 所述Apriori算法是基于 已知的知识来进行优化, 没有关联关系的致因要素之间的支持度不用计算, 包括企业文化 与安全管理体系之间存在单向关系; 安全管理体系与间接原因之间存在单向的关系; 间接 原因与不安全动作和不安全物态之 间存在单向的关联关系; 不安全动作和不安全物态之间 存在双向的关系。 4.根据权利要求1所述的基于注意力机制的化工事故原因知识图谱构建方法, 其特征 在于, 在所述步骤S6中, 采用DEMATEL影响分析法对致因要素间的关联关系进行分析, 所述 DEMATEL影响分析法具体操作步骤为: S6‑1: 确定系统中的致因要素; S6‑2: 确定因素之间存在的影响关系, 并通过一定的量化方法明确因素之间的影响程 度大小, 从而建立影响度矩阵X; S6‑3: 规范化处 理矩阵X得到矩阵G; S6‑4: 计算系统中致因要素间的综合影响力矩阵T; S6‑5: 计算各致因要素的影响度和被影响度, 致因要素的影响度为矩阵T中各行元素的 相加之和, 被 影响度为矩阵T中各列元 素的相加之和。 5.根据权利要求1 ‑4任一项所述的基于注意力机制的化工事故原因知识图谱构建方 法, 其特征在于, 所述 步骤S1中, 对数据进行清洗时采取以下操作进行处 理: S1‑1: 针对数据描述内容不全问题, 事故描述中没有时间描述, 即没有字符 “年月日”; 没有对原因的描述, 即描述中匹配不到 “原因”有关字样, 则认为该条数据信息不全, 去除该 条数据; S1‑2: 针对数据内容不相 关的问题, 如在事故描述中没有储罐、 油罐类似 的描述, 则认 为该条数据与化工事故无关, 去除该 条数据; S1‑3: 针对数据冗余问题, 抽取两条数据中事故发生的日期和伤亡人数, 然后对每条数 据相互匹配, 如两条数据事故调查报告中的事故发生日期和伤亡人数都相同, 则可以认定 这两条数据事故调查报描述的是同一个事故, 去除其中的一条 数据; S1‑4: 如某一条数据事故调查报告中包含的字数如果少于50字, 可以认定该条数据不 具有有效的事故调查报告, 则去除该 条数据。 6.根据权利要求1 ‑4任一项所述的基于注意力机制的化工事故原因知识图谱构建方 法, 其特征在于, 所述 步骤S2中, 对所述知识图谱的模式层构建包括以下步骤: S2‑1: 在所述知识图谱的模式层的根本原因模块中增 加企业行为决策因素; S2‑2: 将所述知识图谱的模式层中事故致因的直接原因模块, 分成人的不安全行为和 物的不安全状态模块; S2‑3: 将所述知识图谱的模式层中事故致因的间接原因模块进行扩展, 扩展为不安全 常态, 将长期存在的不 安全现状都归到此模块中; S2‑4: 将天气原因、 组织外部有关部门监督和外部供应商的产品和服务质量归到所述权 利 要 求 书 2/3 页 3 CN 115544272 A 3

PDF文档 专利 基于注意力机制的化工事故原因知识图谱构建方法

文档预览
中文文档 13 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于注意力机制的化工事故原因知识图谱构建方法 第 1 页 专利 基于注意力机制的化工事故原因知识图谱构建方法 第 2 页 专利 基于注意力机制的化工事故原因知识图谱构建方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:24:09上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。