(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211323097.0
(22)申请日 2022.10.27
(71)申请人 南京华苏 科技有限公司
地址 211300 江苏省南京市高淳区淳溪街
道宝塔路258号苏宁雅居39幢10号
(72)发明人 李鹏博 陈大龙 贺尔欣 孟维
(74)专利代理 机构 南京北辰联和知识产权代理
有限公司 323 50
专利代理师 陆中丹
(51)Int.Cl.
G06F 16/36(2019.01)
G06F 16/35(2019.01)
G06F 16/2458(2019.01)
G06F 17/16(2006.01)
G06N 3/04(2006.01)G06N 3/08(2006.01)
G06Q 50/04(2012.01)
(54)发明名称
基于注意力机制的化工事故原因知识图谱
构建方法
(57)摘要
本发明公开了一种基于注意力机制的化工
事故原因知识图谱构建方法, 具体包括以下步
骤: S1: 采集化工事故记录 数据, 对采集到的化工
事故记录数据进行数据清洗; S2: 构建出知识图
谱的模式层; S3: 利用注意力机制构建出知识图
谱的数据层; S4: 形成知识图谱的完善模式层;
S5: 将知识图谱中的知识以原因、 实体和 因果关
系三元组的形式导入到知识图谱的数据库中;
S6: 对致因要素之间存在的关联关系进行分析,
从而得出关键致因要素, 并针对关键致因要素输
出相应的建议显示结果。 通过模式层、 数据层、 完
善模式层的步骤构建了化工原因事故知识图谱。
该方法可实现自动化抽取文章中的原因实例, 并
构建化工事故原因知识图谱。
权利要求书3页 说明书7页 附图2页
CN 115544272 A
2022.12.30
CN 115544272 A
1.一种基于注意力机制的化工事故原因知识图谱构建方法, 其特征在于, 具体包括以
下步骤:
S1: 采集化工事故记录数据, 对 采集到的化工事故记录数据进行 数据清洗;
S2: 结合所述 步骤S1化工事故的原因和事故中的元 素, 构建出知识图谱的模式层;
S3: 根据原因抽取的流程: 原因识别、 原因元素识别、 原因关系识别, 抽取知识图谱中的
原因、 实体和因果关系, 利用注意力机制构建出知识图谱的数据层;
S4: 对所述步骤S3中知识图谱的数据层中的原因实例进行聚类得到了致因要素, 结合
事故原因分类 体系, 挖掘致因要素之间存在的关联关系, 形成知识图谱的完 善模式层;
S5: 将知识图谱中的知识以原因、 实体和因果关系三元组的形式导入到知识图谱的数
据库中;
S6: 对致因要素之间存在的关联关系进行分析, 从而得出关键致因要素, 并针对关键致
因要素输出相应的建议显示结果。
2.根据权利要求1所述的基于注意力机制的化工事故原因知识图谱构建方法, 其特征
在于, 在所述步骤S2中, 采用SEM事件表示模型确定化工事故的原因和事故中的元素, 所述
SEM事件表 示模型有10种原因属性关系类型: 人的不安全 行为, 行为人, 人物; 人的不安全 行
为, 违反, 规章制度; 物的不安全状态, 主体, 设备; 物的不安全状态, 主体, 危化品; 企业决策
原因, 决策企业, 企业; 组织外部原因, 监管组织, 机构组织; 管理体系原因, 存在问题, 规章
制度; 事故, 发生时间, 时间; 事故, 发生地点, 地点; 事故, 事故的类型, 类型; 其中, 与事故之
间存在的关系有: 直接导 致, 间接导 致和根本原因。
3.根据权利要求1所述的基于注意力机制的化工事故原因知识图谱构建方法, 其特征
在于, 在所述 步骤S4中, 具体处 理步骤为:
S4‑1: 首先计算两个句子中所有词 汇间的相似度矩阵, 然后遍历相似度特征矩阵, 取出
相似度最大 的词语组合; 将该相似度所属行和列从相似度特征矩阵中删除, 并用列表记录
下该相似度, 再继续选取余下矩阵中的最大相似度, 然后删除, 直到矩阵中没有元素, 此时
可得到子句中词语相似度最大组合列表:
MaxL=[Sim Wmax1, Sim Wmax2,…, Sim Wmaxk] (1);
其中, Sim Wmax1, Sim Wmax2,…, Sim Wmaxk表示1...k个最大相似度特 征矩阵;
句子s1、 s2的相似度计算公式如下:
其中, k表示最大相似度特征矩阵的数量, i表示1...k中的第i个,
表示第i个最
大相似度特 征矩阵;
S4‑2: 对于原因实例聚类使用sklearn提供的评价函数来评价聚类效果, Calinski ‑
Harabasz分数值s的计算公式如下:
其中的m为样本数, k为聚簇数, Bk为聚簇之间的协方差矩阵, Wk为聚簇内数据的协方差
矩阵, tr表示矩阵的迹;权 利 要 求 书 1/3 页
2
CN 115544272 A
2S4‑3: 对所有原因实例进行了聚类, 泛化得到抽象的致因要素, 基于数据驱动的方式将
化工事故中的致因要素完整的罗 列了出来; 根据知识图谱的模式层本体模型构建的流程,
整理致因要 素、 构建本体的分类体系; 对各要素进 行整理, 合并内容相似的要 素得到致因要
素之间的上 下位关系, 并给 出每个致因要素的定义, 构建出化工事故的致因要素分类 体系;
其中, 使用Apriori算法挖掘致因要素之间存在的关联关系, 所述Apriori算法是基于
已知的知识来进行优化, 没有关联关系的致因要素之间的支持度不用计算, 包括企业文化
与安全管理体系之间存在单向关系; 安全管理体系与间接原因之间存在单向的关系; 间接
原因与不安全动作和不安全物态之 间存在单向的关联关系; 不安全动作和不安全物态之间
存在双向的关系。
4.根据权利要求1所述的基于注意力机制的化工事故原因知识图谱构建方法, 其特征
在于, 在所述步骤S6中, 采用DEMATEL影响分析法对致因要素间的关联关系进行分析, 所述
DEMATEL影响分析法具体操作步骤为:
S6‑1: 确定系统中的致因要素;
S6‑2: 确定因素之间存在的影响关系, 并通过一定的量化方法明确因素之间的影响程
度大小, 从而建立影响度矩阵X;
S6‑3: 规范化处 理矩阵X得到矩阵G;
S6‑4: 计算系统中致因要素间的综合影响力矩阵T;
S6‑5: 计算各致因要素的影响度和被影响度, 致因要素的影响度为矩阵T中各行元素的
相加之和, 被 影响度为矩阵T中各列元 素的相加之和。
5.根据权利要求1 ‑4任一项所述的基于注意力机制的化工事故原因知识图谱构建方
法, 其特征在于, 所述 步骤S1中, 对数据进行清洗时采取以下操作进行处 理:
S1‑1: 针对数据描述内容不全问题, 事故描述中没有时间描述, 即没有字符 “年月日”;
没有对原因的描述, 即描述中匹配不到 “原因”有关字样, 则认为该条数据信息不全, 去除该
条数据;
S1‑2: 针对数据内容不相 关的问题, 如在事故描述中没有储罐、 油罐类似 的描述, 则认
为该条数据与化工事故无关, 去除该 条数据;
S1‑3: 针对数据冗余问题, 抽取两条数据中事故发生的日期和伤亡人数, 然后对每条数
据相互匹配, 如两条数据事故调查报告中的事故发生日期和伤亡人数都相同, 则可以认定
这两条数据事故调查报描述的是同一个事故, 去除其中的一条 数据;
S1‑4: 如某一条数据事故调查报告中包含的字数如果少于50字, 可以认定该条数据不
具有有效的事故调查报告, 则去除该 条数据。
6.根据权利要求1 ‑4任一项所述的基于注意力机制的化工事故原因知识图谱构建方
法, 其特征在于, 所述 步骤S2中, 对所述知识图谱的模式层构建包括以下步骤:
S2‑1: 在所述知识图谱的模式层的根本原因模块中增 加企业行为决策因素;
S2‑2: 将所述知识图谱的模式层中事故致因的直接原因模块, 分成人的不安全行为和
物的不安全状态模块;
S2‑3: 将所述知识图谱的模式层中事故致因的间接原因模块进行扩展, 扩展为不安全
常态, 将长期存在的不 安全现状都归到此模块中;
S2‑4: 将天气原因、 组织外部有关部门监督和外部供应商的产品和服务质量归到所述权 利 要 求 书 2/3 页
3
CN 115544272 A
3
专利 基于注意力机制的化工事故原因知识图谱构建方法
文档预览
中文文档
13 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:24:09上传分享