专利基于注意力机制的化工事故原因知识图谱构建方法 -在线下载 -pdf文件-bbs.720life.cn

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202211323097.0 (22)申请日 2022.10.27 (71)申请人南京华苏科技有限公司地址 211300 江苏省南京市高淳区淳溪街道宝塔路258号苏宁雅居39幢10号 (72)发明人李鹏博　陈大龙　贺尔欣　孟维　 (74)专利代理机构南京北辰联和知识产权代理有限公司 323 50 专利代理师陆中丹 (51)Int.Cl. G06F 16/36(2019.01) G06F 16/35(2019.01) G06F 16/2458(2019.01) G06F 17/16(2006.01) G06N 3/04(2006.01)G06N 3/08(2006.01) G06Q 50/04(2012.01) (54)发明名称基于注意力机制的化工事故原因知识图谱构建方法 (57)摘要本发明公开了一种基于注意力机制的化工事故原因知识图谱构建方法，具体包括以下步骤： S1：采集化工事故记录数据，对采集到的化工事故记录数据进行数据清洗； S2：构建出知识图谱的模式层； S3：利用注意力机制构建出知识图谱的数据层； S4：形成知识图谱的完善模式层； S5：将知识图谱中的知识以原因、实体和因果关系三元组的形式导入到知识图谱的数据库中； S6：对致因要素之间存在的关联关系进行分析，从而得出关键致因要素，并针对关键致因要素输出相应的建议显示结果。通过模式层、数据层、完善模式层的步骤构建了化工原因事故知识图谱。该方法可实现自动化抽取文章中的原因实例，并构建化工事故原因知识图谱。权利要求书3页说明书7页附图2页 CN 115544272 A 2022.12.30 CN 115544272 A 1.一种基于注意力机制的化工事故原因知识图谱构建方法，其特征在于，具体包括以下步骤： S1：采集化工事故记录数据，对采集到的化工事故记录数据进行数据清洗； S2：结合所述步骤S1化工事故的原因和事故中的元素，构建出知识图谱的模式层； S3：根据原因抽取的流程：原因识别、原因元素识别、原因关系识别，抽取知识图谱中的原因、实体和因果关系，利用注意力机制构建出知识图谱的数据层； S4：对所述步骤S3中知识图谱的数据层中的原因实例进行聚类得到了致因要素，结合事故原因分类体系，挖掘致因要素之间存在的关联关系，形成知识图谱的完善模式层； S5：将知识图谱中的知识以原因、实体和因果关系三元组的形式导入到知识图谱的数据库中； S6：对致因要素之间存在的关联关系进行分析，从而得出关键致因要素，并针对关键致因要素输出相应的建议显示结果。 2.根据权利要求1所述的基于注意力机制的化工事故原因知识图谱构建方法，其特征在于，在所述步骤S2中，采用SEM事件表示模型确定化工事故的原因和事故中的元素，所述 SEM事件表示模型有10种原因属性关系类型：人的不安全行为，行为人，人物；人的不安全行为，违反，规章制度；物的不安全状态，主体，设备；物的不安全状态，主体，危化品；企业决策原因，决策企业，企业；组织外部原因，监管组织，机构组织；管理体系原因，存在问题，规章制度；事故，发生时间，时间；事故，发生地点，地点；事故，事故的类型，类型；其中，与事故之间存在的关系有：直接导致，间接导致和根本原因。 3.根据权利要求1所述的基于注意力机制的化工事故原因知识图谱构建方法，其特征在于，在所述步骤S4中，具体处理步骤为： S4‑1：首先计算两个句子中所有词汇间的相似度矩阵，然后遍历相似度特征矩阵，取出相似度最大的词语组合；将该相似度所属行和列从相似度特征矩阵中删除，并用列表记录下该相似度，再继续选取余下矩阵中的最大相似度，然后删除，直到矩阵中没有元素，此时可得到子句中词语相似度最大组合列表： MaxL＝[Sim Wmax1， Sim Wmax2，…， Sim Wmaxk] (1)；其中， Sim Wmax1， Sim Wmax2，…， Sim Wmaxk表示1...k个最大相似度特征矩阵；句子s1、 s2的相似度计算公式如下：其中， k表示最大相似度特征矩阵的数量， i表示1...k中的第i个，表示第i个最大相似度特征矩阵； S4‑2：对于原因实例聚类使用sklearn提供的评价函数来评价聚类效果， Calinski ‑ Harabasz分数值s的计算公式如下：其中的m为样本数， k为聚簇数， Bk为聚簇之间的协方差矩阵， Wk为聚簇内数据的协方差矩阵， tr表示矩阵的迹；权　利　要　求　书 1/3 页 2 CN 115544272 A 2S4‑3：对所有原因实例进行了聚类，泛化得到抽象的致因要素，基于数据驱动的方式将化工事故中的致因要素完整的罗列了出来；根据知识图谱的模式层本体模型构建的流程，整理致因要素、构建本体的分类体系；对各要素进行整理，合并内容相似的要素得到致因要素之间的上下位关系，并给出每个致因要素的定义，构建出化工事故的致因要素分类体系；其中，使用Apriori算法挖掘致因要素之间存在的关联关系，所述Apriori算法是基于已知的知识来进行优化，没有关联关系的致因要素之间的支持度不用计算，包括企业文化与安全管理体系之间存在单向关系；安全管理体系与间接原因之间存在单向的关系；间接原因与不安全动作和不安全物态之间存在单向的关联关系；不安全动作和不安全物态之间存在双向的关系。 4.根据权利要求1所述的基于注意力机制的化工事故原因知识图谱构建方法，其特征在于，在所述步骤S6中，采用DEMATEL影响分析法对致因要素间的关联关系进行分析，所述 DEMATEL影响分析法具体操作步骤为： S6‑1：确定系统中的致因要素； S6‑2：确定因素之间存在的影响关系，并通过一定的量化方法明确因素之间的影响程度大小，从而建立影响度矩阵X； S6‑3：规范化处理矩阵X得到矩阵G； S6‑4：计算系统中致因要素间的综合影响力矩阵T； S6‑5：计算各致因要素的影响度和被影响度，致因要素的影响度为矩阵T中各行元素的相加之和，被影响度为矩阵T中各列元素的相加之和。 5.根据权利要求1 ‑4任一项所述的基于注意力机制的化工事故原因知识图谱构建方法，其特征在于，所述步骤S1中，对数据进行清洗时采取以下操作进行处理： S1‑1：针对数据描述内容不全问题，事故描述中没有时间描述，即没有字符 “年月日”；没有对原因的描述，即描述中匹配不到 “原因”有关字样，则认为该条数据信息不全，去除该条数据； S1‑2：针对数据内容不相关的问题，如在事故描述中没有储罐、油罐类似的描述，则认为该条数据与化工事故无关，去除该条数据； S1‑3：针对数据冗余问题，抽取两条数据中事故发生的日期和伤亡人数，然后对每条数据相互匹配，如两条数据事故调查报告中的事故发生日期和伤亡人数都相同，则可以认定这两条数据事故调查报描述的是同一个事故，去除其中的一条数据； S1‑4：如某一条数据事故调查报告中包含的字数如果少于50字，可以认定该条数据不具有有效的事故调查报告，则去除该条数据。 6.根据权利要求1 ‑4任一项所述的基于注意力机制的化工事故原因知识图谱构建方法，其特征在于，所述步骤S2中，对所述知识图谱的模式层构建包括以下步骤： S2‑1：在所述知识图谱的模式层的根本原因模块中增加企业行为决策因素； S2‑2：将所述知识图谱的模式层中事故致因的直接原因模块，分成人的不安全行为和物的不安全状态模块； S2‑3：将所述知识图谱的模式层中事故致因的间接原因模块进行扩展，扩展为不安全常态，将长期存在的不安全现状都归到此模块中； S2‑4：将天气原因、组织外部有关部门监督和外部供应商的产品和服务质量归到所述权　利　要　求　书 2/3 页 3 CN 115544272 A 3

专利 基于注意力机制的化工事故原因知识图谱构建方法

专利基于注意力机制的化工事故原因知识图谱构建方法