(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211293373.3 (22)申请日 2022.10.21 (71)申请人 南京邮电大 学 地址 210033 江苏省南京市栖霞区广月路 30-06号 申请人 安徽晶奇网络科技股份有限公司 (72)发明人 叶宁 李向文 徐康 王汝传  王娟 王甦 汪莹 王波 翟浩  李友涛 张结魁  (74)专利代理 机构 南京正联知识产权代理有限 公司 32243 专利代理师 姜梦翔 (51)Int.Cl. G06K 9/62(2022.01) G06N 3/04(2006.01)G06N 3/08(2006.01) (54)发明名称 一种基于自我学习双向GAN的异常检测方法 (57)摘要 一种基于自我学习双向GAN的异常检测方 法, 步骤包括: 对原始数据集进行筛选过滤, 得到 只含有正常数据的训练数据集; 使用训练数据集 对基于原始GAN的异常检测模型进行训练; 针对 原始GAN模型的缺陷进行模型优化; 使用训练数 据集对优化后的异常检测模型进行训练; 使用优 化后的异常检测模型对测试数据集进行异常检 测。 本发明提出的新模型解决了原始模型中奖励 稀疏性和模式崩溃的问题, 提高了生成器生成样 本的多样性以及异常检测的准确性。 权利要求书1页 说明书4页 附图2页 CN 115496165 A 2022.12.20 CN 115496165 A 1.一种基于自我学习双向GAN的异常检测方法, 其特 征在于: 包括以下步骤: 步骤1, 对原 始数据集进行筛 选过滤, 得到只含有正常数据的训练数据集; 步骤2, 使用训练数据集对基于原 始GAN的异常检测模型进行训练; 步骤3, 针对原 始GAN模型的缺陷进行模型优化; 步骤4, 使用训练数据集对 优化后的异常检测模型进行训练; 步骤5, 使用优化后的异常检测模型对测试 数据集进行异常检测。 2.根据权利要求1所述的一种基于自我学习双向GAN的异常检测方法, 其特征在于: 所 述步骤1中, 将原 始训练数据集中的异常数据剔除过 滤掉, 只保留正常数据用于模型训练。 3.根据权利要求1所述的一种基于自我学习双向GAN的异常检测方法, 其特征在于: 所 述步骤2中的原 始GAN模型包括 生成器G, 编码器E和判别器D, 其训练过程包括以下步骤: 获取随机噪声z, 噪声z作为虚假数据特征传入生成器G中, 生成器根据虚假数据特征输 出虚假数据G(z); 将真实数据x传入编码器E中, 编码器根据真实数据进行编码, 输出真实数据特 征E(x); 同时将虚假数据 ‑特征元组(G(z),z)和真实数据 ‑特征元组(x,E(x))传入判别器D进行 联合判别。 4.根据权利要求1所述的一种基于自我学习双向GAN的异常检测方法, 其特征在于: 所 述步骤3中的模型优化包括: 将早期获取的随机噪声z_p和早期生成器生成的虚假数据G(z_p)保存起来, 等获取到 当前的随机噪声z_n和生 成器生成了当前的虚 假数据G(z_n)后, 将当前虚假数据 ‑特征元组 (G(z_n),z_n)和早期虚假数据 ‑特征元组(G(z_p),z_p)同时传入判别器D进行判别; 使用三分类判别器, 对传入的测试数据对和参考数据对进行样本质量方面的三分类判 别; 如果测试数据对比参考数据对的样本质量高, 判别器输出1标签; 如果测试数据对和参 考数据对的样本质量相当, 判别器输出0标签; 如果测试数据对比参考数据对的样本质量 低, 判别器输出 ‑1标签。 5.根据权利要求1所述的一种基于自我学习双向GAN的异常检测方法, 其特征在于: 所 述步骤4中对优化后的异常检测模型进 行训练, 即是重新提取步骤1中已经预 处理好的训练 数据集, 将其输入到步骤3中已经优化好的自我学习双向GAN模型中进行训练, 并针对同一 数据集比较优化后的模型与原 始GAN模型的训练效果。 6.根据权利要求1所述的一种基于自我学习双向GAN的异常检测方法, 其特征在于: 所 述步骤5中的异常检测过程包括以下步骤: 先对测试数据集进行简单的预处理, 然后将处理好的测试数据集传入步骤4中已经训 练好的优化模型中进 行异常检测, 并且根据异常检测评估指标对优化后的模型性能进 行评 估。权 利 要 求 书 1/1 页 2 CN 115496165 A 2一种基于自我学习双向GAN的异常检测方 法 技术领域 [0001]本发明涉及智能运维技术领域, 尤其涉及一种基于自我学习双向GAN的异常检测 方法。 背景技术 [0002]现实生活中的很多智能运维平台系统, 如电力系统, 水处理系统, 过程控制系统 等, 每天都会生 成大量的多元时间序列数据。 由于一些网络攻击或者入侵事件的发生, 这些 数据中会夹杂着一些异常数据, 这时就需要通过异常检测技术来检测和剔除这些异常数 据。 不同于常规模式下的问题和任务, 异常检测针对的是少数、 不可预测或难以确定的事 件, 它具有独特的复杂性, 使得一般的机器学习和深度学习技术对它无效。 如何在导致异常 的因素过多, 异常通常是不规则的分布, 以及异常通常是罕见的数据实例的情况下进行训 练与监测, 是异常检测面临的主 要挑战。 发明内容 [0003]针对现有技术的不足, 本发明的目的是提供一种基于自我学习双向GAN的异常检 测方法, 相比单向GAN加快了异常检测的速度, 并且解决了原始GAN奖励稀疏性和模式崩溃 的缺陷, 可以更加快速、 准确地检测出系统中的异常数据。 [0004]本发明提供一种基于自我学习双向GAN的异常检测方法, 包括以下步骤: [0005]步骤1: 对原 始数据集进行筛 选过滤, 得到只含有正常数据的训练数据集; [0006]步骤2: 使用训练数据集对基于原 始GAN的异常检测模型进行训练; [0007]步骤3: 针对原 始GAN模型的缺陷进行模型优化; [0008]步骤4: 使用训练数据集对 优化后的异常检测模型进行训练; [0009]步骤5: 使用优化后的异常检测模型对测试 数据集进行异常检测。 [0010]进一步地, 所述步骤1中对原始 数据集进行筛选过滤是指因为用于异常检测的GAN 模型在训练 时只学习正常数据的分布情况, 所以将原始训练数据集中的异常数据剔除过滤 掉, 只保留正常数据用于模型训练。 [0011]进一步地, 所述步骤2中的原始GAN模型包括生成器G, 编码器E和判别器D。 其训练 过程包括以下步骤: [0012]获取随机噪声z, 噪声z作为虚假数据特征传入生成器G中, 生成器根据虚假数据特 征输出虚假数据G(z); [0013]将真实数据x传入编码器E中, 编码器根据真实数据进行编码, 输出真实数据特征E (x); [0014]同时将虚假数据 ‑特征元组(G(z),z)和真实数据 ‑特征元组(x,E(x))传入判别器D 进行联合判别; [0015]进一步地, 所述步骤3中的原始模型缺陷为所述步骤3中的原始模型缺陷为奖励稀 疏性和模式崩溃;说 明 书 1/4 页 3 CN 115496165 A 3

PDF文档 专利 一种基于自我学习双向GAN的异常检测方法

文档预览
中文文档 8 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共8页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于自我学习双向GAN的异常检测方法 第 1 页 专利 一种基于自我学习双向GAN的异常检测方法 第 2 页 专利 一种基于自我学习双向GAN的异常检测方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:24:20上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。