(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211293373.3
(22)申请日 2022.10.21
(71)申请人 南京邮电大 学
地址 210033 江苏省南京市栖霞区广月路
30-06号
申请人 安徽晶奇网络科技股份有限公司
(72)发明人 叶宁 李向文 徐康 王汝传
王娟 王甦 汪莹 王波 翟浩
李友涛 张结魁
(74)专利代理 机构 南京正联知识产权代理有限
公司 32243
专利代理师 姜梦翔
(51)Int.Cl.
G06K 9/62(2022.01)
G06N 3/04(2006.01)G06N 3/08(2006.01)
(54)发明名称
一种基于自我学习双向GAN的异常检测方法
(57)摘要
一种基于自我学习双向GAN的异常检测方
法, 步骤包括: 对原始数据集进行筛选过滤, 得到
只含有正常数据的训练数据集; 使用训练数据集
对基于原始GAN的异常检测模型进行训练; 针对
原始GAN模型的缺陷进行模型优化; 使用训练数
据集对优化后的异常检测模型进行训练; 使用优
化后的异常检测模型对测试数据集进行异常检
测。 本发明提出的新模型解决了原始模型中奖励
稀疏性和模式崩溃的问题, 提高了生成器生成样
本的多样性以及异常检测的准确性。
权利要求书1页 说明书4页 附图2页
CN 115496165 A
2022.12.20
CN 115496165 A
1.一种基于自我学习双向GAN的异常检测方法, 其特 征在于: 包括以下步骤:
步骤1, 对原 始数据集进行筛 选过滤, 得到只含有正常数据的训练数据集;
步骤2, 使用训练数据集对基于原 始GAN的异常检测模型进行训练;
步骤3, 针对原 始GAN模型的缺陷进行模型优化;
步骤4, 使用训练数据集对 优化后的异常检测模型进行训练;
步骤5, 使用优化后的异常检测模型对测试 数据集进行异常检测。
2.根据权利要求1所述的一种基于自我学习双向GAN的异常检测方法, 其特征在于: 所
述步骤1中, 将原 始训练数据集中的异常数据剔除过 滤掉, 只保留正常数据用于模型训练。
3.根据权利要求1所述的一种基于自我学习双向GAN的异常检测方法, 其特征在于: 所
述步骤2中的原 始GAN模型包括 生成器G, 编码器E和判别器D, 其训练过程包括以下步骤:
获取随机噪声z, 噪声z作为虚假数据特征传入生成器G中, 生成器根据虚假数据特征输
出虚假数据G(z);
将真实数据x传入编码器E中, 编码器根据真实数据进行编码, 输出真实数据特 征E(x);
同时将虚假数据 ‑特征元组(G(z),z)和真实数据 ‑特征元组(x,E(x))传入判别器D进行
联合判别。
4.根据权利要求1所述的一种基于自我学习双向GAN的异常检测方法, 其特征在于: 所
述步骤3中的模型优化包括:
将早期获取的随机噪声z_p和早期生成器生成的虚假数据G(z_p)保存起来, 等获取到
当前的随机噪声z_n和生 成器生成了当前的虚 假数据G(z_n)后, 将当前虚假数据 ‑特征元组
(G(z_n),z_n)和早期虚假数据 ‑特征元组(G(z_p),z_p)同时传入判别器D进行判别;
使用三分类判别器, 对传入的测试数据对和参考数据对进行样本质量方面的三分类判
别; 如果测试数据对比参考数据对的样本质量高, 判别器输出1标签; 如果测试数据对和参
考数据对的样本质量相当, 判别器输出0标签; 如果测试数据对比参考数据对的样本质量
低, 判别器输出 ‑1标签。
5.根据权利要求1所述的一种基于自我学习双向GAN的异常检测方法, 其特征在于: 所
述步骤4中对优化后的异常检测模型进 行训练, 即是重新提取步骤1中已经预 处理好的训练
数据集, 将其输入到步骤3中已经优化好的自我学习双向GAN模型中进行训练, 并针对同一
数据集比较优化后的模型与原 始GAN模型的训练效果。
6.根据权利要求1所述的一种基于自我学习双向GAN的异常检测方法, 其特征在于: 所
述步骤5中的异常检测过程包括以下步骤:
先对测试数据集进行简单的预处理, 然后将处理好的测试数据集传入步骤4中已经训
练好的优化模型中进 行异常检测, 并且根据异常检测评估指标对优化后的模型性能进 行评
估。权 利 要 求 书 1/1 页
2
CN 115496165 A
2一种基于自我学习双向GAN的异常检测方 法
技术领域
[0001]本发明涉及智能运维技术领域, 尤其涉及一种基于自我学习双向GAN的异常检测
方法。
背景技术
[0002]现实生活中的很多智能运维平台系统, 如电力系统, 水处理系统, 过程控制系统
等, 每天都会生 成大量的多元时间序列数据。 由于一些网络攻击或者入侵事件的发生, 这些
数据中会夹杂着一些异常数据, 这时就需要通过异常检测技术来检测和剔除这些异常数
据。 不同于常规模式下的问题和任务, 异常检测针对的是少数、 不可预测或难以确定的事
件, 它具有独特的复杂性, 使得一般的机器学习和深度学习技术对它无效。 如何在导致异常
的因素过多, 异常通常是不规则的分布, 以及异常通常是罕见的数据实例的情况下进行训
练与监测, 是异常检测面临的主 要挑战。
发明内容
[0003]针对现有技术的不足, 本发明的目的是提供一种基于自我学习双向GAN的异常检
测方法, 相比单向GAN加快了异常检测的速度, 并且解决了原始GAN奖励稀疏性和模式崩溃
的缺陷, 可以更加快速、 准确地检测出系统中的异常数据。
[0004]本发明提供一种基于自我学习双向GAN的异常检测方法, 包括以下步骤:
[0005]步骤1: 对原 始数据集进行筛 选过滤, 得到只含有正常数据的训练数据集;
[0006]步骤2: 使用训练数据集对基于原 始GAN的异常检测模型进行训练;
[0007]步骤3: 针对原 始GAN模型的缺陷进行模型优化;
[0008]步骤4: 使用训练数据集对 优化后的异常检测模型进行训练;
[0009]步骤5: 使用优化后的异常检测模型对测试 数据集进行异常检测。
[0010]进一步地, 所述步骤1中对原始 数据集进行筛选过滤是指因为用于异常检测的GAN
模型在训练 时只学习正常数据的分布情况, 所以将原始训练数据集中的异常数据剔除过滤
掉, 只保留正常数据用于模型训练。
[0011]进一步地, 所述步骤2中的原始GAN模型包括生成器G, 编码器E和判别器D。 其训练
过程包括以下步骤:
[0012]获取随机噪声z, 噪声z作为虚假数据特征传入生成器G中, 生成器根据虚假数据特
征输出虚假数据G(z);
[0013]将真实数据x传入编码器E中, 编码器根据真实数据进行编码, 输出真实数据特征E
(x);
[0014]同时将虚假数据 ‑特征元组(G(z),z)和真实数据 ‑特征元组(x,E(x))传入判别器D
进行联合判别;
[0015]进一步地, 所述步骤3中的原始模型缺陷为所述步骤3中的原始模型缺陷为奖励稀
疏性和模式崩溃;说 明 书 1/4 页
3
CN 115496165 A
3
专利 一种基于自我学习双向GAN的异常检测方法
文档预览
中文文档
8 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共8页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:24:20上传分享