专利一种基于自我学习双向GAN的异常检测方法 -在线下载 -pdf文件-bbs.720life.cn

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202211293373.3 (22)申请日 2022.10.21 (71)申请人南京邮电大学地址 210033 江苏省南京市栖霞区广月路 30-06号申请人安徽晶奇网络科技股份有限公司 (72)发明人叶宁　李向文　徐康　王汝传　王娟　王甦　汪莹　王波　翟浩　李友涛　张结魁　 (74)专利代理机构南京正联知识产权代理有限公司 32243 专利代理师姜梦翔 (51)Int.Cl. G06K 9/62(2022.01) G06N 3/04(2006.01)G06N 3/08(2006.01) (54)发明名称一种基于自我学习双向GAN的异常检测方法 (57)摘要一种基于自我学习双向GAN的异常检测方法，步骤包括：对原始数据集进行筛选过滤，得到只含有正常数据的训练数据集；使用训练数据集对基于原始GAN的异常检测模型进行训练；针对原始GAN模型的缺陷进行模型优化；使用训练数据集对优化后的异常检测模型进行训练；使用优化后的异常检测模型对测试数据集进行异常检测。本发明提出的新模型解决了原始模型中奖励稀疏性和模式崩溃的问题，提高了生成器生成样本的多样性以及异常检测的准确性。权利要求书1页说明书4页附图2页 CN 115496165 A 2022.12.20 CN 115496165 A 1.一种基于自我学习双向GAN的异常检测方法，其特征在于：包括以下步骤：步骤1，对原始数据集进行筛选过滤，得到只含有正常数据的训练数据集；步骤2，使用训练数据集对基于原始GAN的异常检测模型进行训练；步骤3，针对原始GAN模型的缺陷进行模型优化；步骤4，使用训练数据集对优化后的异常检测模型进行训练；步骤5，使用优化后的异常检测模型对测试数据集进行异常检测。 2.根据权利要求1所述的一种基于自我学习双向GAN的异常检测方法，其特征在于：所述步骤1中，将原始训练数据集中的异常数据剔除过滤掉，只保留正常数据用于模型训练。 3.根据权利要求1所述的一种基于自我学习双向GAN的异常检测方法，其特征在于：所述步骤2中的原始GAN模型包括生成器G，编码器E和判别器D，其训练过程包括以下步骤：获取随机噪声z，噪声z作为虚假数据特征传入生成器G中，生成器根据虚假数据特征输出虚假数据G(z)；将真实数据x传入编码器E中，编码器根据真实数据进行编码，输出真实数据特征E(x)；同时将虚假数据 ‑特征元组(G(z),z)和真实数据 ‑特征元组(x,E(x))传入判别器D进行联合判别。 4.根据权利要求1所述的一种基于自我学习双向GAN的异常检测方法，其特征在于：所述步骤3中的模型优化包括：将早期获取的随机噪声z_p和早期生成器生成的虚假数据G(z_p)保存起来，等获取到当前的随机噪声z_n和生成器生成了当前的虚假数据G(z_n)后，将当前虚假数据 ‑特征元组 (G(z_n),z_n)和早期虚假数据 ‑特征元组(G(z_p),z_p)同时传入判别器D进行判别；使用三分类判别器，对传入的测试数据对和参考数据对进行样本质量方面的三分类判别；如果测试数据对比参考数据对的样本质量高，判别器输出1标签；如果测试数据对和参考数据对的样本质量相当，判别器输出0标签；如果测试数据对比参考数据对的样本质量低，判别器输出 ‑1标签。 5.根据权利要求1所述的一种基于自我学习双向GAN的异常检测方法，其特征在于：所述步骤4中对优化后的异常检测模型进行训练，即是重新提取步骤1中已经预处理好的训练数据集，将其输入到步骤3中已经优化好的自我学习双向GAN模型中进行训练，并针对同一数据集比较优化后的模型与原始GAN模型的训练效果。 6.根据权利要求1所述的一种基于自我学习双向GAN的异常检测方法，其特征在于：所述步骤5中的异常检测过程包括以下步骤：先对测试数据集进行简单的预处理，然后将处理好的测试数据集传入步骤4中已经训练好的优化模型中进行异常检测，并且根据异常检测评估指标对优化后的模型性能进行评估。权　利　要　求　书 1/1 页 2 CN 115496165 A 2一种基于自我学习双向GAN的异常检测方法技术领域 [0001]本发明涉及智能运维技术领域，尤其涉及一种基于自我学习双向GAN的异常检测方法。背景技术 [0002]现实生活中的很多智能运维平台系统，如电力系统，水处理系统，过程控制系统等，每天都会生成大量的多元时间序列数据。由于一些网络攻击或者入侵事件的发生，这些数据中会夹杂着一些异常数据，这时就需要通过异常检测技术来检测和剔除这些异常数据。不同于常规模式下的问题和任务，异常检测针对的是少数、不可预测或难以确定的事件，它具有独特的复杂性，使得一般的机器学习和深度学习技术对它无效。如何在导致异常的因素过多，异常通常是不规则的分布，以及异常通常是罕见的数据实例的情况下进行训练与监测，是异常检测面临的主要挑战。发明内容 [0003]针对现有技术的不足，本发明的目的是提供一种基于自我学习双向GAN的异常检测方法，相比单向GAN加快了异常检测的速度，并且解决了原始GAN奖励稀疏性和模式崩溃的缺陷，可以更加快速、准确地检测出系统中的异常数据。 [0004]本发明提供一种基于自我学习双向GAN的异常检测方法，包括以下步骤： [0005]步骤1：对原始数据集进行筛选过滤，得到只含有正常数据的训练数据集； [0006]步骤2：使用训练数据集对基于原始GAN的异常检测模型进行训练； [0007]步骤3：针对原始GAN模型的缺陷进行模型优化； [0008]步骤4：使用训练数据集对优化后的异常检测模型进行训练； [0009]步骤5：使用优化后的异常检测模型对测试数据集进行异常检测。 [0010]进一步地，所述步骤1中对原始数据集进行筛选过滤是指因为用于异常检测的GAN 模型在训练时只学习正常数据的分布情况，所以将原始训练数据集中的异常数据剔除过滤掉，只保留正常数据用于模型训练。 [0011]进一步地，所述步骤2中的原始GAN模型包括生成器G，编码器E和判别器D。其训练过程包括以下步骤： [0012]获取随机噪声z，噪声z作为虚假数据特征传入生成器G中，生成器根据虚假数据特征输出虚假数据G(z)； [0013]将真实数据x传入编码器E中，编码器根据真实数据进行编码，输出真实数据特征E (x)； [0014]同时将虚假数据 ‑特征元组(G(z),z)和真实数据 ‑特征元组(x,E(x))传入判别器D 进行联合判别； [0015]进一步地，所述步骤3中的原始模型缺陷为所述步骤3中的原始模型缺陷为奖励稀疏性和模式崩溃；说　明　书 1/4 页 3 CN 115496165 A 3

专利 一种基于自我学习双向GAN的异常检测方法

专利一种基于自我学习双向GAN的异常检测方法