专利基于卷积变分自编码器的日负荷曲线聚类方法 -在线下载 -pdf文件-bbs.720life.cn

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202211401329.X (22)申请日 2022.11.09 (71)申请人四川大学地址 610000 四川省成都市一环路南一段 24号 (72)发明人曾琦　李晨鑫　史云翔　朱玲俐　 (74)专利代理机构成都时誉知识产权代理事务所(普通合伙) 5125 0 专利代理师李春彦 (51)Int.Cl. G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06Q 50/06(2012.01) (54)发明名称基于卷积变分自编码器的日负荷曲线聚类方法 (57)摘要本发明涉及基于卷积变分自编码器的日负荷曲线聚类方法，属于电力系统数据处理技术领域，提出采用卷积变分自编码器，利用其优秀的重构能力和神经网络的非线性学习能力提取用户日负荷曲线的时序特征，并实现数据降维，再将提取到的潜在表征通过K ‑means算法进行聚类，同时利用高斯距离加权优化典型的日负荷曲线。通过和其他聚类方式的DBI聚类指标相对比，证明本论文提出的卷积变分自编码器用于聚类的有效性。权利要求书2页说明书10页附图3页 CN 115526277 A 2022.12.27 CN 115526277 A 1.基于卷积变分自编码器的日负荷曲线聚类方法，其特征在于，包括以下步骤： S1、采用数据删除、异常数据检测并替换、数据归一化对原始日负荷数据实现预处理； S2、利用卷积变分自编码器对负荷数据进行降维和重构，将重构误差和分布误差一起作为损失函数，得到日负荷曲线的潜在表征； S3、将降维后的数据用K ‑means算法得到聚类标签和聚类中心，将聚类标签分配给原始负荷数据，聚类中心再通过解码器还原，得到原始数据的聚类中心； S4、将每一类的某一个时刻的负荷功率根据与聚类中心的距离设置不同的高斯权值，从而优化典型的日负荷曲线。 2.如权利要求1所述的基于卷积变分自编码器的日负荷曲线聚类方法，其特征在于，步骤S1中数据删除具体如下：针对负荷数据中存在缺失数据、存在大于20个数据点测量数据为0或整天采集数据值无变化的负荷数据采取删除操作。 3.如权利要求2所述的基于卷积变分自编码器的日负荷曲线聚类方法，其特征在于，步骤S1中异常数据检测并替换具体如下：使用四分位距法对负荷数据进行检测，根据每天96个数据的上四分位数Q3和下四分位数Q1，并给予一定裕度，形成一个筛选区间，在筛选区间内的为有效数据，在筛选区间外的为异常数据，并且将异常数据用有效数据的均值替代。 4.如权利要求3所述的基于卷积变分自编码器的日负荷曲线聚类方法，其特征在于，步骤S1中数据归一化具体如下：采用对每条日负荷曲线进行最大最小值归一化，将其压缩至[0,1]区间，其表达式如下：式中， p(x,t)是采集到的第x个用户负荷曲线在时间t时刻的用电量,p ′(x,t)是经归一化后的第x个用户负荷曲线在时间t时刻的用电量,p(x)max和p(x)min是第x个用户负荷曲线的最大、最小负荷数据。 5.如权利要求4所述的基于卷积变分自编码器的日负荷曲线聚类方法，其特征在于，步骤S2具体如下：卷积变分自编码器中，编码器由两个卷积层和两个最大池化层构成，最后通过一个全连接层得到降维后负荷序列的时序特征，将提取的时序特征送入解码器，解码器由重塑层、两个反卷积层及两个上采样层构成，最终得到与原始样本相近的数据；将KL散度和重构误差一起作为网络的损失函数，通过梯度下降算法以最小化损失函数训练编码器和解码器；编码器和解码器分别是带参数的和带参数θ 的pθ(x|z)的概率分布模型，该模型由神经网络来构建；输入数据通过编码器被编码为隐变量z，引入来估计后验分布pθ(z|x)；然后，从中采样来近似在pθ(z|x)中采样；使用KL散度来衡量两个分布的近似程度，神经网络的优化目标函数为: 权　利　要　求　书 1/2 页 2 CN 115526277 A 2式中， KL散度的计算为：深度学习网络以最大化似然概率log pθ(x)为目标，其通过最大化其变分下界限L(φ, θ )实现，变分下界如下式：式中，第一项令qφ(z|x)为正态分布， pθ(z)为标准正态分布，即qφ(z|x)～N( μ1, σ1)， pθ (z)～N(0,1)则可计算出其KL散度：第二项为评估网络的重构性能指标，式中的z是通过编码器qφ(z|x)得到。 6.如权利要求5所述的基于卷积变分自编码器的日负荷曲线聚类方法，其特征在于，步骤S3具体如下：假设输入原始时间序列长度为n的日负荷数据经过归一化处理后变为x＝[x1,x2, ...xn]，其经过编码后的潜在表征可以表示为：式中， x∈R1×n，表示卷积运算， k表示网络层数， ωk和bk分别表示编码过程第k层网络的卷积核和偏置， σ 为激活函数；潜在表征hk通过解码器得到重构的日负荷数据可以表示为：式中，和分别表示解码过程第k层网络的卷积核和偏置。 7.如权利要求6所述的基于卷积变分自编码器的日负荷曲线聚类方法，其特征在于，步骤S4具体如下：将输入与输出的均方误差Lr最小纳入误差函数的计算中，优化目标函数Lr可以表示为：网络的损失函数可表示为： L＝DKL(qφ(z|x)||pθ(z))+Lr (8) 最后，通过梯度下降算法，最小化目标函数式，即可实现卷积变分自编码器的构建。权　利　要　求　书 2/2 页 3 CN 115526277 A 3

专利 基于卷积变分自编码器的日负荷曲线聚类方法

专利基于卷积变分自编码器的日负荷曲线聚类方法