(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211401329.X
(22)申请日 2022.11.09
(71)申请人 四川大学
地址 610000 四川省成 都市一环路南 一段
24号
(72)发明人 曾琦 李晨鑫 史云翔 朱玲俐
(74)专利代理 机构 成都时誉知识产权代理事务
所(普通合伙) 5125 0
专利代理师 李春彦
(51)Int.Cl.
G06K 9/62(2022.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
G06Q 50/06(2012.01)
(54)发明名称
基于卷积变分自编码器的日负荷曲线聚类
方法
(57)摘要
本发明涉及基于卷积变分自编码器的日负
荷曲线聚类方法, 属于电力系统数据处理技术领
域, 提出采用卷积变分自编码器, 利用其优秀的
重构能力和神经网络的非线性学习 能力提取用
户日负荷曲线的时序特征, 并实现数据降维, 再
将提取到的潜在表征通过K ‑means算法进行聚
类, 同时利用高斯距离加权优化典型的日负荷曲
线。 通过和其他聚类方式的DBI聚类指标相对比,
证明本论文提出的卷积变分自编码器用于聚类
的有效性。
权利要求书2页 说明书10页 附图3页
CN 115526277 A
2022.12.27
CN 115526277 A
1.基于卷积变分自编码器的日负荷曲线聚类方法, 其特 征在于, 包括以下步骤:
S1、 采用数据删除、 异常数据检测并替换、 数据归一 化对原始日负荷数据实现预处 理;
S2、 利用卷积变分自编码器对负荷数据进行降维和重构, 将重构误差和分布误差一起
作为损失函数, 得到日负荷曲线的潜在表征;
S3、 将降维后的数据用K ‑means算法得到聚类标签和聚类中心, 将聚类标签分配给原始
负荷数据, 聚类中心再通过解码器还原, 得到原 始数据的聚类中心;
S4、 将每一类的某一个时刻的负荷功率根据与聚类中心的距离设置不同的高斯权值,
从而优化典型的日负荷曲线。
2.如权利要求1所述的基于卷积变分 自编码器的日负荷曲线聚类方法, 其特征在于, 步
骤S1中数据删除具体如下:
针对负荷数据中存在缺失数据、 存在大于20个数据点测量数据为0或整天采集数据值
无变化的负荷数据采取删除操作。
3.如权利要求2所述的基于卷积变分 自编码器的日负荷曲线聚类方法, 其特征在于, 步
骤S1中异常数据检测并替换 具体如下:
使用四分位距法对负荷数据进行检测, 根据每天96个数据的上四分位数Q3和下四分位
数Q1, 并给予一定裕度, 形成一个筛选区间, 在筛选区间内的为有效数据, 在筛选区间外的
为异常数据, 并且将异常数据用有效数据的均值 替代。
4.如权利要求3所述的基于卷积变分 自编码器的日负荷曲线聚类方法, 其特征在于, 步
骤S1中数据归一 化具体如下:
采用对每条日负荷曲线进行最大最小值归一化, 将其压缩至[0,1]区间, 其表达式如
下:
式中, p(x,t)是采集到的第x个用户负荷曲线在时间t时刻的用电量,p ′(x,t)是经归一
化后的第x个用户负荷曲线在时间t时刻的用电量,p(x)max和p(x)min是第x个用户负荷曲线
的最大、 最小负荷数据。
5.如权利要求4所述的基于卷积变分 自编码器的日负荷曲线聚类方法, 其特征在于, 步
骤S2具体如下:
卷积变分自编码器中, 编码器由两个卷积层和两个最大池化层构成, 最后通过一个全
连接层得到降维后负荷序列的时序特征, 将提取的时序特征送入解码 器, 解码器由重塑层、
两个反卷积层及两个上采样层构成, 最终得到与原始样本相 近的数据; 将KL散度和重构误
差一起作为网络的损失函数, 通过梯度下降算法以最小化损失函数训练编码器和解码器;
编码器和解码器 分别是带参数
的
和带参数θ 的pθ(x|z)的概率分布模型, 该模
型由神经网络来构建; 输入数据通过编码器
被编码为隐变量z,
引入
来估计后验分布pθ(z|x); 然后, 从
中采样来近似在pθ(z|x)中采
样; 使用KL散度来衡量两个分布的近似程度, 神经网络的优化目标函数为:
权 利 要 求 书 1/2 页
2
CN 115526277 A
2式中, KL散度的计算 为:
深度学习网络以最大化似然概率log pθ(x)为目标, 其通过最大化其变分下界限L(φ,
θ )实现, 变分下界如下式:
式中, 第一项令qφ(z|x)为正态分布, pθ(z)为标准正态分布, 即qφ(z|x)~N( μ1, σ1), pθ
(z)~N(0,1)则可计算出其KL散度:
第二项为评估网络的重构性能指标, 式 中的z是通过编码器qφ(z|x)得到 。
6.如权利要求5所述的基于卷积变分 自编码器的日负荷曲线聚类方法, 其特征在于, 步
骤S3具体如下:
假设输入原始时间序列长度为n的日负荷数据经过归一化处理后变为x=[x1,x2,
...xn], 其经过编码后的潜在表征 可以表示 为:
式中, x∈R1×n,
表示卷积运算, k表示网络层数, ωk和bk分别表示编码过程第k层网络
的卷积核和偏置, σ 为激活函数;
潜在表征hk通过解码器得到 重构的日负荷数据可以表示 为:
式中,
和
分别表示 解码过程第k层网络的卷积核和偏置 。
7.如权利要求6所述的基于卷积变分 自编码器的日负荷曲线聚类方法, 其特征在于, 步
骤S4具体如下:
将输入与输出的均方误差Lr最小纳入误差函数的计算中, 优化目标函数Lr可以表示 为:
网络的损失函数 可表示为:
L=DKL(qφ(z|x)||pθ(z))+Lr (8)
最后, 通过梯度下降算法, 最小化目标函数式, 即可实现卷积变分自编码器的构建。权 利 要 求 书 2/2 页
3
CN 115526277 A
3
专利 基于卷积变分自编码器的日负荷曲线聚类方法
文档预览
中文文档
16 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:23:51上传分享