(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211300280.9
(22)申请日 2022.10.21
(71)申请人 华润数字科技有限公司
地址 518000 广东省深圳市福田区梅林街
道梅都社区中康路136号深圳新一代
产业园2栋801
(72)发明人 刘雨桐 张兴 李婉莹 王国勋
(74)专利代理 机构 广州嘉权专利商标事务所有
限公司 4 4205
专利代理师 周翀
(51)Int.Cl.
G06Q 10/04(2012.01)
G06Q 50/04(2012.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
控制策略预测方法和装置、 设备及存 储介质
(57)摘要
本申请实施例提供了一种控制策略预测方
法和装置、 设备及存储介质, 属于人工智能技术
领域。 该方法包括: 获取验证控制策略、 设备历史
状态数据和验证优化指标; 将设备历史状态数据
输入至原始策略预测模型进行策略预测得到预
测控制策略; 将预测控制策略和设备历史状态数
据输入至原始策略评估模型进行策略评估得到
下一设备历史状态数据和预测优化指标; 通过损
失函数对预测控制策略和验证控制策略、 验证优
化指标和预测优化指标进行损失计算得到目标
损失值; 根据目标损失值对原始策略预测模型进
行参数调整得到目标策略预测模 型; 将获取的设
备目标状态数据输入至目标策略预测模型进行
策略预测得到目标控制策略。 本申请实施例能够
提高控制策略的预测效率。
权利要求书3页 说明书13页 附图4页
CN 115545331 A
2022.12.30
CN 115545331 A
1.一种控制策略预测方法, 其特 征在于, 所述方法包括:
获取样本数据; 其中, 所述样本数据包括验证控制策略、 设备历史状态数据和验证优化
指标;
将所述设备历史状态数据输入至预设的原始策略预测模型进行策略预测, 得到预测控
制策略;
将所述预测控制策略和所述设备历史状态数据输入至预设的原始策略评估模型进行
策略评估, 得到下一时间的所述设备历史状态数据和预测优化指标;
通过预设的损失函数对所述预测控制策略和所述验证控制策略进行损失计算, 通过所
述预设的损失函数对所述验证优化指标和所述预测优化指标进行损失计算, 得到目标损失
值;
根据所述目标损失值对所述原始策略预测模型进行参数调整, 得到目标策略预测模
型;
将获取的设备目标状态数据输入至所述目标策略预测模型进行策略预测, 得到目标控
制策略。
2.根据权利要求1所述的方法, 其特征在于, 所述原始策略预测模型包括: 自相关层, 所
述将所述设备历史状态数据输入至预设的原始策略预测模型进行策略预测, 得到预测控制
策略, 包括:
将所述设备历史状态数据输入至所述自相关层进行 特征提取, 得到数据特 征;
通过所述自相关层对所述数据特 征和历史特 征进行相关性计算, 得到特 征相关度;
根据所述特 征相关度从预设的候选策略中筛 选出所述预测控制策略。
3.根据权利要求2所述的方法, 其特征在于, 所述通过所述自相关层对所述数据 特征和
历史特征进行相关性计算, 得到特 征相关度, 包括:
通过所述自相关层对所述数据特 征进行序列化处 理, 得到数据特 征序列;
通过所述自相关层对所述历史特 征进行序列化处 理, 得到历史特 征序列;
通过所述自相关层将所述数据特征序列和所述历史特征序列输入至预设的自相关函
数进行自相关处 理, 得到所述特 征相关度; 其中, 所述自相关函数为:
式中, xt为当前周期长度为t的数据特征序列, xt‑θ为当前周期长度为t的历史特征序列,
θ 为延迟时间(即滞后项)。
4.根据权利要求1至3任一项所述的方法, 其特征在于, 所述原始策略评估模型包括: 至
少一个BiLSTM层; 所述将所述预测控制策略和所述设备历史状态数据输入至预设的原始策
略评估模型进行 策略评估, 得到下一时间的所述设备历史状态数据和预测优化指标, 包括:
将所述预测控制策略和所述设备历史状态数据输入至BiLSTM层进行特征提取, 得到高
维特征;
通过所述BiLSTM层将所述高维特征和预设的前向特征、 后向特征进行结合处理, 得到
目标特征;
通过所述BiLSTM层对所述目标特征进行反卷积处理, 得到下一时间的所述设备历史状权 利 要 求 书 1/3 页
2
CN 115545331 A
2态数据和所述预测优化指标。
5.根据权利要求1至3任一项所述的方法, 其特征在于, 所述通过预设的损 失函数对所
述预测控制策略和所述验证控制策略进行损失计算, 通过所述预设的损失函数对所述验证
优化指标和所述预测优化指标进行损失计算, 得到目标损失值, 包括:
通过预设的损失函数对所述预测控制策略和所述验证控制策略进行损失计算, 得到策
略损失值;
通过预设的损失函数对所述预测优化指标和所述验证优化指标进行损失计算, 得到指
标损失值;
根据预设的第一权重值、 预设的第二权重值、 所述策略损 失值和所述指标损 失值进行
求和计算, 得到所述目标损失值。
6.根据权利要求1至3任一项所述的方法, 其特征在于, 在所述将获取的设备目标状态
数据输入至所述目标 策略预测模型进行 策略预测, 得到目标控制策略, 包括:
对所述目标控制策略进行优化处 理, 具体包括:
根据预设的策略限制数据和所述目标控制策略进行模型构建, 得到控制策略模型;
根据所述设备目标状态数据对所述控制策略模型进行求 解处理, 得到优化控制策略。
7.根据权利要求1至3任一项所述的方法, 其特征在于, 在所述获取样本数据之后, 所述
方法还包括:
对所述样本数据进行 预处理, 具体包括:
对任意两个所述样本数据进行相关性计算, 得到样本相关度;
根据所述样本相关度对所述样本数据进行 过滤处理;
对过滤后的所述样本数据进行 行标准化处理。
8.一种控制策略预测装置, 其特 征在于, 所述装置包括:
获取模块, 用于获取样本数据; 其中, 所述样本数据包括验证控制策略、 设备历史状态
数据和验证优化指标;
原始预测模块, 用于将所述设备历史状态数据输入至预设的原始策略预测模型进行策
略预测, 得到预测控制策略;
评估模块, 用于将所述预测控制策略和所述设备历史状态数据输入至预设的原始策略
评估模型进行 策略评估, 得到下一时间的所述设备历史状态数据和预测优化指标;
损失计算模块, 用于通过预设的损失函数对所述预测控制策略和所述验证控制策略进
行损失计算, 通过所述预设的损失函数对所述验证优化指标和所述预测优化指标进行损失
计算, 得到目标损失值;
参数调整模块, 用于根据所述目标损 失值对所述原始策略预测模型进行参数调整, 得
到目标策略预测模型;
目标预测模块, 用于将 获取的设备目标状态数据输入至所述目标策略预测模型进行策
略预测, 得到目标控制策略。
9.一种电子设备, 其特征在于, 所述电子设备包括存储器和处理器, 所述存储器存储有
计算机程序, 所述处理器执行所述计算机程序时实现权利要求1至7任一项所述的控制策略
预测方法。
10.一种计算机可读存储介质, 所述计算机可读存储介质存储有计算机程序, 其特征在权 利 要 求 书 2/3 页
3
CN 115545331 A
3
专利 控制策略预测方法和装置、设备及存储介质
文档预览
中文文档
21 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:24:21上传分享