(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211421126.7
(22)申请日 2022.11.15
(71)申请人 四川汉唐云 分布式存 储技术有限公
司
地址 625000 四川省雅 安市经济开发区园
区大道17号
(72)发明人 常春 陈适 黄虹兵 姚军
陈昌辉
(74)专利代理 机构 成都顶峰专利事务所(普通
合伙) 51224
专利代理师 杨国瑞
(51)Int.Cl.
H04L 67/1004(2022.01)
H04L 67/60(2022.01)
G06N 3/04(2006.01)G06N 3/08(2006.01)
(54)发明名称
一种分布式算力集群智慧调度方法、 装置及
计算机设备
(57)摘要
本申请公开了一种分布式算力集群智慧调
度方法、 装置及计算机设备, 涉及算力网络技术
领域。 所述方法是在获取N个运算处理子业务的
算力需求信息后, 根据N个运算处理子业务和在
分布式算力资源系统中当前正常服务的M个算力
资源供应设备, 创建包含有输入层、 第一隐藏层、
第二隐藏层和输出层的BP神经网络, 然后将与N
个运算处理子业务一一对应的N个算力资源所需
数目作为输 出目标向量导入所述BP神经网络中,
得到依次满足负载均衡、 用户算力需求和调度资
源节约需求的且完成训练的新BP神经网络, 最后
根据新BP神经网络中各个隐藏节点的节点值, 得
到最终算力资源调度方案, 实现分布式算力资源
系统的负载均衡以及可结合分布式与集群的优
点的目的。
权利要求书4页 说明书13页 附图4页
CN 115473901 A
2022.12.13
CN 115473901 A
1.一种分布式算力集群智慧调度方法, 其特 征在于, 包括:
获取来自用户终端的算力调度请求, 其中, 所述算力调度请求携带有N个运算处理子业
务的算力需求信息, 所述算力需求信息包含有对应运算处理子业务的算力资源所需数目, N
表示非零自然数;
根据所述N个运算处理子业务和在分布式算力资源系统中当前正常服务的M个算力资
源供应设备, 创建包含有输入层、 第一隐藏层、 第二隐藏层和输出层的反向传播BP神经网
络, 其中, M表示 非零自然 数, 所述第一隐藏层 包含有与所述M个算力资源供应设备一一对应
的M个第一隐藏节点, 所述第二隐藏层包含有与所述M个算力资源供应设备一一对应的M个
第二隐藏节点, 所述输出层包含有与所述N个运算处理子业务一一对应的N个输出节点, 所
述M个第一隐藏节点与所述M个第二隐藏节 点一对一连接, 所述M个第二隐藏节 点与所述N个
输出节点多对多连接;
将与所述N个运算处理子业务一一对应的N个所述算力资源所需数目作为输出目标向
量导入所述BP神经网络中, 得到完成训练的新BP神经网络, 其中, 所述BP神经网络的训练过
程包括有如下步骤S31~S3 6:
S31.按照如下公式计算得到 输出向量:
式中,
表示不大于N的非零自然数,
表示所述N个输出节点中第
个输出节点的输
出值, 所述输出向量表示为
,
表示不大于M的非零自然数,
表示所述M个第一隐藏节点中第
个第一隐藏节点的节点值,
表示所述M个第
二隐藏节点中第
个第二隐藏节点的节点值,
表示用于判断
是否等
于
的函数, 并在是时输出1, 而在否时输出0;
S32.按照如下公式计算得到所述M个算力资源供应设备的调度后算力资源占用率:
式中,
表示与所述第
个第一隐藏节点对应的算力资源供应设备的调度后算力
资源占用率,
表示与所述第
个第一隐藏节点对应的算力资源供应设备的可用算力
资源总数,
表示与所述第
个第一隐藏节点对应的算力资源供应设备的调度前算
力资源占用率;
S33.判断所述M个算力资源供应设备的调度后算力资源占用率的标准差是否小于预设
的第一目标阈值, 若是, 则执 行步骤S34, 否则执 行步骤S3 6;
S34.判断所述输出向量中的各个元素是否均大于等于所述输出目标向量中的对应元
素, 若是, 则执 行步骤S3 5, 否则执 行步骤S3 6;权 利 要 求 书 1/4 页
2
CN 115473901 A
2S35.判断所述输出向量与所述输出目标向量的误差平方值是否小于预设的第二目标
阈值, 若是, 则停止训练, 得到 完成训练的新BP神经网络, 否则执 行步骤S3 6;
S36.基于BP神经网络的梯度下降法来调整所述M个第一隐藏节点以及所述M个第二隐
藏节点的节点值, 然后返回执行步骤S 31, 其中, 所述M个第一隐藏节 点的节点值的调整约束
条件包括有 取值为不大于N的自然数, 所述M个第二隐藏节 点的节点值的调整约束 条件包括
有取值为不大于
的自然数;
按照如下方式遍历所述M个算力资源供应设备中的各个算力资源供应设备: 若对应的
第一隐藏节点的节点值为第一非零数值x1,并且对应的第二隐藏节点的节点值为第二非零
数值x2, 则将对应的且算力资源数 目为x2的算力资源调度给与第x1个输出节点对应的运算
处理子业务。
2.根据权利要求1所述的分布式算力集群智慧调度方法, 其特征在于, 所述M个第一 隐
藏节点的节点值的调整约束条件还包括有: 具有相同非零节点值的第一隐藏节点数目不大
于预设的集群数目阈值。
3.根据权利要求1所述的分布式算力集群智慧调度方法, 其特征在于, 当所述算力调度
请求还携带有为所述N个运算处理子业务中的某个运算处理子业务配置的集群数目指 定值
时, 所述M个第一隐藏节点的节点值的调整约束条件还包括有: 具有相同非零节点值
的第
一隐藏节点数目等于所述集群数目指定值, 其中,
表示与所述某个运算处理子业务对应
的输出节点在所述 N个输出节点中的序号。
4.根据权利要求1所述的分布式算力集群智慧调度方法, 其特征在于, 当所述算力调度
请求还携带有为所述N个运算处理子业务中的某个运算处理子业务配置的算力资源调 度分
辨率时, 所述M个第二隐藏节点的节点值的调整约束条件包括有: 与节点值为
的第一隐藏
节点具有连接 关系的第二隐藏节点的节点值为所述算力资源调 度分辨率的非零自然数倍,
其中,
表示与所述某个运 算处理子业务对应的输出节点在所述 N个输出节点中的序号。
5.根据权利要求1所述的分布式算力集群智慧调度方法, 其特征在于, 当所述算力调度
请求还携带有算力资源供应设备筛选条件时, 则 在创建所述BP神经网络 之后且将所述输出
目标向量 导入所述BP神经网络之前, 所述方法还 包括:
按照如下方式遍历所述M个算力资源供应设备中的各个算力资源供应设备: 若判定对
应设备不满足所述算力资源供应设备筛选条件, 则将对应的两隐藏节点的节点值锁定为不
可调整的零 值。
6.根据权利要求1所述的分布式算力集群智慧调度方法, 其特征在于, 当所述算力调度
请求还携带有为所述N个运算处理子业务中的某个运算处理子业务配置的算力资源供应设
备筛选条件时, 则 在创建所述BP神经网络之后且将所述输出目标向量导入所述BP神经网络
之前, 所述方法还 包括:
按照如下方式遍历所述M个算力资源供应设备中的各个算力资源供应设备: 若判定对
应设备不满足所述算力资源供应设备筛选条件, 则将对应的第一隐藏节点的节点值锁定在
区间
内, 其中,
表示与所述某个运算处理子业务对应的输出节点在所权 利 要 求 书 2/4 页
3
CN 115473901 A
3
专利 一种分布式算力集群智慧调度方法、装置及计算机设备
文档预览
中文文档
22 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共22页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:23:47上传分享