(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211272252.0 (22)申请日 2022.10.18 (71)申请人 支付宝 (杭州) 信息技 术有限公司 地址 310000 浙江省杭州市西湖区西溪路 556号8层B段801-1 1 (72)发明人 易灿 张天翼  (74)专利代理 机构 济南信达专利事务所有限公 司 37100 专利代理师 李世喆 (51)Int.Cl. G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 模型训练方法和装置、 业 务预测方法和装置 (57)摘要 本说明书实施例提供了一种神经网络模型 的训练方法及装置、 业务预测方法及装置。 在训 练神经网络模型时, 根据历史业务数据, 获取训 练样本数据; 在每一轮训练中均执行: 将训练样 本数据输入 所述神经网络模型中, 以对所述神经 网络模型中每一个参数的参数值进行调整; 以及 检测本轮训练是否满足参数获取条件, 如果是, 则记录本轮训练得到的神经网络模型中每一个 参数的当前参数值; 在各轮训练结束后, 针对神 经网络模型的每一个参数, 根据记录的该参数的 至少一个当前参数值, 得到该参数对应的最终参 数值; 将神经网络模型中每一个参数的参数值设 置为该参数对应的最终参数值。 本说明书实施例 能够更好地利用神经网络模型来进行业务预测, 并且减少对系统资源的消耗。 权利要求书2页 说明书9页 附图3页 CN 115526266 A 2022.12.27 CN 115526266 A 1.神经网络模型的训练方法, 其中, 包括: 根据历史业 务数据, 获取训练样本数据; 在每一轮训练中均执 行: 将训练样本数据输入所述神经网络模型中, 以对所述神经网络模型中每一个参数的参 数值进行调整; 以及 检测本轮训练是否满足参数获取条件, 如果是, 则记录本轮训练得到的神经网络模型 中每一个参数的当前参数值; 在各轮训练结束后, 针对神经网络模型的每一个参数, 根据记录的该参数的至少一个 当前参数值, 得到该参数对应的最终参数值; 将神经网络模型中每一个参数的参数值设置为该参数对应的最终参数值。 2.根据权利要求1所述的方法, 其中, 所述检测本轮训练是否满足参数获取 条件包括: 根据预先设置的采样周期, 检测本轮是否达到了该采样周期, 如果是, 则确定本轮训练 满足参数获取条件; 其中, 所述采样周期表征每N轮训练获取一次参数值; N为不小于1的正 整数; 或者, 判断本轮得到的各参数的当前参数值是否优于上一 次记录的各参数的当前参数值, 如 果是, 则确定 本轮训练满足参数获取 条件。 3.根据权利要求1所述的方法, 其中, 在预先设置的第 L轮及其之后的每一轮 中, 均执行 所述检测本轮训练是否满足参数获取条件的步骤, 在预先设置的第L轮之前的每一轮中, 不 执行所述检测本轮训练是否满足参数获取 条件的步骤; 其中, L 为大于1的正整数。 4.根据权利要求1所述的方法, 其中, 所述根据记录的该参数的至少一个当前参数值得 到该参数对应的最终参数值, 包括: 从记录的该参数的至少一个当前参数值中, 选取最大的参数值, 将该最大的参数值作 为该参数对应的最终参数值。 5.根据权利要求1所述的方法, 其中, 所述根据记录的该参数的至少一个当前参数值得 到该参数对应的最终参数值, 包括: 确定所记录的该参数的每一个当前参数值对应的权 重值; 将该参数的各个当前参数值进行加权平均, 以得到该参数对应的所述 最终参数值。 6.根据权利要求5所述的方法, 其中, 所述确定所记录的该参数的每一个当前参数值对 应的权重值, 包括: 将每一个当前参数值对应的权重值均设置为 其中, M为针对该参数所记录的当前参 数值的个数; 或者, 根据得到每一个当前参数值时所处的轮数, 设置每一个当前参数值对应的权重值, 其 中, 得到一个当前参数值时所 处的轮数在前时, 该当前参数值对应的权重值较小, 得到一个 当前参数值时所处的轮数在后时, 该当前参数值对应的权 重值较大。 7.业务预测方法, 其中, 包括: 获取待预测的业 务数据;权 利 要 求 书 1/2 页 2 CN 115526266 A 2将待预测的业务数据输入神经网络模型中; 所述神经网络模型是利用权利要求1至6 中 任一所述的方法训练出的; 得到该神经网络模型输出的对该待预测业 务数据的识别结果。 8.模型训练装置, 该装置包括: 样本获取模块, 配置为 根据历史业 务数据, 获取训练样本数据; 训练执行模块, 配置为在每一轮训练中均执行: 将训练样本数据输入所述神经网络模 型中, 以对所述神经网络模型中每一个参数 的参数值进行调整; 以及检测本轮训练是否满 足参数获取条件, 如果是, 则记录本轮训练得到的神经网络模型中每一个参数 的当前参数 值; 参数值确定模块, 配置为在各轮训练结束后, 针对神经网络模型的每一个参数, 根据记 录的该参数的至少一个当前参数值, 得到该参数对应的最终参数值; 模型生成模块, 配置为将神经网络模型中每一个参数的参数值设置为该参数对应的最 终参数值。 9.业务预测装置, 其中, 包括: 业务数据获取模块, 配置为获取待预测的业 务数据; 输入模块, 配置为将待预测的业务数据输入神经网络模型中; 所述神经网络模型是利 用权利要求8所述的装置训练出的; 输出模块, 配置为得到该神经网络模型输出的对该待预测业 务数据的识别结果。 10.一种计算设备, 包括存储器和 处理器, 所述存储器中存储有可执行代码, 所述处理 器执行所述可执行代码时, 实现权利要求1 ‑7中任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 115526266 A 3

PDF文档 专利 模型训练方法和装置、业务预测方法和装置

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 模型训练方法和装置、业务预测方法和装置 第 1 页 专利 模型训练方法和装置、业务预测方法和装置 第 2 页 专利 模型训练方法和装置、业务预测方法和装置 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:24:29上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。