国家标准网
文库搜索
切换导航
首页
频道
仅15元无限下载
联系我们
首页
仅15元无限下载
联系我们
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211273518.3 (22)申请日 2022.10.18 (71)申请人 中国科学技术大学 地址 230026 安徽省合肥市金寨路96号 (72)发明人 郑歆慰 吴双 (74)专利代理 机构 合肥昊晟德专利代理事务所 (普通合伙) 3415 3 专利代理师 何梓秋 (51)Int.Cl. G06N 3/04(2006.01) G06N 3/08(2006.01) G06K 9/62(2022.01) (54)发明名称 一种神经网络模型混合精度方案搜索方法 及系统 (57)摘要 本发明公开了一种神经网络模型混合精度 方案搜索方法及系统, 属于神经网络模型技术领 域, 包括以下步骤: 模型预处理; 模型执行; 低精 度转化; 模型正确性验证; 混合精度神经网络模 型输出。 本发明基于模型预测的方式, 用 历史算 子组合以及执行结果作为训练数据, 训练误差预 测模型预测低精度后的神经网络模 型误差, 只有 通过误差预测模型预测的神经网络模型低精度 方案才会实际执行, 并将实际执行结果加入误差 预测模型的训练数据中, 这样大大减少了神经网 络模型的执行次数, 有效提高了搜索效率, 值得 被推广使用。 权利要求书2页 说明书4页 附图1页 CN 115526299 A 2022.12.27 CN 115526299 A 1.一种神经网络模型混合精度方案 搜索方法, 其特 征在于, 包括以下步骤: 步骤一: 模型 预处理 将待优化的神经网络模型抽象为 算子序列; 步骤二: 模型 执行 执行原始高精度的神经网络模型, 得到期望输出, 原始高精度的神经网络模型即步骤 一中经过抽象处 理的待优化的神经网络模型; 步骤三: 低精度转 化 将原始高精度的神经网络模型整体转化为低精度的神经网络模型, 加入待验证模型队 列; 步骤四: 模型正确性验证 从待验证模型队列中取一个神经网络模型进行正确性验证; 步骤五: 混合精度神经网络模型输出 若神经网络模型正确性验证通过, 则说明当前神经网络模型目前的低精度部分优化方 案正确, 然后判断通过正确 性验证的神经网络模型 的高精度部分是否还可以切分; 若是则 将其高精度部 分取出进 行切分, 分别对每一部 分保留高精度, 其余部 分转化为低精度, 得到 多个模型, 加入待验证模型队列, 继续执行步骤四至五, 直至神经网络模型的高精度部 分无 法切分, 输出模 型, 即得到待优化神经网络模型的混合精度方案; 否则, 直接输出模 型, 即得 到待优化神经网络模型的混合精度方案 。 2.根据权利要求1所述的一种神经网络模型混合精度方案搜索方法, 其特征在于: 在所 述步骤一中, 待优化的神经网络模型是一个计算图模型, 其中的每一个节点 都是一个算子, 对计算图模型进行拓扑排序后即可 得到一个算子序列。 3.根据权利要求1所述的一种神经网络模型混合精度方案搜索方法, 其特征在于: 在所 述步骤四中, 对神经网络模型进行正确性验证的过程具体如下: S41: 利用误差预测模型预测神经网络模型的输出是否正确, 如正确则进入步骤五, 否 则继续进行二次验证; S42: 实际执行神经网络模型, 即进行二次验证, 判断神经网络模型的实际执行结果是 否正确, 同时将实际执 行结果作为训练数据, 训练误差预测模型; S43: 如果神经网络模型输出结果正确, 则表示通过二次验证, 进入步骤五, 否则表示未 通过二次验证, 说明当前神经网络模型 的低精度部分优化方案存在问题, 放弃当前神经网 络模型, 并重新从待验证模型队列中取一个神经网络模型进行步骤S41 ‑S43。 4.根据权利要求3所述的一种神经网络模型混合精度方案搜索方法, 其特征在于: 在步 骤S41中, 误差预测模 型为XGBoost模 型, 误差预测模 型的输入为算子序列, 输出为对应算子 序列的执 行结果是否正确的预测结果。 5.根据权利要求4所述的一种神经网络模型混合精度方案搜索方法, 其特征在于: 算子 序列中每个算子均包括两个属性: 算子类型和算子精度,其中算子类型表示算子的类型, 采 用独热编码; 算子精度表示 算子采用的计算精度, 采用二 值编码。 6.根据权利要求3所述的一种神经网络模型混合精度方案搜索方法, 其特征在于: 在所 述步骤S42中, 实际执 行是执行onnx格式的神经网络模型, 得到实际执 行结果。 7.根据权利要求1所述的一种神经网络模型混合精度方案搜索方法, 其特征在于: 在所权 利 要 求 书 1/2 页 2 CN 115526299 A 2述步骤五中, 当神经网络模型 的高精度部分中连续的高精度算子数量大于一, 则认为该高 精度部分仍可 再切分, 否则认为 不可再切分。 8.一种神经网络模型混合精度方案搜索系统, 其特征在于, 采用 如权利要求1~7任一 项所述的方法对神经网络模型混合精度方案进行搜索确定, 包括: 预处理模块, 用于将待优化的神经网络模型抽象为 算子序列; 执行模块, 用于执 行原始高精度的神经网络模型, 得到期望 输出; 精度转化模块, 用于将原始高精度的神经网络模型整体转化为低精度的神经网络模 型, 加入待验证模型队列; 正确性验证模块, 用于从待验证模型队列中取一个神经网络模型进行正确性验证; 输出模块, 用于在神经网络模型正确性验证通过后, 判断通过正确性验证的神经网络 模型的高精度部分是否还可以切分; 若是则将其高精度部分取出进行切分, 分别对每一部 分保留高精度, 其余部分转化为低精度, 得到多个模型, 加入待验证模型队列, 继续执行步 骤四至五, 直至神经网络模型的高精度部分无法切分, 输出模型; 否则直接 输出模型; 控制处理模块, 用于向其 他模块发出指令, 完成相关动作; 所述预处理模块、 执行模块、 精度转化模块、 正确性验证模块、 输出模块均与中央处理 模块通信连接 。权 利 要 求 书 2/2 页 3 CN 115526299 A 3
专利 一种神经网络模型混合精度方案搜索方法及系统
文档预览
中文文档
8 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共8页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 SC 于
2024-02-18 22:24:30
上传分享
举报
下载
原文档
(376.0 KB)
分享
友情链接
GB-T 35003-2018 非易失性存储器耐久和数据保持试验方法.pdf
DB3301-T 0331—2021 餐饮食品安全数字化管理规范 杭州市.pdf
GB-T 22710-2008 低压断路器用电子式控制器.pdf
DB65-T 3902-2016 烟花爆竹批发、零售及储存库事故隐患排查技术规范 新疆维吾尔自治区.pdf
DB3711-T 134-2023 化工企业投资项目节能报告编制指南 日照市.pdf
DB52-T 945-2015 热力输送管道节能技术规范 贵州省.pdf
GB-T 5975-2006 钢丝绳用压板.pdf
GM-T 0013-2021 可信计算 可信密码模块接口符合性测试规范.pdf
DB37-T 4381—2021 高速公路服务区设计规范 山东省.pdf
GB 25971-2010 六氟丙烷(HFC236fa)灭火剂.pdf
GB-T 25000.12-2017 系统与软件工程 系统与软件质量要求和评价(SQuaRE) 第12部分:数据质量模型.pdf
GB-T 2680-2021 建筑玻璃 可见光透射比、太阳光直接透射比、太阳能总透射比、紫外线透射比及有关窗玻璃参数的测定.pdf
T-FJLY 001—2022 自然教育基地质量评定.pdf
DB4205-T 63-2019 磷石膏及其综合利用产品质量标准 宜昌市.pdf
山东省健康医疗大数据管理办法.pdf
GB-T 27977-2022 水泥生产电能能效测试及计算方法.pdf
ISO 13997 2023 Protective clothing — Mechanical properties — Determination of resistance.pdf
GB-T 42109-2022 供应链资产管理体系实施指南.pdf
付晓岩 数字银行论坛-以企业架构推动数字化 转型指导文件的落实 .pdf
GB-T 36896.4-2018 轻型有缆遥控水下机器人 第4部分:摄像、照明与云台.pdf
1
/
8
评价文档
赞助2.5元 点击下载(376.0 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
点击进入官方售后微信群
支付 完成后 如未跳转 点击这里下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。