(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211442985.4 (22)申请日 2022.11.18 (71)申请人 武汉纺织大 学 地址 430073 湖北省武汉市洪山区纺织路1 号 (72)发明人 余锋 李会引 刘筱笑 姜明华  周昌龙 宋坤芳  (74)专利代理 机构 武汉世跃专利代理事务所 (普通合伙) 42273 专利代理师 万仲达 (51)Int.Cl. G06V 10/82(2022.01) G06V 10/764(2022.01) G06V 10/26(2022.01) G06N 3/04(2006.01)G06N 3/08(2006.01) (54)发明名称 一种基于深度学习的服装图像解析方法 (57)摘要 本发明公开了一种基于深度学习的服装图 像解析方法, 所述的服装图像解析方法包括以下 步骤: 首先设计适用于解析服装图像的模型网络 结构配置, 然后设计损失函数, 确定训练过程中 调节参数的策略, 最后得到服装图像解析模型, 模型可以将 输入的服装图像, 解析成像素级预测 的图像。 所述的服装图像解析模 型包括图像特征 编码模块和服装 特征解码模块。 本发 明通过改进 这些算法融合可以明显提高服装解析的准确率, 提供了一种高效解析服装图像的方法, 给后续服 装图像分析提供了高质量的服装 标注图像, 大大 节省了人力成本 。 权利要求书2页 说明书6页 附图3页 CN 115496990 A 2022.12.20 CN 115496990 A 1.一种基于深度学习的服装图像解析方法, 其特征在于, 所述的基于深度学习的服装 图像解析 方法包括以下步骤: 步骤1: 结合滤波信息设计适用于解析服装图像的基于深度学习的服装图像解析模型; 所述的基于深度学习的服装图像解析模型包括图像特征编码模块和服装特征解码模 块, 索虎图像特征编码模块中含有多个编码模块, 服装特征解码模块包括多个上采样解码 模块, 每一个上采样解码模块都由卷积层和双线性上采样层组成; 步骤2: 训练设计好的服装图像解析模型; 步骤3: 使用训练好的服装图像解析模型来 解析服装图片, 生成像素级的预测图像。 2.如权利要求1所述的一种基于深度学习的服装图像解析方法, 其特征在于: 步骤1中 的图像特征编码模块中含有16个编码模块, 每一个编码模块都由卷积层和激活层构成, 其 中编码模块的具体操作是: 先进 行3×3卷积, 卷积后面跟着一个激活层, 再进 行一个3×3卷 积, 卷积后面跟着一个激活层, 最后进行1 ×1卷积, 卷积后面跟着一个激活层。 3.如权利要求1所述的一种基于深度学习的服装图像解析方法, 其特征在于: 步骤1中 的服装特征解码模块中含有4个上采样解码模块, 上采样解码模块的具体操作是: 先进行1 ×1卷积, 卷积后面跟着一个激活层, 再进行5 ×5卷积, 卷积后面跟着一个激活层, 最后通过 双线性上采样层, 对 特征图进 行特征还原, 其中对于最后一个上采样解码模块, 在最后的双 线性上采样层后还加了两个卷积层, 第一个卷积层为3 ×3卷积对特征图进行进一步的理解 学习, 然后使用第二个卷积层为1 ×1卷积输出最终预测特征图, 其中通道数为最终的分类 数。 4.如权利要求1所述的一种基于深度学习的服装图像解析方法, 其特征在于: 步骤2中 服装图像解析模型的输入是原图像拼接上高频滤波处理器处理原图像后生成的高频图像, 高频图像包含图像的边缘信息可以有效的提高图像分割精度, 这里自定义的高频滤波处理 器使用的核矩阵 。 5.如权利要求1所述的一种基于深度学习的服装图像解析方法, 其特征在于: 步骤2中 训练过程的使用的损失函数由两 部分组成, 第一部分是像素损失函数 Losspixel公式如下: 其中Nclasses为服装总类别数, i为当前类别索引, Acci为该类别预测正确的个数与该类 别总数的比值, 初始赋值为0; (1 ‑Acci)为难分类权重使模型训练使更加关注 分类准确率低 的类别,ytrue为该类别的真实像素个数, y为预测正确的像素个数; 第二部分是区域损失函数 Lossregion公式如下: 其中θ是区域超参数其值设置为1.95, 为图像真实分割图, Ypred为图像预测分割权 利 要 求 书 1/2 页 2 CN 115496990 A 2图, 表示真实分割像素与预测分割像素交集的元素个数, 表示 真实分割图中的像素总数, | Ypred |表示预测分割图像中的像素总数; 训练中使用的损失函数 , 其中λ是自适应权重系数, 初 始值为0, 随着训练轮数每10轮增 加0.05, 增加到1时权 重系数不再变化。 6.如权利要求2或3所述的一种基于深度学习的服装图像解析方法, 其特征在于: 所述 激活层使用的激活函数S公式如下: 其中 为服装总类别数, x表示特征图任 意位置上的像 素值, 激活 函数在保留输入值正负属性的同时将线性关系转化为 非线性关系, 可以有效缓解梯度消失 现象, 使模型训练效果更好。 7.如权利要求2所述的一种基于深度 学习的服装图像解析方法, 其特征在于: 所述图像 特征编码模块中编码模块的卷积层设置, 当编 码模块的序号是4的整 数倍数时将最后一个1 ×1卷积替换为2 ×2卷积, 且步长设置为2, 用于调节特 征图的高宽 。 8.如权利要求3所述的一种基于深度学习的服装图像解析方法, 其特征在于: 所述4个 上采样解码模块的输入的具体操作为: 第16个编 码模块的输出拼接上低频图像下采样16倍 的输出是第1个上采样解码模块输入, 第12个编 码模块的输出拼接上低频图像下采样8倍的 输出是第2个上采样解码模块的输入, 第8个编码模块的输出拼接上低频图像下采样4倍的 输出是第3个上采样解码模块的输入, 第4个编码模块的输出拼接上低频图像下采样2倍的 输出是第4个上采样解码模块的输入, 低频图像是输入网络原图像经过低通滤波处理器得 到的, 低频图像包含图像的细节信息可以补充网络学习 过程中丢失的细节信息, 这里自定 义的低频 滤波处理器使用的核矩阵 。权 利 要 求 书 2/2 页 3 CN 115496990 A 3

PDF文档 专利 一种基于深度学习的服装图像解析方法

文档预览
中文文档 12 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于深度学习的服装图像解析方法 第 1 页 专利 一种基于深度学习的服装图像解析方法 第 2 页 专利 一种基于深度学习的服装图像解析方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:23:46上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。