(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211315161.0
(22)申请日 2022.10.26
(71)申请人 功夫链 (上海) 体 育文化发展 有限公
司
地址 200040 上海市 静安区延安西路12 9号
2208室
(72)发明人 李翔 韩潼瑜 黄玉阔
(74)专利代理 机构 大连大工智讯专利代理事务
所(特殊普通 合伙) 2124 4
专利代理师 梁左秋
(51)Int.Cl.
G06V 40/10(2022.01)
G06V 10/80(2022.01)
G06V 10/44(2022.01)
G06V 10/774(2022.01)G06V 10/82(2022.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
一种基于超大卷积核的人体姿态估计方法
及系统
(57)摘要
本发明涉及人体姿态估计技术领域, 提供一
种基于超大卷积核的人体姿态估计方法及系统,
包括: 步骤100, 获取检测图片; 步骤200, 将检测
图片输入人体姿态估计模型的主干网络中, 进行
特征提取, 得到特征图; 其中, 所述主干网络采用
SLaK网络; 所述SLaK网络结构, 包括: Stem模块、
Res2模块、 Res3模块、 Res4模块、 Res5模块; 步骤
300, 将主干网络输 出的特征图, 依次输入多个 反
转置卷积层和一个卷积层, 得到人体 关键点的热
力图; 步骤400, 输出人体姿态热力图。 本发明能
够更好的提取特征、 提高对人体姿态估计的准确
率。
权利要求书1页 说明书4页 附图3页
CN 115546841 A
2022.12.30
CN 115546841 A
1.一种基于超大 卷积核的人体姿态估计方法, 其特 征在于, 包括以下 过程:
步骤100, 获取检测图片;
步骤200, 将检测图片输入人体姿态估计模型的主干网络中, 进行特征提取, 得到特征
图; 其中, 所述主干网络采用SLaK网络; 所述SLaK网络结构, 包括: Stem模块、 Res2模块、 Res3
模块、 Res4模块、 Res5模块;
步骤300, 将主干网络输出的特征图, 依次输入多个反转置卷积层和一个卷积层, 得到
人体关键点的热力图;
步骤400, 输出人体姿态热力图。
2.根据权利要求1所述的基于超大卷积核的人体姿态估计方法, 其特征在于, 所述Res2
模块、 Res3模块、 Res4模块、 Res5模块的重复个数依次为3、 3、 9、 3 。
3.根据权利要求2所述的基于超大卷积核的人体姿态估计方法, 其特征在于, 所述Res2
模块、 Res3模块、 Res4模块、 Res5模块均拥有超大卷积核卷积, 超大卷积核卷积大小依次为
51、 49、 47、 13或61、 59、 57、 13 。
4.根据权利要求1或3所述的基于超大卷积核的人体姿态估计方法, 其特征在于, 所述
Res2模块、 Res3模块、 Res4模块、 Res5模块均具有SLak Block子模块、 1 ×1的卷积子模块、 1
×1的卷积子模块。
5.根据权利要求4所述的基于超大卷积核的人体姿态估计方法, 其特征在于, 所述SLak
Block子模块采用51 ×5和5×51和5×5三个卷积核 进行卷积。
6.根据权利要求5所述的基于超大卷积核的人体姿态估计方法, 其特征在于, 输入检测
图片大小为25 6×192, 经过主干网络的处 理后, 最后特 征图的尺寸大小为8 ×6;
反转置卷积层的卷积核均采用4 ×4, 最终的热力图大小为64 ×48, 损失函数采用L2
loss。
7.一种基于超大卷积核的人体姿态估计系统, 其特征在于, 包括: 采集模块、 特征提取
模块、 反转置卷积处 理模块和输出模块;
所述采集模块, 用于获取检测图片;
所述特征提取模块, 用于将检测图片输入人体姿态估计模型的主干网络中, 进行特征
提取, 得到特征图; 其中, 所述主干网络采用SLaK网络; 所述SLaK网络结构, 包括: Stem模块、
Res2模块、 Res3模块、 Res4模块、 Res5模块;
所述反转置卷积处理模块, 用于将主干网络输出的特征图, 依次输入多个反转置卷积
层和一个卷积层, 得到人体关键点的热力图;
所述输出模块, 用于 输出人体姿态热力图。权 利 要 求 书 1/1 页
2
CN 115546841 A
2一种基于超大卷积核的 人体姿态估计方 法及系统
技术领域
[0001]本发明涉及人体姿态估计技术领域, 尤其涉及一种基于超大卷积核的人体姿态估
计方法及系统。
背景技术
[0002]2D人体姿态估计(Human Pose Estimation, HPE)是视觉的重要任务, 核心任务是
检测视频或图片里 的人体手部、 肩、 胯部等各个关节点信息, 是很多任务的铺垫工作。 人体
姿态估计在智慧社区、 安全校园、 A I游戏互动等领域应用越来越广。 为了确保各个场景的速
度和精度, 提高人体姿态估计的速度和精度是及其核心的任务。
[0003]最近十年, 深度学习蓬勃发展, 已经广泛应用到2d人体姿态估计中。 在深度学习领
域, 效果较好的人体姿态关键点算法有基于resnet为主干网络的SimpleBaseline方法, 保
持多分辨 率并行的Hrnet, 并行子网络的多尺度特 征融合让速度很慢。
[0004]当前的2D人体姿态研究存在精度不高, 有些复杂的关键点检测不到, 尤其对于遮
挡的情况。 现有的移动端人体姿态估计方法无法对复杂的场景有好的鲁棒性, 无法对人体
姿态进行高精度和高速度的估计。
发明内容
[0005]本发明主要解决现有技术的人体姿态估计方法无法对复杂的场景有好的鲁棒性,
无法对人体姿态进行高精度和高速度的估计等技术问题, 提出一种基于超 大卷积核的人体
姿态估计方法及系统, 以更好的提取 特征、 提高对人体姿态估计的准确率。
[0006]本发明提供了一种基于超大 卷积核的人体姿态估计方法, 包括以下 过程:
[0007]步骤100, 获取检测图片;
[0008]步骤200, 将检测图片输入人体姿态估计模型的主干网络中, 进行特征提取, 得到
特征图; 其中, 所述主干网络采用SLaK网络; 所述SLaK网络结构, 包括: Stem模块、 Res2模块、
Res3模块、 Res4模块、 Res5模块;
[0009]步骤300, 将主干网络输出的特征图, 依次输入多个反转置卷积层和一个卷积层,
得到人体关键点的热力图;
[0010]步骤400, 输出人体姿态热力图。
[0011]优选的, 所述Res2模块、 Res3模块、 Res4模块、 Res5模块的重复个数依次为3、 3、 9、
3。
[0012]优选的, 所述Res2模块、 Res3模块、 Res4模块、 Res5模块均拥有超大卷积核卷积, 超
大卷积核卷积大小依次为51、 49、 47、 13或61、 59、 57、 13 。
[0013]优选的, 所述Res2模块、 Res3模块、 Res4模块、 Res5模块均具有SLak Block子模块、
1×1的卷积子模块、 1 ×1的卷积子模块。
[0014]优选的, 所述SLak Block子模块采用51 ×5和5×51和5×5三个卷积核 进行卷积。
[0015]优选的, 输入检测图片大小为256 ×192, 经过主干网络的处理后, 最后特征图的尺说 明 书 1/4 页
3
CN 115546841 A
3
专利 一种基于超大卷积核的人体姿态估计方法及系统
文档预览
中文文档
9 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共9页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:24:12上传分享