(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211302270.9
(22)申请日 2022.10.24
(71)申请人 深圳须弥云图空间科技有限公司
地址 518054 广东省深圳市南 山区粤海街
道海珠社区滨海 大道3369号有线信息
传输大厦25F25 04
(72)发明人 不公告发明人
(74)专利代理 机构 北京嘉科知识产权代理事务
所(特殊普通 合伙) 11687
专利代理师 陈美君
(51)Int.Cl.
G06V 40/10(2022.01)
G06V 10/764(2022.01)
G06V 10/774(2022.01)
G06V 10/778(2022.01)G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
基于半监督知识蒸馏的行人重识别模型训
练方法及装置
(57)摘要
本申请提供一种基于半监督知识蒸馏的行
人重识别模型训练方法及装置。 该方法包括: 分
别对教师模 型和学生模型进行预训练, 将有 标签
数据输入到训练后的教师模型和学生模型中, 分
别利用教师模型的预测值 以及真实标签去监督
学生模型的预测值, 得到第一损失函数和第二损
失函数; 利用教师模型的预测值去监督学生模型
中的无标签数据分类器输出的预测值, 得到第三
损失函数; 利用对齐后的学生特征提取网络的特
征图与教师特征提取网络的特征图计算得到第
四损失函数; 依据第一损失函数、 第二损失函数、
第三损失函数及第四损失函数, 计算总损失函
数; 利用总损失函数对行人重识别模 型进行更新
和训练。 本申请提高了行人重识别模 型的泛化能
力、 精度以及识别效果。
权利要求书2页 说明书9页 附图3页
CN 115546840 A
2022.12.30
CN 115546840 A
1.一种基于半监 督知识蒸馏的行 人重识别模型训练方法, 其特 征在于, 包括:
获取预设场景下的有标签数据和无标签数据, 利用所述有标签数据分别对教师模型和
学生模型进行 预训练, 得到训练后的教师模型和学生模型;
将所述有标签数据输入到训练后的所述教师模型和所述学生模型中, 分别利用所述教
师模型的预测值以及真实标签去监督所述学生模型的预测值, 得到第一损失函数和第二损
失函数;
将所述无标签数据输入到训练后的所述教师模型和所述学生模型中, 利用所述教师模
型的预测值去监督所述学生模型中的无标签数据分类器输出的预测值, 得到第三损失函
数;
将学生特征提取网络的特征图与教师特征提取网络的特征图进行对齐, 并利用对齐后
的学生特 征提取网络的特 征图与所述教师 特征提取网络的特 征图计算得到第四损失函数;
依据所述第一损失函数、 第 二损失函数、 第三损失函数以及第四损失函数, 计算得到总
损失函数;
利用所述总损失函数对行人重识别模型的原损失函数进行更新, 并利用训练集对更新
损失函数后的行 人重识别模型进行训练。
2.根据权利要求1所述的方法, 其特征在于, 在所述得到训练后的教师模型和学生模型
之后, 所述方法还 包括:
将所述有标签数据和所述无标签数据分别 输入到训练后的教师模型和学生模型中, 利
用训练后的教师模型中的教师特征提取网络提取特征图, 并利用训练后的学生模型中的学
生特征提取网络提取 特征图。
3.根据权利要求1所述的方法, 其特征在于, 利用所述教师模型的预测值去监督所述学
生模型的预测值, 得到第一损失函数, 包括:
将所述教师模型输出的预测值作为标签, 利用所述标签与所述学生模型输出的预测值
计算第一损失函数, 其中, 所述第一损失函数采用JS散度损失函数。
4.根据权利要求1所述的方法, 其特征在于, 利用所述有标签数据对应的真实标签去监
督所述学生模型的预测值, 得到第二损失函数, 包括:
将所述有标签数据的真实标签与所述学生模型输出的预测值计算第二损失函数, 其
中, 所述第二损失函数采用交叉熵损失函数。
5.根据权利要求1所述的方法, 其特征在于, 所述利用所述教师模型的预测值去监督所
述学生模型中的无 标签数据分类 器输出的预测值, 得到第三损失函数, 包括:
在所述学生模型中生成一个与有标签数据分类器具有相同维度的无标签数据分类器,
将所述教师模型输出的预测值作为标签, 利用所述标签与所述无标签数据分类器输出的预
测值计算第三损失函数, 其中, 所述第三损失函数采用JS散度损失函数。
6.根据权利要求1所述的方法, 其特征在于, 所述将学生特征提取网络的特征图与教师
特征提取网络的特 征图进行对齐, 包括:
利用预定的语义对齐模块计算所述学生特征提取网络的特征图与所述教师特征提取
网络的特征图之间的相似度权重, 基于所述相似度权重对所述学生特征提取网络的特征图
进行重建, 以使重 建后的学生特征提取网络的特征图与所述教师特征提取网络的特征图对
齐。权 利 要 求 书 1/2 页
2
CN 115546840 A
27.根据权利要求6所述的方法, 其特征在于, 所述利用对齐后的学生特征提取网络的特
征图与所述教师 特征提取网络的特 征图计算得到第四损失函数, 包括:
利用所述重建后的学生特征提取网络的特征图以及所述教师特征提取网络的特征图,
构建所述第四损失函数。
8.根据权利要求1所述的方法, 其特征在于, 所述依据所述第一损 失函数、 第二损 失函
数、 第三损失函数以及第四损失函数, 计算得到总损失函数, 包括采用以下公式计算总损失
函数:
Lsum=Loss1+Loss2+Loss3+α *Loss4
其中, Lsum表示总损失函数, Loss1表示第一损失函数, Loss2表示第二损失函数, Loss3
表示第三损失函数, L oss4表示第四损失函数, α 表示超参数。
9.一种基于半监 督知识蒸馏的行 人重识别模型训练装置, 其特 征在于, 包括:
预训练模块, 被配置为获取预设场景下的有标签数据和无标签数据, 利用所述有标签
数据分别对教师模型和学生模型进行 预训练, 得到训练后的教师模型和学生模型;
第一监督模块, 被配置为将所述有标签数据输入到训练后的所述教师模型和所述学生
模型中, 分别利用所述教师模型 的预测值以及真实标签去监督所述学生模型 的预测值, 得
到第一损失函数和第二损失函数;
第二监督模块, 被配置为将所述无标签数据输入到训练后的所述教师模型和所述学生
模型中, 利用所述教师模型的预测值去监督所述学生模型中的无标签数据分类器输出的预
测值, 得到第三损失函数;
第三监督模块, 被配置为将学生特征提取网络的特征图与教师特征提取网络的特征图
进行对齐, 并利用对齐后的学生特征提取网络的特征图与所述教师特征提取网络的特征图
计算得到第四损失函数;
计算模块, 被配置为依据 所述第一损失函数、 第 二损失函数、 第三损失函数以及第四损
失函数, 计算得到总损失函数;
训练模块, 被配置为利用所述总损 失函数对行人重识别模型的原损 失函数进行更新,
并利用训练集对更新损失函数后的行 人重识别模型进行训练。
10.一种电子设备, 包括存储器, 处理器及存储在存储器上并可在处理器上运行的计算
机程序, 所述处 理器执行所述程序时实现如权利要求1至8中任一项所述的方法。权 利 要 求 书 2/2 页
3
CN 115546840 A
3
专利 基于半监督知识蒸馏的行人重识别模型训练方法及装置
文档预览
中文文档
15 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:24:17上传分享