专利基于半监督知识蒸馏的行人重识别模型训练方法及装置 -在线下载 -pdf文件-bbs.720life.cn

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202211302270.9 (22)申请日 2022.10.24 (71)申请人深圳须弥云图空间科技有限公司地址 518054 广东省深圳市南山区粤海街道海珠社区滨海大道3369号有线信息传输大厦25F25 04 (72)发明人不公告发明人　 (74)专利代理机构北京嘉科知识产权代理事务所(特殊普通合伙) 11687 专利代理师陈美君 (51)Int.Cl. G06V 40/10(2022.01) G06V 10/764(2022.01) G06V 10/774(2022.01) G06V 10/778(2022.01)G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称基于半监督知识蒸馏的行人重识别模型训练方法及装置 (57)摘要本申请提供一种基于半监督知识蒸馏的行人重识别模型训练方法及装置。该方法包括：分别对教师模型和学生模型进行预训练，将有标签数据输入到训练后的教师模型和学生模型中，分别利用教师模型的预测值以及真实标签去监督学生模型的预测值，得到第一损失函数和第二损失函数；利用教师模型的预测值去监督学生模型中的无标签数据分类器输出的预测值，得到第三损失函数；利用对齐后的学生特征提取网络的特征图与教师特征提取网络的特征图计算得到第四损失函数；依据第一损失函数、第二损失函数、第三损失函数及第四损失函数，计算总损失函数；利用总损失函数对行人重识别模型进行更新和训练。本申请提高了行人重识别模型的泛化能力、精度以及识别效果。权利要求书2页说明书9页附图3页 CN 115546840 A 2022.12.30 CN 115546840 A 1.一种基于半监督知识蒸馏的行人重识别模型训练方法，其特征在于，包括：获取预设场景下的有标签数据和无标签数据，利用所述有标签数据分别对教师模型和学生模型进行预训练，得到训练后的教师模型和学生模型；将所述有标签数据输入到训练后的所述教师模型和所述学生模型中，分别利用所述教师模型的预测值以及真实标签去监督所述学生模型的预测值，得到第一损失函数和第二损失函数；将所述无标签数据输入到训练后的所述教师模型和所述学生模型中，利用所述教师模型的预测值去监督所述学生模型中的无标签数据分类器输出的预测值，得到第三损失函数；将学生特征提取网络的特征图与教师特征提取网络的特征图进行对齐，并利用对齐后的学生特征提取网络的特征图与所述教师特征提取网络的特征图计算得到第四损失函数；依据所述第一损失函数、第二损失函数、第三损失函数以及第四损失函数，计算得到总损失函数；利用所述总损失函数对行人重识别模型的原损失函数进行更新，并利用训练集对更新损失函数后的行人重识别模型进行训练。 2.根据权利要求1所述的方法，其特征在于，在所述得到训练后的教师模型和学生模型之后，所述方法还包括：将所述有标签数据和所述无标签数据分别输入到训练后的教师模型和学生模型中，利用训练后的教师模型中的教师特征提取网络提取特征图，并利用训练后的学生模型中的学生特征提取网络提取特征图。 3.根据权利要求1所述的方法，其特征在于，利用所述教师模型的预测值去监督所述学生模型的预测值，得到第一损失函数，包括：将所述教师模型输出的预测值作为标签，利用所述标签与所述学生模型输出的预测值计算第一损失函数，其中，所述第一损失函数采用JS散度损失函数。 4.根据权利要求1所述的方法，其特征在于，利用所述有标签数据对应的真实标签去监督所述学生模型的预测值，得到第二损失函数，包括：将所述有标签数据的真实标签与所述学生模型输出的预测值计算第二损失函数，其中，所述第二损失函数采用交叉熵损失函数。 5.根据权利要求1所述的方法，其特征在于，所述利用所述教师模型的预测值去监督所述学生模型中的无标签数据分类器输出的预测值，得到第三损失函数，包括：在所述学生模型中生成一个与有标签数据分类器具有相同维度的无标签数据分类器，将所述教师模型输出的预测值作为标签，利用所述标签与所述无标签数据分类器输出的预测值计算第三损失函数，其中，所述第三损失函数采用JS散度损失函数。 6.根据权利要求1所述的方法，其特征在于，所述将学生特征提取网络的特征图与教师特征提取网络的特征图进行对齐，包括：利用预定的语义对齐模块计算所述学生特征提取网络的特征图与所述教师特征提取网络的特征图之间的相似度权重，基于所述相似度权重对所述学生特征提取网络的特征图进行重建，以使重建后的学生特征提取网络的特征图与所述教师特征提取网络的特征图对齐。权　利　要　求　书 1/2 页 2 CN 115546840 A 27.根据权利要求6所述的方法，其特征在于，所述利用对齐后的学生特征提取网络的特征图与所述教师特征提取网络的特征图计算得到第四损失函数，包括：利用所述重建后的学生特征提取网络的特征图以及所述教师特征提取网络的特征图，构建所述第四损失函数。 8.根据权利要求1所述的方法，其特征在于，所述依据所述第一损失函数、第二损失函数、第三损失函数以及第四损失函数，计算得到总损失函数，包括采用以下公式计算总损失函数： Lsum＝Loss1+Loss2+Loss3+α *Loss4 其中， Lsum表示总损失函数， Loss1表示第一损失函数， Loss2表示第二损失函数， Loss3 表示第三损失函数， L oss4表示第四损失函数， α 表示超参数。 9.一种基于半监督知识蒸馏的行人重识别模型训练装置，其特征在于，包括：预训练模块，被配置为获取预设场景下的有标签数据和无标签数据，利用所述有标签数据分别对教师模型和学生模型进行预训练，得到训练后的教师模型和学生模型；第一监督模块，被配置为将所述有标签数据输入到训练后的所述教师模型和所述学生模型中，分别利用所述教师模型的预测值以及真实标签去监督所述学生模型的预测值，得到第一损失函数和第二损失函数；第二监督模块，被配置为将所述无标签数据输入到训练后的所述教师模型和所述学生模型中，利用所述教师模型的预测值去监督所述学生模型中的无标签数据分类器输出的预测值，得到第三损失函数；第三监督模块，被配置为将学生特征提取网络的特征图与教师特征提取网络的特征图进行对齐，并利用对齐后的学生特征提取网络的特征图与所述教师特征提取网络的特征图计算得到第四损失函数；计算模块，被配置为依据所述第一损失函数、第二损失函数、第三损失函数以及第四损失函数，计算得到总损失函数；训练模块，被配置为利用所述总损失函数对行人重识别模型的原损失函数进行更新，并利用训练集对更新损失函数后的行人重识别模型进行训练。 10.一种电子设备，包括存储器，处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如权利要求1至8中任一项所述的方法。权　利　要　求　书 2/2 页 3 CN 115546840 A 3

专利 基于半监督知识蒸馏的行人重识别模型训练方法及装置

专利基于半监督知识蒸馏的行人重识别模型训练方法及装置