专利一种座舱内手势交互方法及装置 -在线下载 -pdf文件-bbs.720life.cn

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202211381906.3 (22)申请日 2022.11.07 (71)申请人科大讯飞股份有限公司地址 230088 安徽省合肥市高新开发区望江西路666号 (72)发明人沈锦瑞　林垠　殷保才　胡金水　殷兵　 (74)专利代理机构北京维澳专利代理有限公司 11252 专利代理师陈变花 (51)Int.Cl. G06V 40/20(2022.01) G06V 10/82(2022.01) G06V 10/764(2022.01) G06F 3/01(2006.01)G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称一种座舱内手势交互方法及装置 (57)摘要本发明公开了一种座舱内手势交互方法及装置，座舱内手势交互方法包括：接收座舱内的实时图像；将实时图像输入手势识别模型，获得手势识别模型输出的第一手势类别检测结果和第一位置类别检测结果；依据第一座舱位置上第一手势对应的控制指令控制座舱内的设备；其中，对于不同的第一座舱位置，相同的第一手势对应的控制指令不同。本发明通过手势识别模型直接获得手势类别检测结果，避免两阶段手势识别导致的车机工作压力，并通过识别手势动作人所在的座舱位置，为不同座舱位置上的相同手势配置不同的功能，提高了手势交互的丰富度。权利要求书3页说明书11页附图4页 CN 115424356 A 2022.12.02 CN 115424356 A 1.一种座舱内手势交互方法，其特征在于，包括：接收座舱内的实时图像；将所述实时图像输入手势识别模型，获得所述手势识别模型输出的第一手势类别检测结果和第一位置类别检测结果，所述第一手势类别检测结果指示第一手势的类型，所述第一位置类别检测结果指示所述第一手势的动作人所在的第一座舱位置；依据所述第一座舱位置上所述第一手势对应的控制指令控制座舱内的设备；其中，对于不同的第一座舱位置，相同的第一手势对应的控制指令不同。 2.根据权利要求1所述的座舱内手势交互方法，其特征在于，在获得所述第一手势类别检测结果之后，利用当前帧和所述当前帧之前的连续第一预设数量帧的手势类别检测结果进行投票，确定所述当前帧的第一手势类别检测结果是否有效；若有效，则依据所述第一座舱位置上所述第一手势对应的控制指令控制座舱内的设备。 3.根据权利要求2所述的座舱内手势交互方法，其特征在于，若所述当前帧的第一手势类别检测结果有效，则利用当前帧和所述当前帧之前的连续第二预设数量帧的位置类别检测结果进行投票，确定所述当前帧的第一位置类别检测结果是否有效；若所述当前帧的第一位置类别检测结果有效，则依据所述第一座舱位置上所述第一手势对应的控制指令控制座舱内的设备。 4.根据权利要求1所述的座舱内手势交互方法，其特征在于，所述手势识别模型对所述实时图像进行处理，获得所述第一手势类别检测结果和所述第一位置类别检测结果，具体包括：对所述实时图像进行处理，获得第一手势分类结果、第一位置分类结果以及第一手势动作人的第一中心点；将所述第一手势分类结果作为所述第一手势类别检测结果并输出；判断所述第一中心点是否位于所述第一位置分类结果所指示的座舱位置所在的区域内；若是，则将所述第一位置分类结果作为所述第一位置类别检测结果并输出。 5.根据权利要求4所述的座舱内手势交互方法，其特征在于，若所述第一中心点未位于所述第一位置分类结果所指示的座舱位置所在的区域内，则判定所述第一位置类别检测结果为未知区域并输出。 6.根据权利要求5所述的座舱内手势交互方法，其特征在于，若所述第一位置类别检测结果为未知区域，则不对座舱内的设备做控制，或依据所述第一手势的类型对应的通用指令控制座舱内的设备。 7.根据权利要求4所述的座舱内手势交互方法，其特征在于，所述手势识别模型包括第三预设数量的卷积层，每个所述卷积层输出时序特征和卷积结果；所述手势识别模型的输入数据为所述实时图像和所述第三预设数量的卷积层获得的当前帧的前一帧的所有时序特征。 8.根据权利要求4或7所述的座舱内手势交互方法，其特征在于，获得第一位置分类结果之后，利用座舱内所有座舱位置的第一独热的调制向量对所述第一位置分类结果进行投票，确定第二位置分类结果；其中，所述第一独热的调制向量是依据所述实时图像的实际位权　利　要　求　书 1/3 页 2 CN 115424356 A 2置类别标签生成的；并且，若所述第一中心点位于所述第二位置分类结果所指示的座舱位置所在的区域内，则将所述第二位置分类结果作为所述第一位置类别检测结果并输出。 9.根据权利要求1所述的座舱内手势交互方法，其特征在于，接收所述实时图像前，还包括：接收座舱内的光线强度信息；依据所述光线强度信息控制座舱内摄像设备使用可见光或近红外光进行拍摄。 10.根据权利要求7所述的座舱内手势交互方法，其特征在于，对所述手势识别模型进行训练包括：将连续图像样本输入初始模型；获得所述连续图像样本经所述第三预设数量的卷积层后获得的手势卷积结果和位置卷积结果，每个所述卷积层依次包括时序偏移模块和卷积模块，所述时序偏移模块的输入数据为前一卷积层输出的时序特征；将所述手势卷积结果和所述位置卷积结果分别输入手势分类器和位置分类器，获得第二手势类别检测结果和第二位置类别检测结果；依据所述第二手势类别检测结果与所述连续图像样本的手势类别标签之间、所述第二位置类别检测结果与所述连续图像样本的实际位置类别标签之间的损失函数对所述初始模型进行迭代训练，获得所述手势识别模型。 11.根据权利要求10所述的座舱内手势交互方法，其特征在于，所述位置分类器的输入数据为所述位置卷积结果和位置调制器生成的第二独热的调制向量的点积，所述第二独热的调制向量是依据所述连续图像样本的实际位置类别标签生成的。 12.根据权利要求10或11所述的座舱内手势交互方法，其特征在于，所述连续图像样本经所述第三预设数量的卷积层后还获得手势动作人的第二中心点；并且，还利用通过对所述连续图像样本的人体检测获得的手势动作人的第三中心点与所述第二中心点之间的损失函数对所述初始模型进行迭代训练。 13.根据权利要求9所述的座舱内手势交互方法，其特征在于，所述座舱内摄像设备设置在座舱的顶灯或舱内后视镜处。 14.一种座舱内手势交互装置，其特征在于，包括实时图像接收模块、手势识别模块以及控制模块；所述实时图像接收模块用于接收座舱内的实时图像；所述手势识别模块用于将所述实时图像输入手势识别模型，获得所述手势识别模型输出的第一手势类别检测结果和第一位置类别检测结果，所述第一手势类别检测结果指示第一手势的类型，所述第一位置类别检测结果指示所述第一手势的动作人所在的第一座舱位置；所述控制模块用于依据所述第一座舱位置上所述第一手势对应的控制指令控制座舱内的设备；其中，对于不同的第一座舱位置，相同的第一手势对应的控制指令不同。 15.根据权利要求14所述的座舱内手势交互装置，其特征在于，所述手势识别模型包括处理模块、判断模块以及输出模块；所述处理模块用于对所述实时图像进行处理，获得第一手势分类结果、第一位置分类权　利　要　求　书 2/3 页 3 CN 115424356 A 3

专利 一种座舱内手势交互方法及装置

专利一种座舱内手势交互方法及装置