(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211276843.5
(22)申请日 2022.10.19
(71)申请人 成都数之联科技股份有限公司
地址 610000 四川省成 都市武侯区锦绣 街8
号2层270号
(72)发明人 不公告发明人
(51)Int.Cl.
G06K 9/62(2022.01)
G06N 20/00(2019.01)
G06Q 10/06(2012.01)
G06Q 50/04(2012.01)
(54)发明名称
一种车辆直通率影响特征确定方法、 装置、
设备及介质
(57)摘要
本申请公开了一种车辆直通率影响特征确
定方法、 训练方法、 装置、 设备及介质, 旨在解决
汽车直通率影 响因素分析过程中, 车辆首次下线
检测未通过, 但重启检测通过的原因分析困难的
问题, 涉及车辆检测数据分析领域。 所述车辆直
通率影像特征确定方法, 包括以下步骤: 对下线
检测不通过的车辆检测数据进行预处理; 基于所
述预处理的数据构建并训练机器学习分类模型;
基于所述机器学习分类模型计算所述预处理的
数据中特征的SHAP值; 对若干SHAP值通过预设的
处理方式进行筛选, 基于筛选结果优化车辆的检
测过程。
权利要求书3页 说明书7页 附图1页
CN 115358348 A
2022.11.18
CN 115358348 A
1.一种车辆直 通率影响特 征确定方法, 包括以下步骤:
对下线检测不 通过的车辆检测数据进行 预处理;
基于所述预处 理的数据构建并训练机器学习分类模型;
基于所述机器学习分类模型计算所述预处 理的数据中特 征的SHAP值;
对若干SHAP值 通过预设的处 理方式进行筛 选, 基于筛选结果优化车辆的检测过程。
2.如权利要求1所述的车辆直通率影响特征确定方法, 其特征在于, 所述预处理过程包
括标记所述车辆检测数据。
3.如权利要求1所述的车辆直通率影响特征确定方法, 其特征在于, 所述机器学习分类
模型训练过程包括:
将所述车辆检测数据集划分为训练数据集和验证数据集, 所述训练数据集用于训练所
述机器学习分类模型, 所述验证数据集用于验证所述机器学习分类模型是否达到可用标
准。
4.如权利要求1所述的车辆直 通率影响特 征确定方法, 其特 征在于:
所述SHAP值进行筛选过程包括: 将所述筛选后的SHAP值排序, 根据所述排序结果筛选
符合条件的SHAP值, 其对应的特 征为可用于优化车辆检测过程的特 征。
5.如权利要求2所述的车辆直 通率影响特 征确定方法, 其特 征在于:
所述的标记所述车辆检测数据过程为: 将所述下线检测不通过但重启测试通过的车辆
检测数据定义为正样本, 将所述下线检测不通过且重启测试仍未通过的数据定义为负样
本。
6.如权利要求2所述的车辆直通率影响特征确定方法, 其特征在于, 所述预处理过程包
括对所述车辆检测数据进行o ne‑hot编码。
7.如权利要求4所述的车辆直通率影响特征确定方法, 其特征在于, 所述筛选后的SHAP
值排序方式为降序排列。
8.如权利要求 4所述的车辆直 通率影响特 征确定方法, 其特 征在于:
筛选符合条件的SHAP值过程为: 筛选所述排序结果中SHAP值为正且均值排序Top ‑K的
特征及SHAP值 为负且均值 排序Last ‑K的特征。
9.如权利要求8所述的车辆直通率影响特征确定方法, 其特征在于, 所述的SHAP值为正
且均值排序Top ‑K的特征为最容易产生正样本数据的特征, 所述SHAP值为负且均值排序
Last‑K的特征为最容易导致汽车出故障的特 征。
10.一种车辆直 通率影响特 征确定模型训练方法, 其特 征在于, 包括以下步骤:
对下线检测不 通过的车辆检测数据进行 预处理;
构建机器学习分类模型;
基于所述预处 理的数据训练机器学习分类模型。
11.如权利要求10所述的一种车辆直通率影响特征确定模型训练方法, 其特征在于, 所
述训练机器学习分类模型包括:
将所述预处理 的数据划分为训练数据集和验证数据集, 所述训练数据集用于训练所述
机器学习分类模型, 所述验证数据集用于验证所述机器学习分类模型 是否达到可用标准。
12.一种车辆直 通率影响特 征确定装置, 其特 征在于, 包括:
数据预处 理模块, 用于对下线检测不 通过的车辆检测数据进行 预处理;权 利 要 求 书 1/3 页
2
CN 115358348 A
2模型训练模块, 用于基于所述预处 理的数据构建并训练机器学习分类模型;
检测过程优化模块, 用于基于所述机器学习分类模型计算所述预处理 的数据中特征的
SHAP值, 对若干SHAP值 通过预设的处 理方式进行筛 选, 基于筛选结果优化车辆的检测过程。
13.如权利要求12所述的车辆直通率影响特征确定装置, 其特征在于, 所述预处理过程
包括标记所述车辆检测数据。
14.如权利要求12所述的车辆直通率影响特征确定装置, 其特征在于, 所述机器学习分
类模型训练过程包括:
将所述车辆检测数据集划分为训练数据集和验证数据集, 所述训练数据集用于训练所
述机器学习分类模型, 所述验证数据集用于验证所述机器学习分类模型是否达到可用标
准。
15.如权利要求12所述的车辆直通率影响特征确定装置, 其特征在于, 所述SHAP值进行
筛选过程包括: 将所述筛选后的SHAP值排序, 根据所述排序结果筛选 符合条件的SHAP值, 其
对应的特 征为可用于优化车辆检测过程的特 征。
16.如权利要求12所述的车辆直 通率影响特 征确定装置, 其特 征在于:
所述的标记所述车辆检测数据过程为: 将所述下线检测不通过但重启测试通过的车辆
检测数据定义为正样本, 将所述下线检测不通过且重启测试仍未通过的数据定义为负样
本。
17.如权利要求13所述的车辆直通率影响特征确定装置, 其特征在于, 所述预处理过程
包括对所述车辆检测数据进行o ne‑hot编码。
18.如权利要求15所述的车辆直通率影响特征确定装置, 其特征在于, 所述筛选后的
SHAP值排序方式为降序排列。
19.如权利要求15所述的车辆直 通率影响特 征确定装置, 其特 征在于:
筛选符合条件的SHAP值过程为: 筛选所述排序结果中SHAP值为正且均值排序Top ‑K的
特征及SHAP值 为负且均值 排序Last ‑K的特征。
20.如权利要求19所述的车辆直通率影响特征确定装置, 其特征在于, 所述的SHAP值为
正且均值排序Top ‑K的特征为最容易产生正样本数据的特征, 所述SHAP值为负且均值排序
Last‑K的特征为最容易导致汽车出故障的特 征。
21.一种车辆直 通率影响特 征确定模型训练装置, 其特 征在于, 包括:
数据预处 理模块, 用于对下线检测不 通过的车辆检测数据进行 预处理;
模型构建模块, 用于构建机器学习分类模型;
模型训练模块, 用于基于所述预处 理的数据训练机器学习分类模型。
22.如权利要求21所述的一种车辆直通率影响特征确定模型训练装置, 其特征在于, 所
述训练机器学习分类模型包括:
将所述预处理 的数据划分为训练数据集和验证数据集, 所述训练数据集用于训练所述
机器学习分类模型, 所述验证数据集用于验证所述机器学习分类模型 是否达到可用标准。
23.一种电子设备, 其特征在于, 该电子设备包括存储器和 处理器, 所述存储器中存储
有计算机程序, 所述处理器执行所述计算机程序, 实现如权利要求1 ‑11中任一项所述的方
法。
24.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质上存储有计算机权 利 要 求 书 2/3 页
3
CN 115358348 A
3
专利 一种车辆直通率影响特征确定方法、装置、设备及介质
文档预览
中文文档
12 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:24:49上传分享