(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211400525.5
(22)申请日 2022.11.09
(71)申请人 北京闪马智建科技有限公司
地址 100095 北京市海淀区温泉镇创客小
镇社区配套 商业楼15 #楼二层132号
申请人 上海闪马智能科技有限公司
杭州闪马智擎科技有限公司
(72)发明人 赵之健 汪传坤 林亦宁
(74)专利代理 机构 北京康信知识产权代理有限
责任公司 1 1240
专利代理师 赵静
(51)Int.Cl.
G06V 30/19(2022.01)
G06V 20/62(2022.01)
G06V 10/80(2022.01)G06V 10/82(2022.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
一种字符的确定方法、 装置、 存储介质及电
子装置
(57)摘要
本发明实施例提供了一种字 符的确定方法、
装置、 存储介质及电子装置, 其中, 该方法包括:
按照第一采样规则从训练数据集中抽取第一训
练数据, 以及按照第二采样规则从训练数据集中
抽取第二训练数据; 将第一训练数据输入至目标
网络模型中包括的第一分支网络中, 确定第一训
练数据的第一特征; 将第二训练数据输入至目标
网络模型中包括的第二分支网络中, 确定第二训
练数据的第二特征; 基于目标网络模 型中包括的
分类模型的网络参数融合第一特征以及第二特
征, 得到融合特征; 基于融合特征确定目标网络
模型的目标损失值, 并基于目标损失值迭代更新
目标网络模型的目标网络参数。 通过本发明, 达
到提高确定 字符的准确性的效果。
权利要求书2页 说明书10页 附图4页
CN 115457573 A
2022.12.09
CN 115457573 A
1.一种字符的确定方法, 其特 征在于, 包括:
将目标数据输入至目标网络模型中, 确定所述目标 数据的目标 特征;
基于所述目标 特征确定所述目标 数据对应的目标字符;
其中, 所述目标网络模型是通过如下方式进行训练的: 按照第一采样规则从训练数据
集中抽取第一训练数据, 以及按照第二采样规则从所述训练数据集中抽取第二训练数据,
所述训练数据集中包括第一类型的训练数据和 第二类型的训练数据, 所述第一类型的训练
数据的数量大于所述第二类型的训练数据的数量, 所述第一采样规则包括每个训练数据被
抽取到的概率相同, 所述第二采样规则包括所述第二类型的训练数据被抽取到的概率大于
所述第一类型 的训练数据被抽取到的概率, 所述第一训练数据、 所述第二训练数据以及所
述目标数据为采集设备采集到的数据; 将所述第一训练数据输入至所述目标网络模型中包
括的第一分支网络中, 确定所述第一训练数据的第一特征; 将所述第二训练数据输入至所
述目标网络模型中包括的第二分支网络中, 确定所述第二训练数据的第二特征; 基于所述
目标网络模型中包括的分类模型的网络参数融合所述第一特征以及所述第二特征, 得到融
合特征; 基于所述融合特征确定所述 目标网络模型 的目标损失值, 并基于所述目标损失值
迭代更新所述目标网络模型的目标网络参数。
2.根据权利要求1所述的方法, 其特征在于, 基于所述目标网络模型中包括的分类模型
的分类网络参数融合所述第一特 征以及所述第二特 征, 得到融合特 征包括:
确定所述第一分支网络对应的第一权 重, 以及所述第二分支网络对应的第二权 重;
将所述第一特征与所述第一权重相乘, 得到第三特征, 以及将所述第二特征与所述第
二权重相乘, 得到第四特 征;
基于所述分类网络参数融合所述第三特 征以及所述第四特 征, 得到所述融合特 征。
3.根据权利要求2所述的方法, 其特征在于, 基于所述分类网络参数融合所述第 三特征
以及所述第四特 征, 得到所述融合特 征包括:
确定所述分类网络参数中包括的第一子分类网络参数以及第二子分类网络参数, 其
中, 所述第一子分类网络参数为第一子分类网络的参数, 所述第一子分类网络与所述第一
分支网络连接, 所述第二子分类网络参数为第二子分类网络的参数, 所述第二子分类网络
与所述第二分支网络连接;
将所述第三特征与所述第一子分类网络参数相乘, 得到第五特征, 以及将所述第 四特
征与所述第二子分类网络参数相乘, 得到第六 特征;
连接所述第五特 征以及所述第六 特征, 得到所述融合特 征。
4.根据权利要求3所述的方法, 其特征在于, 基于所述融合特征确定所述目标网络模型
的目标损失值包括:
基于所述第五特 征确定所述第一分支网络的第一损失值;
基于所述第六 特征确定所述第二分支网络的第二损失值;
基于所述第一损失值以及所述第二损失值确定所述目标网络模型的目标损失值。
5.根据权利要求1所述的方法, 其特征在于, 基于所述目标损失值迭代更新所述目标网
络模型的目标网络参数包括:
确定所述目标损失值中包括的所述第 一分支网络对应的第 一损失值, 以及所述第 二分
支网络对应的第二损失值;权 利 要 求 书 1/2 页
2
CN 115457573 A
2基于所述第一损失值以及所述第二损失值更新所述目标网络参数中包括的第一权重
和第二权重, 其中, 所述第一权重为所述第一分支网络对应的权重, 所述第二权重为所述第
二分支网络对应的权 重。
6.根据权利要求1所述的方法, 其特征在于, 基于所述目标损失值迭代更新所述目标网
络模型的目标网络参数包括:
基于所述目标损失值确定网络参数 更新梯度;
按照所述网络参数更新梯度, 更新所述目标网络模型中包括的所述第一分支网、 所述
第二分支网络以及所述分类模型的网络参数。
7.根据权利要求1所述的方法, 其特征在于, 基于所述目标特征确定所述目标数据对应
的目标字符包括:
确定所述目标特征中包括的每个特征与特征字典表中包括的字符的特征的相似度得
分;
基于所述相似度得分确定所述目标 数据对应的所述目标字符。
8.一种字符的确定装置, 其特 征在于, 包括:
第一确定模块, 用于将目标数据输入至目标网络模型中, 确定所述目标数据的目标特
征;
第二确定模块, 用于基于所述目标 特征确定所述目标 数据对应的目标字符;
其中, 所述目标网络模型是通过如下方式进行训练的: 按照第一采样规则从训练数据
集中抽取第一训练数据, 以及按照第二采样规则从所述训练数据集中抽取第二训练数据,
所述训练数据集中包括第一类型的训练数据和 第二类型的训练数据, 所述第一类型的训练
数据的数量大于所述第二类型的训练数据的数量, 所述第一采样规则包括每个训练数据被
抽取到的概率相同, 所述第二采样规则包括所述第二类型的训练数据被抽取到的概率大于
所述第一类型 的训练数据被抽取到的概率, 所述第一训练数据、 所述第二训练数据以及所
述目标数据为采集设备采集到的数据; 将所述第一训练数据输入至目标网络模型中包括的
第一分支网络中, 确定所述第一训练数据的第一特征; 将所述第二训练数据输入至所述 目
标网络模型中包括的第二分支网络中, 确定所述第二训练数据的第二特征; 基于所述 目标
网络模型中包括的分类模型的网络参数融合所述第一特征以及所述第二特征, 得到融合特
征; 基于所述融合特征确定所述 目标网络模型 的目标损失值, 并基于所述 目标损失值迭代
更新所述目标网络模型的目标网络参数。
9.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质中存储有计算机
程序, 其中, 所述计算机程序被处理器执行时实现所述权利要求1至7任一项中所述的方法
的步骤。
10.一种电子装置, 包括存储器和 处理器, 其特征在于, 所述存储器中存储有计算机程
序, 所述处理器被设置为运行所述计算机程序以执行所述权利要求 1至7任一项中所述的方
法。权 利 要 求 书 2/2 页
3
CN 115457573 A
3
专利 一种字符的确定方法、装置、存储介质及电子装置
文档预览
中文文档
17 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:23:50上传分享