(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211119341.1
(22)申请日 2022.09.14
(71)申请人 上海交通大 学
地址 200240 上海市闵行区东川路80 0号
(72)发明人 孙天洋 俞进
(74)专利代理 机构 上海汉声知识产权代理有限
公司 3123 6
专利代理师 胡晶
(51)Int.Cl.
G01N 21/71(2006.01)
G01N 21/01(2006.01)
(54)发明名称
异源激光诱导击穿光谱之间的迁移和标准
化方法及系统
(57)摘要
本发明提供了一种异源激光诱导击穿光谱
之间的迁移和标准化方法及系统。 次级光谱经迁
移和标准化, 能够通过主光谱反演 模型进行有效
预测, 获得高性能分析结果。 本方法和系统的实
施在合理制备样品, 并合理将所制备的样品划分
为模型训练样品集和模型测试样品集的前提下,
分为光谱迁移和标准化模型训练阶段和模型测
试阶段, 包括光谱预处理、 正则化、 模型训练和测
试, 通过分块的多层神经网络, 构建主次设备形
态光谱间的迁移和标准化模型, 极大程度地消除
不同设备形态所产生光谱之间的差异, 提高多台
设备联用时主要光谱反演 模型的泛化性, 同一台
设备针对不同操作规范及老化的稳定性, 和同一
台设备使用不同条件 进行实验时的可比较性。
权利要求书4页 说明书12页 附图4页
CN 115436343 A
2022.12.06
CN 115436343 A
1.一种异源激光诱导击穿光谱之间的迁移和标准化方法, 其特征在于; 所述方法包括
模型训练阶段和模型测试阶段, 所述模型训练阶段包括如下步骤:
步骤S1: 制备样品, 将 样品划分为模型训练样品集和模型测试样品集;
步骤S2: 定义主 要设备形态和次要设备 形态;
步骤S3: 采集模型训练样品原始光谱, 使用主次设备形态进行实验, 分别 采集训练样品
集中所有样品的原 始主光谱和原 始次光谱;
步骤S4: 进行光谱预处理, 原始主次光谱进行数据预处理, 预处理步骤包括去基线、 归
一化和平均, 得到预处 理主次光谱;
步骤S5: 光谱分段正则化, 每一张预处理主、 次光谱等分成若干光谱段, 每一光谱段里
所有的主、 次光谱强度分别除以该段主、 次光谱集的极大值, 将每一光谱段的主、 次光谱强
度值转换到[0, 10]区间内;
步骤S6: 生成模型训练光谱对, 训练样品集中每一样品不同的正则化主、 次光谱之间进
行随机配对组合, 得到模型训练光谱 对;
步骤S7: 划分训练和验证光谱数据集, 将模型训练光谱对按照比例划分为训练光谱数
据集和验证光谱数据集;
步骤S8: 光谱迁移和标准化模型训练, 按照步骤S5的光谱等分段, 针对每一段光谱进行
建模, 将训练光谱数据集和验证光谱数据集输入网络, 通过轮换, 进行交叉验证, 逐步地将
该段内的每一训练光谱对的主、 次光谱之间的差异缩小, 进 行模型的优化和训练, 得到相应
的分段光谱迁移和标准化模型, 交叉验证结果给出分段模型定标性能; 各光谱段进行平行
或依次运算, 构建多模块分段模 型, 与光谱段一一对应; 分段模型的集合为整张光谱的迁移
和标准化模型; 分段模型定标性能进行平均, 得 出光谱迁移和标准 化模型定标性能;
所述模型测试阶段包括如下步骤:
步骤1: 采集模型测试样品原始光谱, 在步骤S1和S2的基础上, 使用主次设备形态进行
实验, 分别采集测试样品集中所有样品的原 始主光谱和原 始次光谱;
步骤2: 进行光谱预处理, 原始主次光谱进行数据预处理, 预处理步骤包括去基线、 归一
化和平均, 得到预处 理主次光谱;
步骤3: 光谱分段正则化, 每一张预处理次光谱等分成若干光谱段, 每一光谱段里所有
的次光谱强度分别除以该段次光谱集的极大值, 将每一光谱段的次光谱强度值转换到[0,
10]区间内;
步骤4: 光谱迁移和标准化, 正则化测试次光谱输入光谱迁移和标准化模型, 计算得测
试样品标准 化正则次光谱;
步骤5: 去正则化, 对测试样品标准化正则次光谱按照训练样品主光谱正则化参数进行
反运算, 去正则化, 产生测试样品标准 化次光谱;
步骤6: 模型预测性能评估, 测试样品标准化次光谱与同一测试样品预处理主光谱比
较, 给出模型预测性能; 用于表征将模型用于计算未知样品通过相同的次级设备形态所产
生的光谱, 并进行与测试样品相同的光谱预 处理和正则化/去正则化, 所获得的未知样品标
准化次光谱的性能。
2.根据权利要求1所述的异源激光诱导击穿光谱之间的迁移和标准化方法, 其特征在
于, 所述步骤S1中制备样品的个数依具体应用需求来定, 尤其是样品所含元素的浓度区间权 利 要 求 书 1/4 页
2
CN 115436343 A
2要与应用涉及待检测物质的元素浓度区间相符合; 样品表面物理特性能代表应用涉及待检
测物质的表面物理特性, 所述表面物理性质指粒度、 粗糙度、 光 吸收率、 硬度、 密度; 所述训
练样品集和测试样品集的划分可按样品数量比值, 训练样品集: 测试样品集=7: 3或8: 2; 所
述训练样品和测试样品划分随机进行, 但需保证训练样品集特性对测试样品集特性的包容
性和代表性;
包容性: 训练样品集样品基体的化学和物 理特性的分布包括测试样品集样品基体的化
学和物理特性; 训练样品集样品中待测元素的含量分布包括测试样品集样品中待测元素的
含量分布;
代表性: 测试样品集样品中待测元素的含量在训练样品集样品中待测元素的含量区间
均匀分布。
3.根据权利要求1所述的异源激光诱导击穿光谱之间的迁移和标准化方法, 其特征在
于, 所述步骤S2中所定义的设备形态包括设备生产厂家、 批次型号、 设备的使用参数和其老
化程度、 设备使用实验条件; 所定义的主要设备形态指一种特定的设备形态; 所定义的次要
设备形态至少包括 一种不同于主 要设备形态的特定设备 形态。
4.根据权利要求1所述的异源激光诱导击穿光谱之间的迁移和标准化方法, 其特征在
于, 所述步骤S3中, 每一个训练样品的预处 理主次光谱数在102量级。
5.根据权利要求1所述的异源激光诱导击穿光谱之间的迁移和标准化方法, 其特征在
于, 所述步骤S4中的去基线 是对每一张原始主、 次光谱进 行去基线和降噪声处理, 所需的操
作包括寻找谱线峰值位置、 谱峰还原、 谱峰去除后的基线拟合、 基线扣除; 所述归一化是对
每一张原始主、 次光谱的所有像素进行的归一化处理, 包括内标归一化、 总光谱强度归一
化、 激光脉冲能量归一化, 但 不局限于这些归一化方法; 去基线和归一化前后顺序根据数据
特性具体优化选定; 所述求平均是对原始主、 次光谱进行多张累加, 累加结果除以累加张
数。
6.根据权利要求1所述的异源激光诱导击穿光谱之间的迁移和标准化方法, 其特征在
于, 所述步骤S5中的每一段的光谱通道数在102量级。
7.根据权利要求1所述的异源激光诱导击穿光谱之间的迁移和标准化方法, 其特征在
于, 所述步骤S 6中每一模型训练光谱对包含来自同一样品的一张正则主光谱和一张正则次
光谱, 它们的配对随机进行; 一般来模型训练光谱 对数在104‑105量级。
8.根据权利要求1所述的异源激光诱导击穿光谱之间的迁移和标准化方法, 其特征在
于, 所述步骤S7中将全部的模型训练光谱对作为一个完整数据库, 将其划分为训练光谱数
据集和验证光谱 数据集, 其中的数据量比值为训练集: 验证集=7: 3或8: 2, 但 不局限于这些
值, 并且训练集和验证光谱数据集动态划分, 在模型训练过程中进行轮换, 进行交叉验证;
优化地训练光谱数据集和验证光谱数据集的划分根据样品来进行, 即一部 分样品的训练光
谱对全部划分为训练光谱数据集, 剩余样品的训练光谱 对则全部划分为验证光谱数据集。
9.根据权利要求1所述的异源激光诱导击穿光谱之间的迁移和标准化方法, 其特征在
于, 所述步骤S8中的分块的多层神经网络由多个全连接的多层反向传播神经网络或卷积神
经网络构成; 反向传播神经网络可调参数包括块的大小、 神经网络层数和激活函数的类型;
卷积神经网络可调参数包括卷积核大小、 卷积核 数量、 卷积网络层数和卷积层的具体种类;
模型训练属于监督训练, 输入信息单位为模型训练光谱对; 每一对里 的正则主光谱为训练权 利 要 求 书 2/4 页
3
CN 115436343 A
3
专利 异源激光诱导击穿光谱之间的迁移和标准化方法及系统
文档预览
中文文档
21 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 06:05:57上传分享