(19)中华 人民共和国 国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202111596703.1
(22)申请日 2021.12.24
(71)申请人 北京航空航天大 学
地址 100191 北京市海淀区学院路37号
(72)发明人 钱诚 李文娟 任羿 孙博
王自力
(51)Int.Cl.
G06F 30/20(2020.01)
G06F 17/18(2006.01)
(54)发明名称
一种删失数据下的参数概率不确定性建模
方法
(57)摘要
本发明提供一种删失数据下的参数概率不
确定性建模 方法, 其主要 步骤如下: (1)获取产品
参数的观测样本, 选取其分散性相对应的概率分
布类型; (2)基于Bootstrap方法开展原始数据的
有放回重抽样, 并分别采用EM方法开展极大似然
估计以构建初始概率分布模型; (3)基于各个初
始概率分布模 型建立删失数据的条件概率分布,
并开展随机采样来替代删失数据以构建完整数
据集; (4)针对完整数据集分别开展极大似然估
计以构建备选概率分布模型; (5)从备选概率分
布模型中遴选具有最大信息熵的概率分布模型
作为原始数据的不确定性表征模 型。 本发明为包
含删失数据的观测数据样本提供了一种简便、 有
效的概率不确定性 量化度量方法。
权利要求书3页 说明书10页 附图2页
CN 114254516 A
2022.03.29
CN 114254516 A
1.一种删失数据下的参数概 率不确定性建模方法, 其特 征在于包括以下步骤:
步骤1: 获取产品参数的观测样本, 确定观测样本的删失数据信息, 并选取与该参数分
散性特征相对应的概 率分布类型;
步骤2: 基于Bootstrap方法开展观测数据的m次有放回的重抽样操作, 并分别采用EM方
法开展极大似然估计, 构建出m个初始概 率分布模型;
步骤3: 基于由步骤2构建的各个初始概率分布模型建立删失数据的条件概率分布, 并
开展随机采样来 替代删失数据以构建 m条完整数据集;
步骤4: 针对由步骤3得到的m条完整数据集分别开展极大似然估计, 构建备选概率分布
模型;
步骤5: 计算m个备选概率分布模型的信息熵, 遴选出具有最大信息熵 的备选概率分布
模型做为观测样本的概 率不确定性表征模型;
本发明根据上述步骤, 为包含删失数据的观测数据样本提供了一种简便、 有效的概率
不确定性 量化度量方法。
2.如权利要求1所述的一种删失数据 下的参数概率不确定性建模方法, 其特征在于: 所
述步骤2中的基于Bootstr ap方法开展观测数据的m次有放回的重抽样操作, 并分别采用EM
方法开展极大似然估计, 用于构建 m个初始概 率分布模型, 主 要包括以下内容:
所述步骤2进一 步包括以下步骤:
步骤21: 假设观测数据共有N个样本, 其中包含r个被完全观测到的样本, 将所述被完全
观测的样本按照从小到大的顺序排列为顺序统计量, 并标记为
对于左
删失数据而言, 其余N ‑r个未被完全观测的样 本(即删失样 本)取值均小于于
将该N‑r个
样本的顺序统计量表示为
对于右删失数据而言, 其余N ‑r个
未被完全观测的样本(即删失样本)取值均大于
将该N‑r个样本的顺序统计量表示为
步骤22: 对于左删失数据而言, 通过把
的概率放置在
各
点上, 构建样本的经验累积概率分布
对于右删 失数据而言, 通过把
的概率放置在
各点上, 构建样本的经验累积概 率分布
步骤23: 从上述经验概率分布函数
中有放回地抽取一个样本量为N的简单随机样
本并表示 为“重取样本 ”X*;
步骤24: 采用E M方法估计 “重取样本 ”X*的概率分布参数θ 的取值, 并标记为
步骤25: 重复步骤23及步骤24共m次, 分别得到概率分布参数的估计 值
用于
构建m个初始概 率分布模型。
3.如权利要求1所述的一种删失数据 下的参数概率不确定性建模方法, 其特征在于: 基
于由步骤2构建的各个初始概率分布模型建立删失数据的条件概率分布, 并开展随机采样权 利 要 求 书 1/3 页
2
CN 114254516 A
2来替代删失数据以构建m条完整数据集, 主要包括以下内容: 所述步骤3进一步包括以下步
骤:
步骤31: 计算样本发生删失的概 率;
对于左删失数据而言, 样本取值小于
的概率如式(1)所示; 对于右删失数据而言, 样
本取值大于
的概率如式(2)所示;
其中,
表示第i组分布参数;
表示在第i组分布参数下所选概率分布类型的概
率密度函数; Pi,i=1,2,…,m表示在第i组分布参数 下样本发生删失的概 率;
步骤32: 建立删失样本的条件概 率分布;
对于左删失数据而言, 删失样本的条件概 率分布 π(x ′)可以表示 为式(3)所示:
其中,
为指示函数, 即:
对于右删失数据而言, 删失样本的条件概 率分布 π(x ′)可以表示 为式(4)所示:
其中,
为指示函数, 即:
步骤33: 基于条件概 率分布开展随机采样以构建完整数据集;
基于由步骤32获得的条件概率分布π(x ′), 随机采样生成N ‑r个样本{x ′(1),…,x′(N‑r)};
对于左删失数据而言, 将该N ‑r个样本与r个被完全观测的样本
构成完整数
据集
对于右删失数据而言, 将该N ‑r个样本与r 个被完全观测的样
本
构成完整数据集
步骤34: 重复步骤31至步骤3 3, 直至基于各个初始概 率分布各构建一组完整数据集。
4.如权利要求1所述的一种删失数据 下的参数概率不确定性建模方法, 其特征在于: 所
述步骤4中的针对m条完整数据集分别开展极大似然估计以构建备选概率分布模 型, 主要包
括以下内容:权 利 要 求 书 2/3 页
3
CN 114254516 A
3
专利 一种删失数据下的参数概率不确定性建模方法
文档预览
中文文档
16 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-19 01:50:21上传分享