说明:收录25万 73个行业的国家标准 支持批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111596703.1 (22)申请日 2021.12.24 (71)申请人 北京航空航天大 学 地址 100191 北京市海淀区学院路37号 (72)发明人 钱诚 李文娟 任羿 孙博  王自力  (51)Int.Cl. G06F 30/20(2020.01) G06F 17/18(2006.01) (54)发明名称 一种删失数据下的参数概率不确定性建模 方法 (57)摘要 本发明提供一种删失数据下的参数概率不 确定性建模 方法, 其主要 步骤如下: (1)获取产品 参数的观测样本, 选取其分散性相对应的概率分 布类型; (2)基于Bootstrap方法开展原始数据的 有放回重抽样, 并分别采用EM方法开展极大似然 估计以构建初始概率分布模型; (3)基于各个初 始概率分布模 型建立删失数据的条件概率分布, 并开展随机采样来替代删失数据以构建完整数 据集; (4)针对完整数据集分别开展极大似然估 计以构建备选概率分布模型; (5)从备选概率分 布模型中遴选具有最大信息熵的概率分布模型 作为原始数据的不确定性表征模 型。 本发明为包 含删失数据的观测数据样本提供了一种简便、 有 效的概率不确定性 量化度量方法。 权利要求书3页 说明书10页 附图2页 CN 114254516 A 2022.03.29 CN 114254516 A 1.一种删失数据下的参数概 率不确定性建模方法, 其特 征在于包括以下步骤: 步骤1: 获取产品参数的观测样本, 确定观测样本的删失数据信息, 并选取与该参数分 散性特征相对应的概 率分布类型; 步骤2: 基于Bootstrap方法开展观测数据的m次有放回的重抽样操作, 并分别采用EM方 法开展极大似然估计, 构建出m个初始概 率分布模型; 步骤3: 基于由步骤2构建的各个初始概率分布模型建立删失数据的条件概率分布, 并 开展随机采样来 替代删失数据以构建 m条完整数据集; 步骤4: 针对由步骤3得到的m条完整数据集分别开展极大似然估计, 构建备选概率分布 模型; 步骤5: 计算m个备选概率分布模型的信息熵, 遴选出具有最大信息熵 的备选概率分布 模型做为观测样本的概 率不确定性表征模型; 本发明根据上述步骤, 为包含删失数据的观测数据样本提供了一种简便、 有效的概率 不确定性 量化度量方法。 2.如权利要求1所述的一种删失数据 下的参数概率不确定性建模方法, 其特征在于: 所 述步骤2中的基于Bootstr ap方法开展观测数据的m次有放回的重抽样操作, 并分别采用EM 方法开展极大似然估计, 用于构建 m个初始概 率分布模型, 主 要包括以下内容: 所述步骤2进一 步包括以下步骤: 步骤21: 假设观测数据共有N个样本, 其中包含r个被完全观测到的样本, 将所述被完全 观测的样本按照从小到大的顺序排列为顺序统计量, 并标记为 对于左 删失数据而言, 其余N ‑r个未被完全观测的样 本(即删失样 本)取值均小于于 将该N‑r个 样本的顺序统计量表示为 对于右删失数据而言, 其余N ‑r个 未被完全观测的样本(即删失样本)取值均大于 将该N‑r个样本的顺序统计量表示为 步骤22: 对于左删失数据而言, 通过把 的概率放置在 各 点上, 构建样本的经验累积概率分布 对于右删 失数据而言, 通过把 的概率放置在 各点上, 构建样本的经验累积概 率分布 步骤23: 从上述经验概率分布函数 中有放回地抽取一个样本量为N的简单随机样 本并表示 为“重取样本 ”X*; 步骤24: 采用E M方法估计 “重取样本 ”X*的概率分布参数θ 的取值, 并标记为 步骤25: 重复步骤23及步骤24共m次, 分别得到概率分布参数的估计 值 用于 构建m个初始概 率分布模型。 3.如权利要求1所述的一种删失数据 下的参数概率不确定性建模方法, 其特征在于: 基 于由步骤2构建的各个初始概率分布模型建立删失数据的条件概率分布, 并开展随机采样权 利 要 求 书 1/3 页 2 CN 114254516 A 2来替代删失数据以构建m条完整数据集, 主要包括以下内容: 所述步骤3进一步包括以下步 骤: 步骤31: 计算样本发生删失的概 率; 对于左删失数据而言, 样本取值小于 的概率如式(1)所示; 对于右删失数据而言, 样 本取值大于 的概率如式(2)所示; 其中, 表示第i组分布参数; 表示在第i组分布参数下所选概率分布类型的概 率密度函数; Pi,i=1,2,…,m表示在第i组分布参数 下样本发生删失的概 率; 步骤32: 建立删失样本的条件概 率分布; 对于左删失数据而言, 删失样本的条件概 率分布 π(x ′)可以表示 为式(3)所示: 其中, 为指示函数, 即: 对于右删失数据而言, 删失样本的条件概 率分布 π(x ′)可以表示 为式(4)所示: 其中, 为指示函数, 即: 步骤33: 基于条件概 率分布开展随机采样以构建完整数据集; 基于由步骤32获得的条件概率分布π(x ′), 随机采样生成N ‑r个样本{x ′(1),…,x′(N‑r)}; 对于左删失数据而言, 将该N ‑r个样本与r个被完全观测的样本 构成完整数 据集 对于右删失数据而言, 将该N ‑r个样本与r 个被完全观测的样 本 构成完整数据集 步骤34: 重复步骤31至步骤3 3, 直至基于各个初始概 率分布各构建一组完整数据集。 4.如权利要求1所述的一种删失数据 下的参数概率不确定性建模方法, 其特征在于: 所 述步骤4中的针对m条完整数据集分别开展极大似然估计以构建备选概率分布模 型, 主要包 括以下内容:权 利 要 求 书 2/3 页 3 CN 114254516 A 3

.PDF文档 专利 一种删失数据下的参数概率不确定性建模方法

文档预览
中文文档 16 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种删失数据下的参数概率不确定性建模方法 第 1 页 专利 一种删失数据下的参数概率不确定性建模方法 第 2 页 专利 一种删失数据下的参数概率不确定性建模方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-19 01:50:21上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。