(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211322201.4
(22)申请日 2022.10.27
(71)申请人 深圳市大 数据研究院
地址 518000 广东省深圳市龙岗区龙城街
道龙翔大道 2001号道远楼 225室
(72)发明人 李灏峰 楼威 李冠彬 韩晓光
万翔
(74)专利代理 机构 深圳市恒和大知识产权代理
有限公司 4 4479
专利代理师 邹航
(51)Int.Cl.
G06T 7/11(2017.01)
G06T 7/187(2017.01)
G06T 7/194(2017.01)
G06V 20/69(2022.01)G06V 10/26(2022.01)
G06V 10/774(2022.01)
G06V 10/82(2022.01)
G06V 10/762(2022.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
一种低成本高效的细胞核图像分割方法
(57)摘要
本发明属于公开了一种低成本高效的细胞
核图像分割方法, 采集无标签病理图像数据, 通
过基于一致性的图像样本块选择算法, 筛选出少
量的小尺寸的病理图像样本块由病理医生进行
标注, 标注之后的掩膜和选择的样 本块组成样本
对, 作为有条件输入的基于单对训练图片的对抗
生成模型的训练样本, 经过模型训练, 生成大量
的伪样本对并加入分割训练集, 所有的标注的真
实样本对加上模型生成的伪样本对输入基于伪
标签的半监督细胞核分割模型进行训练, 得到能
够精准分割病理图像细胞核的模 型; 在尽可能减
少标注成本的前提下, 通过基于一致性的图像样
本块选择算法达 到和大量标注相当的分割性能。
权利要求书4页 说明书16页 附图10页
CN 115393378 A
2022.11.25
CN 115393378 A
1.一种低成本高效的细胞核图像分割方法, 其特 征在于: 包括有以下制作步骤:
S1, 采集原 始的病理图像数据集, 生成原 始病理图像;
S2, 将原始病理图像裁切为若干小尺寸的病理图像样本块,构成小尺寸样本块;
S3, 筛选出少量的小尺寸样本块, 由病理医生标注生成标注掩膜, 并将筛选出的少量的
小尺寸样本块定义 为标注样本块;
S4, 每一张标注掩膜和相对应的标注样本块组成标注样本对; 得到少量的标注样本对;
S5, 创建一个伪掩膜构造模块, 根据每一张标注掩膜生成大量的伪掩膜;
S6, 将每一对标注样本对作为初始输入条件, 分别创建一个有条件输入的基于单对训
练图片的对抗生成网络模型——即CSinGAN模型, 每个CSinGAN模型包含一个CSinGAN模型
生成器, 每 个CSinGAN模型生成器使用一对标注好的标注样本对;
S7, 将每张伪 掩膜作为CSinGAN模型生成器的输入条件, 生成与伪 掩膜相对应的伪病理
图片;
S8, 根据大量的伪掩膜训练CSinGAN模型生成器, 用CSinGAN模型生成器生成大量的伪
病理图片;
S9, 将每张伪病理图片与相对应的伪掩膜组成伪样本对;
S10, 将大量的伪样本对和标注样本对组成有标注分割训练集; 标注样本对为真实样本
对;
S11, 使用有标注分割训练集和大量的无标注病理图像对基于伪标签的半监督细胞核
分割模型进行训练, 得到能够精准分割 病理图像细胞核的模型。
2.根据权利要求1所述低成本高效的细胞核图像分割方法, 其特征在于: 所述步骤S3的
筛选出少量小尺寸样本块的操作中, 包括以下操作内容:
S31, 采样;
S32, 双层聚类;
S33, 分数计算: 计算每一个聚类簇中所有小尺寸样本块的代表性和内部一致性分数;
筛选出每个聚类簇中分数最小的一个小尺寸样本块。
3.根据权利要求2所述低成本高效的细胞核图像分割方法, 其特征在于: 所述步骤S31
中, 包括以下操作内容:
从原始病理图像利用滑动窗口均匀地采样大小为
的小尺寸样本块, 其中s为4的倍
数。
4.根据权利要求3所述低成本高效的细胞核图像分割方法, 其特征在于: 所述步骤S32
中, 将小尺寸样本块聚集成聚类簇, 按照小尺寸样本块与聚类簇中心的特征距离大小来选
择代表性样本块, 按照聚类簇内部各区域的小尺 寸样本块的纹理和细胞核 形态的相似程度
来选择内部一 致性样本块;
所述双层聚类共执 行两次K‑means聚类, 即k均值聚类算法。
5.根据权利要求4所述低成本高效的细胞核图像分割方法, 其特征在于: 所述步骤S32
的双层聚类操作步骤中包括以下操作内容:
S321, 第一次聚类为 粗聚类, 将小尺寸样本块聚类成
个聚类簇;
S322, 将每一个聚类簇中的每一个小尺寸样本块再裁切成四个子区域;
S323, 进行第二次聚类, 得到
个聚类簇, 即细聚类;权 利 要 求 书 1/4 页
2
CN 115393378 A
2S324, 经过两次聚类, 最终得到
个聚类簇 。
6.根据权利要求5所述低成本 高效的细胞核图像分割方法, 其特征在于: 每一 次聚类使
用的特征向量均为将 样本块或子区域输入Ima genet预训练的ResNet5 0模型得到的特 征。
7.根据权利要求6所述低成本高效的细胞核图像分割方法, 其特征在于: 所述步骤S33
中, 包括以下操作内容:
S3301, 将粗聚类得到 的每一个聚类簇定义为
, 每个聚类簇
中的每一个小尺寸样
本块定义 为
;
S3302, 将第
个聚类簇
中分数最小的一个小尺寸样本块定义为
;
个聚类簇
中筛选出
个
;
S3303, 计算聚类簇
聚类中心的特征向量, 即该聚类簇所有特征向量的均值, 定义为
;
S3304, 筛选出第二轮聚类――即细聚类中拥有最多的子区域数量的聚类簇, 将细聚类
中拥有子区域数量 最多的聚类簇 定义为
;
S3305, 计算聚类簇
的聚类中心c
;
S3306, 计算粗每一个小尺寸样本块
的代表性距离、 细代表性距离以及内部一致性距
离;
粗代表性距离为每一个小尺寸样本块
离其所属的粗分割聚类簇中心的距离;
细代表性距 离为每一个小尺寸样本块
的四个子区域与拥有的子区域数量最多的聚类
簇中心之间的距离之和
内部一致性距离为每一个小尺寸样本块
的任意两个子区域特 征距离的最大值;
S3307, 按照公式 (1) 计算每一个聚类簇中所有小尺寸样本块的代表性和内部一致性分
数;
其中
指的是特征提取器, 即预训练的ResNet50模型;
都是属于小尺寸样本
块
的一个子区域;
S3308, 筛选出分数最小的一个小尺寸样本块;
S3309, 对粗聚类的
个聚类簇筛选出
个小尺寸样本块, 即筛选出
个标注样本
块;
S3310, 针对
个标注样本块标注生成出
个标注掩膜, 得到
对标注样本对。
8.根据权利要求7 所述低成本高效的细胞核图像分割方法, 其特 征在于:
S6的模型训练操作步骤中, 包括以下内容:
S61,创建一个伪掩膜构造模块, 通过伪掩膜构造模块大量 生成伪掩膜;
S611, 标注掩膜为真实掩膜, 对每个真实掩膜进行多种数据扩增, 包括旋转、 裁剪、 翻转
操作, 得到一个扩充的细胞核掩膜集 合
;权 利 要 求 书 2/4 页
3
CN 115393378 A
3
专利 一种低成本高效的细胞核图像分割方法
文档预览
中文文档
31 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共31页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:24:10上传分享