(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211279895.8
(22)申请日 2022.10.19
(71)申请人 重庆大学
地址 400030 重庆市沙坪坝区沙正 街174号
(72)发明人 陈小杰 邢永康
(74)专利代理 机构 重庆双马智翔专利代理事务
所(普通合伙) 50241
专利代理师 顾晓玲
(51)Int.Cl.
G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
不平衡图节点分类自适应加权方法及系统
(57)摘要
本发明属于图节 点分类技术领域, 具体公开
了一种不平衡图节点分类自适应加权方法及系
统, 该方法提取多个原始图数据的节点集合、 边
集合、 图的邻接矩阵和图的特征矩阵, 利用双层
图卷积神经网络, 构建图节点分类器; 划分原始
图数据的节点, 计算原始图数据的节点不平衡
率; 构建自适应样本权重学习网络, 对节点不平
衡的原始 图数据的节点集合内每个节点的损失
施加权重; 基于元学习, 使用节点平衡的原始图
数据更新自适应样本权重学习网络内的参数, 得
到自适应样 本权重学习网络的最优参数, 优化图
节点分类器并进行不平衡图节 点分类。 采用本技
术方案, 基于元学习思想, 通过少量无偏元数据
的引导, 弥补分类器对少数节点表示能力的不
足, 从而提高分类能力。
权利要求书3页 说明书9页 附图1页
CN 115545163 A
2022.12.30
CN 115545163 A
1.一种不平衡图节点分类自适应加权方法, 其特 征在于, 包括如下步骤:
获取多个原始图数据, 并提取多个原始图数据中对应的节点集合、 边集合、 图的邻 接矩
阵和图的特 征矩阵;
根据图的邻接矩阵和图的特 征矩阵, 并利用双 层图卷积神经网络, 构建图节点分类 器;
将多个原始图数据对应的节点集合、 边集合输入图节点分类器, 将原始图数据的节点
划分为两类: 多数类节点和少数类节点, 并计算多个原 始图数据分别对应的节点 不平衡率;
构建自适应样本权重学习网络, 对节点不平衡的原始图数据的节点集合内每个节点的
损失施加权 重;
基于元学习, 使用节点平衡的原始图数据对自适应样本权重学习网络 内的参数进行更
新, 得到自适应样本 权重学习网络的最优参数;
利用自适应样本权重学习 网络的最优参数, 训练图节点分类器, 得到优化的图节点分
类器并进行不平衡图节点分类。
2.如权利要求1所述的不平衡图节点分类自适应加权方法, 其特征在于, 利用图卷积神
经网络, 构建图节点分类 器的方法如下:
获取原始图数据
其中V={v1,v2,…,vi,…,vn}为图中节 点集合, vi表
示第i个节点;
为边的集合; A={a1,1, a2,2,…,ai,j, an,n},
为图的邻接矩阵,
表示邻接矩阵的节点数量为n、 维度为n, ai,j表示节点vi
与节点vj之间边的权重; X={x1,x2,…,xi,…,xn},
为图的特征矩阵,
表示
特征矩阵的节点数量 为n、 维度为d,
表示节点vi所对应的特 征向量;
利用双层图卷积神经网络, 构建图节点分类 器:
其中,
为添加节点自链接后的邻接矩阵,
是添加自连接与标准化
后的邻接矩阵, f表示采用了softmax函数 的分类器, Z为分类结果; 而
为其所对应的节点
度矩阵,
将图节点d维特征向量映射到h维的隐藏空间中去;
为隐藏层到 输出层的权 重矩阵, 其中c为图中节点类别数量。
3.如权利要求1所述的不平衡图节点分类自适应加权方法, 其特征在于, 原始图数据的
节点不平衡率计算如下: 利用少数类节点数量min占节点总 量total比例ρ 来描述图中的节
点不平衡水平:
ρ 越小则图中节点 不平衡程度越高。
4.如权利要求1所述的不平衡图节点分类自适应加权方法, 其特征在于, 构建 自适应样
本权重学习网络, 对节点不平衡的原始图数据的节点集合内每个节点的损失施加权重的方
法如下:
令节点不平衡的原始图数据集合为
为集合V*中的第i个节点,
为集合V*中的i个节点的类别, N 为集合V*中节点的总量;权 利 要 求 书 1/3 页
2
CN 115545163 A
2设置f(v,w)为图节点分类 器, v表示图节点, w 为图节点分类 器参数;
通过最小化损失函数
计算图节点分类器最佳参数w*, 记
l为损失函数:
针对非平衡原始图数据, 通过对第i个节点vi的损失施加权重
提升
模型的对非平衡训练数据的鲁棒 性;
记E(l; θ )为自适应样本权重学习网络, θ为自适应样本权重学习网络的参数, 自适应样
本权重学习网络的输入为节点在分类 器中的损失向量, 其输出为该节点的权 重。
5.如权利要求4所述的不平衡图节点分类自适应加权方法, 其特征在于, 计算自适应样
本权重学习网络的最优参数的方法如下:
随 机 提 取 部 分 节 点 平 衡 的 原 始 图 数 据 作 用 无 偏 元 数 据 集 合
为集合Vmeta中第i个节点,
为集合Vmeta中第i个节点的
类别, K为节点 集合Vmeta中节点的总量, K< <N;
E(l; θ )为自适应样本权重学习网络, l为损失函数, θ为自适应样本权重学习网络的参
数, 采用元 学习的方式对参数θ进行 学习, 得到自适应样本 权重学习网络的最优参数θ*:
其中,
表示元数据上的损失。
6.如权利要求5所述的不平衡图节点分类自适应加权方法, 其特征在于, 训练图节点分
类器, 得到优化的图节点分类 器的方法如下:
S1, 对图节点分类 器的每一次训练迭代, 公式描述 为:
其中,
为参数矩阵, (t)表示迭代次数, α 为图节点分类器学习率, t表示迭代次
数, w(t)表示第t次迭代的图节点分类 器参数;
S2, 对自适应样本 权重学习网络的参数θ进行 更新:
其中, β 为权 重学习网络的学习率, θ(t)表示自适应样本 权重学习网络的参数;
重复步骤S1 ‑S25‑10次, 执行步骤S3;
S3, 使用自适应样本 权重学习网络的输出参数θ, 更新 参数w:权 利 要 求 书 2/3 页
3
CN 115545163 A
3
专利 不平衡图节点分类自适应加权方法及系统
文档预览
中文文档
14 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:24:28上传分享