国家标准网
文库搜索
切换导航
首页
频道
仅15元无限下载
联系我们
首页
仅15元无限下载
联系我们
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211503117.2 (22)申请日 2022.11.29 (71)申请人 浙江大学 地址 310058 浙江省杭州市西湖区余杭塘 路866号 (72)发明人 陈培 张杨康 李泽健 孙凌云 (74)专利代理 机构 杭州天勤知识产权代理有限 公司 33224 专利代理师 胡红娟 (51)Int.Cl. G06V 10/774(2022.01) G06V 10/82(2022.01) G06V 10/44(2022.01) G06N 3/08(2006.01) G06N 3/04(2006.01) (54)发明名称 一种基于图神经网络的图像生成方法 (57)摘要 本发明公开了一种基于图神经网络的图像 生成方法, 包括通过图像特征节 点集合和对应的 场景拓扑图构建超图, 在超图上构建一个图神经 网络来同时学习场景拓扑图中的语义特征以及 图像的潜在特征; 通过四种在图神经网络上的消 息传递方式来模拟真实场景中的物体交互, 将基 于全局消息传递方式和局部消息传递方式更新 得到的图像特征集合依次输入全连接层和归一 化指数函数得到生成图像编码; 基于训练样本集 对训练网络模 型进行训练, 通过生成图像编码和 真实图像编码采用损失函数训练训练网络模型 得到图神经网络模型; 该方法能够高效的生成具 有较高视觉质量和较为正确物体之间关系的图 像。 权利要求书4页 说明书9页 附图2页 CN 115546589 A 2022.12.30 CN 115546589 A 1.一种基于图神经网络的图像生成方法, 其特 征在于, 包括: (1) 获得多张真实图像, 基于所述真实图像 中的物体构建场景拓扑图, 将真实图像输入 VQGAN系统得到真实图像编码和图像特征节点集合, 通过图像特征节点集合和对应的场景 拓扑图构建超图, 多个超图构建训练样本集; (2) 构建训练网络模型, 所述训练网络模型包括消息传递函数、 注意力机制单元、 全连 接层和归一 化指数函数, 其中: 场景拓扑图上的语义特征消息传递方式: 在场景拓扑图中, 通过消息传递函数将场景 拓扑图节点的每个邻居节点的语义特征和连边特征进 行融合得到第一邻居节点消息, 将 每 个第一邻居节点消息通过注意力机制单元进 行聚合, 将聚合结果作为更新的场景拓扑图节 点语义特 征; 全局消息传递方式: 当图像特征节点的邻居节点为场景拓扑图节点时, 采用回归网络 方法基于场景拓扑图的每个节点构建矩形框, 矩形框内为物体的图像特征节点, 场景拓扑 图的每个节点指向对应矩形框, 通过消息传递函数将更新的场景拓扑图节点语义特征与对 应的矩形框连接的全局连边特征进行融合, 将融合结果通过注意力机制得到的聚合特征作 为采用全局 消息传递方式更新的图像特 征; 局部消息传递方式: 当图像特征节点的邻居节点在当前矩形框内或其他矩形框内时, 通过消息传递函数将矩形框内图像特征节点的邻居节点的图像特征和相 应连边特征进行 融合得到第二邻居节点信息, 将每个第二邻居节点信息通过注意力机制单元进行聚合, 将 聚合结果作为采用局部消息传递方式更新的图像特 征; 将基于全局消息传递方式和局部消息传递方式更新得到的图像特征集合依次输入全 连接层和归一 化指数函数 得到生成图像编码; (3) 基于训练样本集对训练网络模型进行训练, 通过生成图像编码和真实图像编码采 用损失函数训练训练网络模型 得到图神经网络模型; (4) 应用时, 将场景拓扑图输入至图神经网络模型中得到生成图像编码, 将生成图像编 码输入至VQGAN系统的解码器生成图像。 2.根据权利要求1所述的基于图神经网络的图像生成方法, 其特征在于, 将真实图像输 入VQGAN系统得到真实图像编码, 包括: 先将真实图像通过VQGAN系 统的编码器得到初始潜在向量组合, 基于距离最近原理将 初始潜在向量组合中的初始潜在向量与向量字典进行比对得到潜在向量组合, 潜在向量组 合的下标为真实图像编码, 其中: 所述潜在向量 为: 其中, 为初始潜在向量组合, q( ﹒ ) 为距离最近函数, zk为向量字典中的第 k个向量, n为向量的维度, h和w分别为潜在向量的高度和宽度。 3.根据权利要求1所述的基于图神经网络的图像生成方法, 其特征在于, 所述基于所述 真实图像中的物体构建的场景拓扑图, 场景拓扑图节点表示真实 图像中的物体, 连边表示 物体之间的关系, 场景拓扑图由元 祖 组成, 其中: 场景拓扑图节点的集 合O为:权 利 要 求 书 1/4 页 2 CN 115546589 A 2其中, oi为第i个场景拓扑图节点, N为场景拓扑图节点的个数, 为一组物体 类别; 场景拓扑图连边的集合 , 为一组关系类别, 每条边表示为 , 为 的第 个邻居节点, , 为由第i个场景拓扑图节点指向第 个场景拓扑图 节点的连边。 4.根据权利要求1所述的基于图神经网络的图像生成方法, 其特征在于, 将场景拓扑图 输入嵌入层网络中得到场景拓扑图节点的语义特 征和连边特 征。 5.根据权利要求3所述的基于图神经网络的图像生成方法, 其特征在于, 通过消息传递 函数将场景拓扑图节点的每个邻居节点语义特征和连边特征进行融合得到第一邻居节点 消息 为: 其中, 为第 个邻居节点语义 特征, 为连边特征, 为场景拓扑图内信息传递 参数矩阵, ,D1为邻居节点的语义特 征的维度, D2为连边特 征的维度。 6.根据权利要求3所述的基于图神经网络的图像生成方法, 其特征在于, 通过融合结果 更新图像特 征节点对应的图像特 征 为: 其中, 为节点特征 vi的邻居节点集合, 为归一化后的节点 到节点 的注意力 系数, W1和W2分别为参数矩阵, GeLU为激活函数。 7.根据权利要求1所述的基于图神经网络的图像生成方法, 其特征在于, 基于全局消息 传递方式更新得到的图像特 征 为: 其中, 为第i已更新的语义节点特征 传递给第 j个图像节点特征 的消息, rg为第g个全局连边类型, 为全局连边类型的参数矩阵, 为全局连边特征, 为第i个 已更新的语义节点特征 到图像节点特征 的注意力系数, W1和W2分别为参数矩阵, 权 利 要 求 书 2/4 页 3 CN 115546589 A 3
专利 一种基于图神经网络的图像生成方法
文档预览
中文文档
16 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 SC 于
2024-02-18 22:23:42
上传分享
举报
下载
原文档
(970.3 KB)
分享
友情链接
DB44-T 983-2012 水泥回转窑节能评价方法 广东省.pdf
GB-T 34653-2017 全断面隧道掘进机 单护盾岩石隧道掘进机.pdf
GB-T 17903.1-2024 信息技术 安全技术 抗抵赖 第1部分:概述.pdf
T-CAAMM 23—2018 自走式喷杆喷雾机 技术条件.pdf
GB-T 38329.3-2023 港口船岸连接 第3部分:低压岸电连接(LVSC)系统 一般要求.pdf
GB-T 41704-2022 锂离子电池正极材料检测方法 磁性异物含量和残余碱含量的测定.pdf
GB-T 1311-2008 直流电机试验方法.pdf
SY-T 6643-2021 陆上多波多分量地震资料采集技术规程.pdf
思度安全-DSMM-019 数据安全事件应急管理规范V1.0.pdf
DB21-T 1799.3—2019 信息技术 信息服务管理规范 第3部分:IT系统运维 辽宁省.pdf
T-CASME 661—2023 绿色建筑节能设计技术文件编制规范.pdf
GB-T 41085-2021 城乡社区环卫清洁服务要求.pdf
GB 42296-2022 电动自行车用充电器安全技术要求.pdf
GB-T 17901.3-2021 信息技术 安全技术 密钥管理 第3部分:采用非对称技术的机制.pdf
GB-T 40653-2021 信息安全技术 安全处理器技术要求.pdf
T-CAS 600—2022 经营者公平竞争合规管理体系建设.pdf
GB-T 15843.4-2024 信息技术 安全技术 实体鉴别 第4部分:采用密码校验函数的机制.pdf
GB-T 42453-2023 信息安全技术 网络安全态势感知通用技术要求.pdf
斯元商业咨询 网络安全科技供应链报告:厂商成分分析及国产化替代指南 2022.pdf
T-FSAS 58—2022 基于互联网的可信数字身份服务技术要求.pdf
1
/
16
评价文档
赞助2.5元 点击下载(970.3 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
点击进入官方售后微信群
支付 完成后 如未跳转 点击这里下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。