(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211335432.9
(22)申请日 2022.10.28
(71)申请人 合肥工业大 学
地址 230009 安徽省合肥市包河区屯溪路
193号
(72)发明人 孙见山 李志强 姜元春 刘业政
袁昆 钱洋 柴一栋
(74)专利代理 机构 安徽省合肥新 安专利代理有
限责任公司 34101
专利代理师 陆丽莉 何梅生
(51)Int.Cl.
G06F 16/9535(2019.01)
G06F 16/2458(2019.01)
G06N 3/04(2006.01)
G06Q 50/00(2012.01)
(54)发明名称
一种问答社区中基 于模体的问题推荐方法
(57)摘要
本发明公开了一种 问答社区中基于模体的
问题推荐方法, 其步骤包括: 1、 采集数据并构建
问答社区网络; 2、 使用模体挖掘算法挖掘用户网
络中的模体, 并基于模体构建模体网络; 3、 使用
网络嵌入学习算法学习网络的节 点嵌入, 学习到
回答者对于提问者及问题的偏好; 4、 融合回答者
两方面的偏好, 利用评分函数预测回答者对于新
问题的匹配程度, 依据匹配分数将回答者降序排
列, 并给前N个用户推荐该问题进行回答, 从而完
成问题推荐任务。 本发明结合了模体挖掘算法和
模体网络的嵌入 学习算法, 利用图神经网络充分
捕捉了模体网络中的用户历史交互信息, 并充分
融合了用户个人特征信息、 网络结构信息和文本
语义信息, 从而实现了更准确的推荐效果。
权利要求书3页 说明书8页 附图1页
CN 115544373 A
2022.12.30
CN 115544373 A
1.一种问答社区中基于模体的问题推荐方法, 其特 征是按如下步骤进行:
步骤1、 采集问答社区中用户的互助关系、 问题文本和用户特征信息并进行预处理, 从
而建立问答社区的提问者集R={r1,r2,…,rm…,rM}、 回答者集A={a1,a2,…,ak,…,aK}、 问
题集Q={q1,q2,…,ql,…,qL}、 用户集U ={u1,u2,…,us,…,uS}, 且U=R∪A; 其中, rm表示第m
个提问者, ak表示第k个回答者, ql表示第l个问题, us表示第s个用户, M表示提问者总数, K表
示回答者总数, L表示问题总数, S表示用户总数, 且S≤ M+K;
步骤2、 建立问答社区中的问题 ‑回答者异构网络G1=(V1,E1,T)和用户同构网络G2=
(V2,E2), 其中, V1表示问题集Q与回答者集A所构成的节点集, 即V1=Q∪A, E1为问题节点与回
答者节点间相连的边集合, 若第k个回答者ak回答了第l个问题ql, 则建立第k个回答者ak节
点与第l个问题ql节点间的对应边(ql,ak); T为问题和回答者两种节点类型的集合, 且T=
{ta,tq}, ta表示节点类型为回答者节点, tq表示节点类型为问题节点; V2表示用户所构成的
节点集, 即V2=U, E2为用户集U中用户之间的有向边, 并由提问者节点指向回答 者节点;
步骤3、 初始化回答者在网络G1中的节点嵌入集合
其中,
表示回答者节点ak在网络G1中的节点嵌入; 初始化用户在网络G2中的节点嵌入集合
其中,
表示用户节点us在网络G2中的节点嵌入;
使用word2vec预训练模型将问题集Q转换为预训练向量, 并将预训练向量输入LSTM模
型得到问题文本嵌入集合
其中,
表示第l个问题ql的文本
嵌入;
步骤4、 分别使用基于元路径的异构信息网络嵌入学习算法和基于模体的图神经网络
嵌入学习算法学习G1,G2的节点嵌入;
步骤4.1、 基于元路径的异构信息网络嵌入学习算法的处 理:
步骤4.1.1、 利用式(1)计算从ta类型的节点a(i)转移到节点q(i+1)的转换概率p(q(i+1)∣ a
(i),P):
式(1)中, P为元路径, a(i)为元路径P中第i个ta类型的节点, q(i+1)为元路径P中第i+1个tq
类型的节点, Nq为节点a(i)的tq类型的邻居节点数量;
步骤4.1.2、 按照步骤4.1.1的过程得到从tq类型的节点q(i+1)转移到节点a(i+2)的转换概
率p(a(i+2)∣ q(i+1),P); 其中, a(i+2)为元路径P中第i+2个ta类型的节点;
步骤4.1.3、 通过负采样对元路径P进行处理, 并得到正样本集D和负样本集D', 从而利
用式(2)构建似然函数
并利用优化策略对似然函数
进行优化, 得到优
化后的参数集 合Θ1:
式(2)中, Θ为待优化的参数集合, 并包含四个部分: 提问者的所有嵌入、 回答者在G1中
的嵌入、 回答者在G2中的嵌入、 LSTM的参数;
表示在网络G1中以第l个问题ql为中心节点权 利 要 求 书 1/3 页
2
CN 115544373 A
2的嵌入,
为在网络G1中的中心节点的相邻节点的嵌入, σ 表示Sigmoid函数, 所述优化策
略为使正样本集D似然最大化, 负 样本集D'似然最小化;
基于优化后的参数集合Θ1, 利用基于元路径的异构信息网络嵌入学习算法对VQ,VA进
行处理, 从而得到更新后的问题文本嵌入集合
及更新后回答
者嵌入集合
其中,
表示在网络G1中第l个问题ql的节点嵌
入,
表示在网络G1中第k个回答 者ak的节点嵌入;
步骤4.2、 基于模体的图神经网络嵌入学习算法的处 理:
步骤4.2.1、 使用模体挖掘算法ESU挖掘用户同构网络G2中的模体, 得到网络G2中的模体
集合M={m0,m1,…,mj…,mJ‑1}, 其中, mj表示第j个模体; J表示模体的总数;
基于模体集 合M, 利用式(3)生成模体网络:
式(3)中,
为基于模体mj生成的模体网络, 并用相邻矩阵来表示; y,z分别表示相邻
矩阵
中的行数和列数;
步骤4.2.2、 利用式(4)构建损失函数
式(4)中,
为基于模体网络
生成的节点嵌入,
是us的相邻节点,
为基于模
体网络
生成的us的相邻节点的嵌入, Pn是负采样的概率分布, Pn(c)为节点
的概率分
布,
表示服从Pn(c)概率分布的节点
的期望, Q是负样本数目,
表示相邻矩阵转
置, σ 表示Sigmo id函数;
基于优化后的参数集合Θ2, 利用基于模体的图神 经网络嵌入学习算法对WU进行处理,
从而得到更新后的用户嵌入集合
其中,
为用户节点us在
模体网络
中的节点嵌入;
步骤4.2.3、 利用式(5)合并基于J个模体网络的用户节点嵌入, 从而得到合并后的用户
嵌入集合
式(5)中, αj为对应第 j个模体网络
的节点嵌入的权重;
表示合并后得到的用户us
的用户嵌入;
区分用户嵌入集合WU中的提问者和回答者, 从而得到网络 G2中的提问者嵌入集合
权 利 要 求 书 2/3 页
3
CN 115544373 A
3
专利 一种问答社区中基于模体的问题推荐方法
文档预览
中文文档
13 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:24:09上传分享