(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211272908.9
(22)申请日 2022.10.18
(71)申请人 中国银行股份有限公司
地址 100818 北京市西城区复兴门内大街1
号
(72)发明人 童楚婕
(74)专利代理 机构 北京三友知识产权代理有限
公司 11127
专利代理师 李艳艳
(51)Int.Cl.
G06K 9/62(2022.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
用户留存预测方法及装置
(57)摘要
本发明公开了一种用户留存预测方法及装
置, 涉及人工智能技术领域, 其中该方法包括: 获
取用户数据; 所述用户数据包括用户个人数据、
用户登录数据、 用户交易数据; 根据用户数据生
成用户登录行为序列、 用户交易行为序列和衍生
特征数据; 所述衍生特征数据包括根据用户登录
数据确定的用户特征数据; 将用户个人数据、 衍
生特征数据输入融合树模型, 输出用户在未来预
设天数内的每一天是否会登录的判断结果; 所述
融合树模型对多种决策树模型融合训练得到; 将
用户个人数据、 用户登录行为序列、 用户交易行
为序列、 衍生特征数据和所述判断结果输入时间
序列模型, 输出用户在未来预设天数内的每一天
登录的概率值。 本发明可以提高用户留存预测的
准确度。
权利要求书4页 说明书9页 附图4页
CN 115510995 A
2022.12.23
CN 115510995 A
1.一种用户留存预测方法, 其特 征在于, 包括:
获取用户数据; 所述用户数据包括用户个人 数据、 用户登录数据、 用户交易数据;
根据用户数据生成用户登录行为序列、 用户交易行为序列和衍生特征数据; 所述衍生
特征数据包括 根据用户登录数据确定的用户特 征数据;
将用户个人数据、 衍生特征数据输入融合树模型, 输出用户在未来预设天数内的每一
天是否会登录的判断结果; 所述融合树模型根据历史用户个人数据、 历史衍生特征数据和
历史用户在历史预设天数内的每一天是否登录的实际结果对多种决策树模型融合训练得
到;
将用户个人数据、 用户登录行为序列、 用户交易行为序列、 衍生特征数据和所述判断结
果输入时间序列模型, 输出用户在未来预设天数内的每一天登录的概率值; 所述时间序列
模型根据历史用户登录行为序列、 历史用户交易行为序列、 历史用户在历史预设天数内的
每一天是否登录的实际结果和历史用户在历史预设天数内的每一天登录的概率值对卷积
神经网络 CNN模型训练得到 。
2.如权利要求1所述的方法, 其特征在于, 所述用户登录数据包括如下之一或任意组
合:
用户登录时间;
用户登录次数;
用户登录方式。
3.如权利要求1所述的方法, 其特征在于, 所述衍生特征数据包括如下之一或任意组
合:
用户历史登录总次数;
用户过去预设天数内的登录总次数;
用户过去最近一次登录和计算日期当天的时间差;
用户历史登录历史;
计算日期当天用户是否登录过。
4.如权利要求1所述的方法, 其特征在于, 将用户登录行为序列、 用户交易行为序列和
所述判断结果输入时间序列模型, 输出用户在未来预设天数内的每一天登录的概率值, 包
括:
将用户登录行为序列、 用户交易行为序列在时间序列模型中经过两层卷积层、 两层池
化层计算后, 输出第一结果;
将第一结果和用户个人 数据、 衍生特征数据进行合并, 输出第二结果;
将第二结果和所述判断结果输入激活层, 输出用户在未来预设天数内的每一天登录的
概率值;
其中, 时间序列模型包括两层卷积层、 两层池化层和激活层。
5.如权利要求2所述的方法, 其特 征在于, 所述时间序列模型按如下 方式训练得到:
收集历史用户数据;
从历史用户数据中抽样选取用户登录时间不 一致的用户数据;
根据抽样选取的用户登录时间不一致的用户数据, 获取对应的历史用户登录行为序
列、 历史用户交易行为序列、 历史用户在历史未来预设天数内的每一天是否登录的实际结权 利 要 求 书 1/4 页
2
CN 115510995 A
2果和历史用户在历史预设天数内的每一天登录的概 率值, 构建训练集和 测试集;
搭建CNN模型, 利用训练集对CNN模型进行训练, 得到时间序列模型; 利用测试集对时间
序列模型进行测试。
6.如权利要求5所述的方法, 其特征在于, 根据抽样选取的用户登录时间不一致的用户
数据, 获取对应的历史用户登录行为序列、 历史用户交易行为序列、 历史用户在历史未来预
设天数内的每一天是否登录的实际结果和历史用户在历史预设天数内的每一天登录的概
率值, 构建训练集和 测试集, 包括:
根据抽样选取的用户登录时间不一致的用户数据, 再次抽 样选取第 一预设比例的用户
未登录或用户未交易的用户数据, 获取对应的历史用户登录行为序列、 历史用户交易行为
序列、 历史用户在历史未来预设天数内的每一天是否登录的实际结果和历史用户在历史预
设天数内的每一天登录的概 率值, 构建训练集;
根据抽样选取的用户登录时间不一致的用户数据, 再次抽 样选取第 二预设比例的用户
未登录或用户未交易的用户数据, 获取对应的历史用户登录行为序列、 历史用户交易行为
序列、 历史用户在历史未来预设天数内的每一天是否登录的实际结果和历史用户在历史预
设天数内的每一天登录的概 率值, 构建测试集;
其中, 第一预设比例大于第二预设比例。
7.如权利要求1所述的方法, 其特征在于, 在将用户个人数据、 衍生特征数据输入融合
树模型, 输出用户在未来预设天数内的每一天是否会登录的判断结果之前, 还 包括:
对用户个人 数据中数值进行平均处 理。
8.一种用户留存预测装置, 其特 征在于, 包括:
数据获取模块, 用于获取用户数据; 所述用户数据包括用户个人数据、 用户登录数据、
用户交易数据;
数据处理模块, 用于根据用户数据生成用户登录行为序列、 用户交易行为序列和衍生
特征数据; 所述 衍生特征数据包括 根据用户登录数据确定的用户特 征数据;
融合树模型处理模块, 用于将用户个人数据、 衍生特征数据输入融合树模型, 输出用户
在未来预设天数内的每一 天是否会登录的判断结果; 所述融合树模型根据历史用户个人数
据、 历史衍生特征数据和历史用户在历史预设天数内的每一 天是否登录的实际结果对多种
决策树模型融合训练得到;
时间序列模型处理模块, 用于将用户个人数据、 用户登录行为序列、 用户交易行为序
列、 衍生特征数据和所述判断结果输入时间序列模型, 输出用户在未来预设天数内的每一
天登录的概率值; 所述时间序列模型根据历史用户登录行为序列、 历史用户交易行为序列、
历史用户在历史预设天数内的每一天是否登录的实际结果和历史用户在历史预设天数内
的每一天登录的概 率值对卷积神经网络 CNN模型训练得到 。
9.如权利要求8所述的装置, 其特征在于, 所述用户登录数据包括如下之一或任意组
合:
用户登录时间;
用户登录次数;
用户登录方式。
10.如权利要求8所述的装置, 其特征在于, 所述衍生特征数据包括如下之一或任意组权 利 要 求 书 2/4 页
3
CN 115510995 A
3
专利 用户留存预测方法及装置
文档预览
中文文档
18 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:24:30上传分享