(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211256997.8
(22)申请日 2022.10.14
(71)申请人 宁波欣寰网络科技有限公司
地址 315000 浙江省宁波市高新区菁华路
188号(甬港现代铭楼)B座041幢一楼
1-1188室
(72)发明人 陈炯彬 戚升权 王世存
(74)专利代理 机构 郑州知倍 通知识产权代理事
务所(普通 合伙) 41191
专利代理师 陈佳丽
(51)Int.Cl.
G06Q 30/00(2012.01)
G06F 40/279(2020.01)
G06F 40/30(2020.01)
G06F 16/27(2019.01)G06K 9/62(2022.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
基于分布式存 储的大数据业务管理系统
(57)摘要
本发明涉及电数字数据处理技术领域, 具体
涉及一种基于分布式存储的大数据业务管理系
统, 该系统包括: 时延适宜性获取模块、 同步条件
稳定性获取模块、 分组模块、 典型度获取模块以
及同步策略确定模块; 时延适宜性获取模块用于
获取每个工单会话对应的时延数据进而获取每
个工单会话的时延适宜性; 同步条件 稳定性获取
模块用于获取每个工单会话的差分数据量, 并结
合时延适宜性得到同步条件 稳定性; 分组模块用
于将所有的工单会话进行分组得到正常组和异
常组; 典型度获取模块用于获取 组内每个工单会
话的典型度; 同步策略确定模块用于获取差分数
据量正常和异常的波动区间, 结合预测差分数据
量进行同步策略的确定, 以保证业务能够快捷 稳
定的运行。
权利要求书2页 说明书9页 附图1页
CN 115330422 A
2022.11.11
CN 115330422 A
1.一种基于分布式存 储的大数据业务管理系统, 其特 征在于, 该系统包括以下模块:
时延适宜性获取模块, 用于获取每个工单会话在上次同步后至下次同步前的时间段内
的时延数据, 将所有的时延数据构成数据集, 基于数据集获取工单会话的时延适宜性;
同步条件稳定性获取模块, 用于获取每个工单会话在上次同步 时的多个采样时刻的差
分数据量, 根据所述差分数据量以及所述时延适宜性获取工单会话的同步条件稳定性;
分组模块, 用于根据每个工单会话的时延适宜性和同步条件稳定性获取任意两个工单
会话的差异 距离, 基于所述差异 距离将所有工单会话划分为 正常组和异常组;
典型度获取模块, 用于获取每个工单会话的工单语义描述子, 对于正常组和异常组, 基
于分组内每个工单会话的所述工单语义描述子获取任意两个工单会话的差分数据变化趋
势; 根据分组内每个工单会话对应的所有差分数据变化趋势之和得到对应工单会话的典型
度;
同步策略确定模块, 用于根据正常组内每个工单会话的典型度获取差分数据量的正常
波动区间, 根据异常组内每个工单会话的典型度获取差分数据量的异常波动区间; 利用
LSTM预测网络获取工单会话待同步过程的预测 差分数据量, 基于所述预测差分数据量、 所
述正常波动区间以及所述异常波动区间确定同步策略。
2.根据权利要求1所述的一种基于分布式存储的大数据业务管理系统, 其特征在于, 所
述时延适宜性获取模块中基于数据集获取工单会话的时延适宜性的方法, 包括;
获取所述数据集中所有时延数据的平均值与 方差, 计算所述平均值与 预设的适宜时延
大小之间的差值, 基于所述差值和所述方差获取 所述时延适宜性;
所述时延适宜性与所述差值呈负相关关系, 所述时延适宜性与所述方差呈负相关关
系。
3.根据权利要求1所述的一种基于分布式存储的大数据业务管理系统, 其特征在于, 所
述同步条件稳定性获取模块中根据所述差分数据量以及所述时延适宜性获取工单会话的
同步条件稳定性的方法, 包括:
获取所述工单会话对应的所有差分数据量的变化极差, 所述变化极差是指最后 一个采
样时刻的差分数据量与第一个采样时刻的差分数据量的差值;
获取所述工单会话对应的所有差分数据量中每相邻两个采样时刻对应的差分数据量
的差值绝对值作为差分值, 选取所有差分值中的最大值, 计算差分值的最大值与所述变化
极差的求和结果;
根据所述求和结果与 所述时延适宜性获取工单会话的同步条件稳定性, 所述同步条件
稳定性与所述求和结果呈负相关关系, 所述同步条件稳定性与所述时延适宜性呈正相关关
系。
4.根据权利要求1所述的一种基于分布式存储的大数据业务管理系统, 其特征在于, 所
述分组模块中根据每个工单会话的时延适宜性和同步条件稳定性获取任意两个工单会话
的差异距离的方法, 包括:
获取任意两个工单会话对应的同步条件稳定性之间的差值的平方结果, 计算两个工单
会话对应的动态时间规整距离;
以所述平方结果的负数作为幂指数得到指数函数; 根据 所述指数函数以及所述动态时
间规整距离得到所述差异 距离;权 利 要 求 书 1/2 页
2
CN 115330422 A
2所述差异距离与所述指数函数呈正相关关系, 所述差异距离与 所述动态时间规整距离
呈负相关 关系。
5.根据权利要求3所述的一种基于分布式存储的大数据业务管理系统, 其特征在于, 所
述典型度获取模块中基于分组内每个工单会话的所述工单语义描述子获取任意两个工单
会话的差分数据变化趋势的方法, 包括:
计算分组中每两个工单会话对应差分数据量之间的形态相似距离; 将两个工单会话对
应的变化极差进行作差并求取绝对值得到 差异值;
获取两个工单会话对应 语义描述子之间的相似性;
以所述形态相似距离的负数作为幂指数构建指数函数, 将所述指数函数与 所述相似性
相乘得到乘积结果, 所述乘积结果与所述差异 值的比值为两个工单会话的差异数据变化趋
势。
6.根据权利要求1所述的一种基于分布式存储的大数据业务管理系统, 其特征在于, 所
述同步策略确定模块中根据正常组内每个工单会话的典型度获取差分数据量的正常波动
区间的方法, 包括:
将正常组中所有工单会话的典型度进行降序排列, 降序排列后的前5个典型度对应的
工单会话 为参考样本, 将参 考样本对应的差分数据量构成差分数据量的正常波动区间。
7.根据权利要求1所述的一种基于分布式存储的大数据业务管理系统, 其特征在于, 所
述同步策略确定模块中根据异常组内每个工单会话的典型度获取差分数据量的异常波动
区间的方法, 包括:
将异常组中所有工单会话的典型度进行升序排列, 升序排列后的前5个典型度对应的
工单会话 为异常样本, 将异常样本对应的差分数据量构成差分数据量的异常波动区间。
8.根据权利要求1所述的一种基于分布式存储的大数据业务管理系统, 其特征在于, 所
述同步策略确定模块中LSTM预测网络的训练数据为 正常组中工单会话对应的差分数据量。权 利 要 求 书 2/2 页
3
CN 115330422 A
3
专利 基于分布式存储的大数据业务管理系统
文档预览
中文文档
13 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:24:37上传分享