(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211359667.1 (22)申请日 2022.11.02 (71)申请人 中国电子技 术标准化研究院 地址 100007 北京市东城区安定门东大街1 号 申请人 北京中科凡语科技有限公司 (72)发明人 胡影 翟飞飞 姚相振 张宇光  付西娜 陈舒 周晨炜 史桂华  (74)专利代理 机构 北京路浩知识产权代理有限 公司 11002 专利代理师 李文清 (51)Int.Cl. G06F 16/335(2019.01) G06F 16/332(2019.01) G06F 21/62(2013.01)G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 网络目标条款筛选方法、 装置、 电子设备及 存储介质 (57)摘要 本发明提供一种网络目标条款筛选方法、 装 置、 电子设备及存储介质, 涉及数据处理技术领 域, 网络目标条款筛选方法包括: 基于目标条款 对应的第一关键词、 第二关键词和目标条件, 对 待筛选隐私 政策文本进行信息筛选, 获取包括目 标条款的第一目标段落作为待筛选隐私政策文 本的筛选 结果; 第一关键词的优 先级高于第二关 键词的优先级。 本发明提供的网络目标条款筛选 方法、 装置、 电子设备及存储介质, 能更高效地、 更准确地对待筛选隐私政策文本进行信息筛选, 能更高效、 更准确地确定待筛选隐私政策文本中 是否包含可能损害用户利益的不合理条款, 有助 于用户在使用APP之前更高效、 更准确地了解上 述APP的隐私政策文本中的关键信息, 能提高用 户感知。 权利要求书2页 说明书12页 附图2页 CN 115470341 A 2022.12.13 CN 115470341 A 1.一种网络目标 条款筛选方法, 其特 征在于, 包括: 获取待筛 选隐私政策文本; 基于目标条款对应的第一关键词、 第二关键词和目标条件, 对所述待筛选隐私政策文 本进行信息筛选, 获取包括所述目标条款的第一目标段落作为所述待筛选隐私政策文本的 筛选结果; 其中, 基于所述第 一关键词和所述第 二关键词对所述待筛选隐私政策文本进行信 息筛 选时, 所述第一关键词的优先级高于所述第二关键词的优先级; 所述 目标条件包括至少 两 个所述第一关键词位于同一断句中、 至少两个所述第二关键词位于同一断句中以及至少一 个所述第一关键词和至少一个所述第二关键词位于同一断句中的至少一个。 2.根据权利要求1所述的网络目标条款筛选方法, 其特征在于, 所述基于目标条款对应 的第一关键词、 第二关键词和目标条件, 在所述待筛选隐私政策文本中筛选包括所述 目标 条款的第一目标 段落, 包括: 在所述待筛 选隐私政策文本中筛 选包括所述第一关键词的第二目标 段落; 在筛选到所述第二目标段落的情况下, 在所述第 二目标段落中筛选包括所述第 二关键 词的第三目标 段落; 在筛选到所述第三目标段落的情况下, 将满足所述目标条件的第 三目标段落确定为第 四目标段落; 在确定所述第四目标段落中包括目标条款的情况下, 将所述第四目标段落确定为所述 第一目标 段落。 3.根据权利要求2所述的网络目标条款筛选方法, 其特征在于, 确定所述第四目标段落 中包括目标 条款, 包括: 将所述第四目标段落和所述目标条款输入文本对比模型, 获取所述文本对比模型输出 的文本对比结果; 其中, 所述文本对比结果包括所述第 四目标段落包括所述目标条款, 或者所述第 四目 标段落不包括所述 目标条款; 所述文本对比模型是以样本段落和样本条款为样本, 以样本 文本对比结果为样本标签进行训练后得到的; 所述样本段落是基于所述样本条款对应的第 一样本关键词、 第二样本关键词和样本条件, 从样本隐私政策文本中筛选得到的包括所述 样本条款的段落; 所述样本文本对比结果包括所述样本段落包括所述样本条款, 或者所述 样本段落 不包括所述样本条款。 4.根据权利要求3所述的网络目标条款筛选方法, 其特征在于, 所述文本对比模型, 包 括: 向量表征单元、 序列标注单元、 权重计算单元、 交互表示单元、 局部增强单元、 池化计算 单元以及结果输出 单元; 所述将所述第四目标段落和所述目标条款输入文本对比模型, 获取所述文本对比模型 输出的文本对比结果, 包括: 将所述第四目标段落和所述目标条款输入所述向量表征单元, 获取所述向量表征单元 输出的所述第四目标 段落对应的第一向量表征和所述目标 条款对应的第二向量表征; 将所述第一向量表征和所述第 二向量表征输入所述序列标注单元, 获取所述序列 标注 单元输出的所述第一向量表征的隐层输出和所述第二向量表征的隐层输出; 将所述第一向量表征的隐层输出和所述第二向量表征的隐层输出输入所述权重计算权 利 要 求 书 1/2 页 2 CN 115470341 A 2单元, 获取所述权重计算单 元输出的目标权 重值; 将所述第一向量表征的隐层输出、 所述第 二向量表征的隐层输出和所述目标权重值输 入所述交互表示单元, 获取所述交互表示单元输出的所述第四目标段落和所述目标条款之 间的交互表示; 将所述第一向量表征的隐层输出、 所述第 二向量表征的隐层输出以及所述交互表示输 入所述局部增强单元, 获取所述局部增强单元输出的所述第四目标段落的局部推理信息和 所述目标 条款的局部推理信息; 将第四目标段落的局部推理信息和所述目标条款的局部推理信息输入所述池化计算 单元, 获取所述池化计算单 元输出的目标 特征向量; 将所述目标特征向量输入所述结果输出单元, 获取所述结果输出单元输出的所述文本 对比结果。 5.根据权利要求2所述的网络目标条款筛选方法, 其特征在于, 所述在确定所述第四目 标段落中包括 目标条款的情况下, 将所述第四目标段落确定为所述第一 目标段落之后, 还 包括: 在所述待筛 选隐私政策文本中标记所述第一目标 段落。 6.根据权利要求1至5任一所述的网络目标条款筛选方法, 其特征在于, 所述获取包括 所述目标 条款的第一目标 段落作为所述待筛 选隐私政策文本的筛 选结果之后, 还 包括: 基于所述筛选结果, 对所述待筛选隐私政策文本进行风险评估, 获取所述待筛选隐私 政策文本的风险评估结果; 其中, 所述风险评估结果包括存在用户个人隐私泄露风险, 或不存在用户个人隐私泄 露风险。 7.根据权利要求6所述的网络目标条款筛选方法, 其特征在于, 所述第一关键词、 所述 第二关键词和所述 目标条件, 是预设的或基于目标文本库统计得到的; 所述 目标文本库包 括风险评估结果 为存在用户个人隐私泄 露风险的隐私政策文本 。 8.一种网络目标 条款筛选装置, 其特 征在于, 包括: 文本获取模块, 用于获取待筛 选隐私政策文本; 信息筛选模块, 用于基于目标条款对应的第一关键词、 第 二关键词和目标条件, 对所述 待筛选隐私政策文本进行信息筛选, 获取包括所述目标条款的第一目标段落作为所述待筛 选隐私政策文本的筛 选结果; 其中, 基于所述第 一关键词和所述第 二关键词对所述待筛选隐私政策文本进行信 息筛 选时, 所述第一关键词的优先级高于所述第二关键词的优先级; 所述 目标条件包括至少 两 个所述第一关键词位于同一断句中、 至少两个所述第二关键词位于同一断句中以及至少一 个所述第一关键词和至少一个所述第二关键词位于同一断句中的至少一个。 9.一种电子设备, 包括存储器、 处理器及存储在所述存储器上并可在所述处理器上运 行的计算机程序, 其特征在于, 所述处理器执行所述程序时实现如权利要求1至7任一项所 述网络目标 条款筛选方法。 10.一种非暂态计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 所述计算 机程序被处 理器执行时实现如权利要求1至7任一项所述网络目标 条款筛选方法。权 利 要 求 书 2/2 页 3 CN 115470341 A 3

PDF文档 专利 网络目标条款筛选方法、装置、电子设备及存储介质

文档预览
中文文档 17 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 网络目标条款筛选方法、装置、电子设备及存储介质 第 1 页 专利 网络目标条款筛选方法、装置、电子设备及存储介质 第 2 页 专利 网络目标条款筛选方法、装置、电子设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:24:00上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。