(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211391388.3
(22)申请日 2022.11.08
(71)申请人 合肥工业大 学
地址 230009 安徽省合肥市包河区屯溪路
193号
(72)发明人 张国富 史志远 苏兆品 岳峰
乔亚涛
(74)专利代理 机构 北京久诚知识产权代理事务
所(特殊普通 合伙) 11542
专利代理师 余罡
(51)Int.Cl.
G10L 19/018(2013.01)
G06N 3/08(2006.01)
G06N 3/04(2006.01)
(54)发明名称
基于MIDI和对抗生成网络的音频隐写方法
和系统
(57)摘要
本发明提供一种基于MIDI和对抗生成网络
的音频隐写方法和系统, 涉及音频处理技术领
域。 本发明预先构建带有索引的MIDI音符字典,
采用对抗生成网络预先构建生成器网络和判决
器网络, 并根据生成器网络构建提取器网络, 该
方法包括: 首先对秘密信息进行预处理, 得到秘
密信息所映射的浮点数; 通过生成器网络对所述
浮点数进行处理, 输出MIDI音符字典的索引的归
一化值作为载密信息; 通过提取器网络对载密信
息进行解密。 本发明的生成式音频隐写方法, 突
破有载体隐写在不可感知性和抗隐写检测性的
限制, 将秘密信息转化为MIDI音频, 从而提高载
密音频的有效性 安全性。
权利要求书3页 说明书10页 附图11页
CN 115440234 A
2022.12.06
CN 115440234 A
1.一种基于MIDI和对抗生成网络的音频隐写方法, 其特征在于, 预先构建带有索引的
MIDI音符字典, 采用对抗生 成网络预先构建生 成器网络、 判决器网络以及提取器网络, 该方
法包括:
S1、 对秘密信息进行 预处理, 得到秘密信息所映射的浮 点数;
S2、 通过生成器网络对所述浮点数进行处理, 输出MIDI音符字典的索引的归一化值作
为载密信息;
S3、 通过提取器网络对载密信息进行解密。
2.如权利要求1所述的基于MIDI和对抗生成网络的音频隐写方法, 其特征在于, 所述预
先构建MIDI音符字典, 包括:
获取MIDI数据, 建立MIDI的语音数据库;
使用music21工具包分析MIDI的语音数据库 中MIDI文件, 构建包括索引及其代表的和
弦或单音 音符构成的MIDI音符字典。
3.如权利要求2所述的基于MIDI和对抗生成网络的音频隐写方法, 其特征在于, 所述
MIDI音符字典包括:
其中,j∈{1,2,…,q}代表和弦或单音的索引; q代表和弦或单音的总数; Ntj表示一组在
和弦j中同时出现的音符号; Ntq表示一组在和弦 q中同时出现的音符号。
4.如权利要求1所述的基于MIDI和对抗生成网络的音频隐写方法, 其特征在于, 所述采
用对抗生成网络预 先构建生成器网络、 判决器网络以及提取器网络, 包括:
使用MIDI片段, 基于对抗生成网络, 对生成器网络、 判决器网络以及提取器网络进行训
练和测试;
其中,
判决器网络的训练过程中的目标函数为:
其中:xg代表载体MIDI; xr代表载密MIDI; E[ ]代表期望; D( ) 代表判决器网络的输出; E
[D(. ) ]代表输入样本与真实样本之间的差距, 其中.代 表输入样本;
生成器网络的训练过程中的目标函数为:
其中:λ代表0~1之间的一个小数;
提取器网络的训练过程中的目标函数为:
其中: MSE代 表均方误差, FS代表真实的秘密信息, FS'代表恢复出的秘密信息 。
5.如权利要求4所述的基于MIDI和对抗生成网络的音频隐写方法, 其特征在于, 所述载
密MIDI是指:
将生成器网络输出的MIDI音符字典的索引的归一化值通过以下公式转化为代表MIDI
音符索引的整数 ρm;权 利 要 求 书 1/3 页
2
CN 115440234 A
2其中:gm是输出,Ntq表示一组在和弦 q中同时出现的音符号;
通过ρm找到对应的单音或者和弦, 使用music21中的python工具将多个 ρm组合合成载密
MIDI。
6.如权利 要求1~5任一所述的基于MIDI和对抗生成网络的音频隐写方法, 其特征在于,
所述对秘密信息进行 预处理, 得到秘密信息所映射的浮 点数, 包括:
对于一个二进制秘密信息 S={s1,s2,s3,…, sn},so∈{0,1}, o=1 ,2,3,…, n, 其中n代表
二进制比特流秘密信息的长度, 每一 位用so表示, 其只能为0或1, 转 化方式如下:
S101、 将秘密信息分段, 得到 p段分段秘密信息;
S102、 计算 p段分段秘密信息的 p个映射区间;
S103、 在每个分段秘密信息所对应的映射区间中随机采样一个数作为所映射的浮点
数。
7.如权利要求6所述的基于MIDI和对抗生成网络的音频隐写方法, 其特征在于, 所述计
算p段分段秘密信息的 p个映射区间, 包括:
对于第i段秘密信息 Si, 其相关映射区间[ xi,yi]的计算公式如下:
其中:σ代表上述的秘密信息分段后的比特数; δ代表秘密信息至浮点数映射区间的间
距;Sil表示秘密信息第 i段秘密信息 Si中的第l个比特, | S|表示二进制秘密信息 S的长度。
8.一种基于MIDI和对抗生成网络的音频隐写系统, 其特征在于, 所述系统预先构建带
有索引的MIDI音符字典, 采用对抗生成网络预先构建生成器网络、 判决器网络以及提取器
网络, 所述系统包括:
预处理模块, 用于对秘密信息进行 预处理, 得到秘密信息所映射的浮 点数;
加密模块, 用于通过生成器网络对所述浮点数进行处理, 输出MIDI音符字典的索引的
归一化值作为载密信息;
解密模块, 用于通过提取器网络对载密信息进行解密。
9.一种计算机可读存储介质, 其特征在于, 其存储用于基于MIDI和对抗生成网络的音
频隐写的计算机程序, 其中, 所述计算机程序使得计算机执行如权利要求 1~7任一所述的基
于MIDI和对抗 生成网络的音频隐写方法。权 利 要 求 书 2/3 页
3
CN 115440234 A
3
专利 基于MIDI和对抗生成网络的音频隐写方法和系统
文档预览
中文文档
25 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共25页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:23:53上传分享