首页 > 专利 > 杭州电子科技大学 > 一种人类声纹生物密钥生成方法专利详情

一种人类声纹生物密钥生成方法   0    0

有效专利 查看PDF
专利申请流程有哪些步骤?
专利申请流程图
申请
申请号:指国家知识产权局受理一件专利申请时给予该专利申请的一个标示号码。唯一性原则。
申请日:提出专利申请之日。
2014-03-03
申请公布
申请公布指发明专利申请经初步审查合格后,自申请日(或优先权日)起18个月期满时的公布或根据申请人的请求提前进行的公布。
申请公布号:专利申请过程中,在尚未取得专利授权之前,国家专利局《专利公报》公开专利时的编号。
申请公布日:申请公开的日期,即在专利公报上予以公开的日期。
2014-07-16
授权
授权指对发明专利申请经实质审查没有发现驳回理由,授予发明专利权;或对实用新型或外观设计专利申请经初步审查没有发现驳回理由,授予实用新型专利权或外观设计专利权。
2017-01-25
预估到期
发明专利权的期限为二十年,实用新型专利权期限为十年,外观设计专利权期限为十五年,均自申请日起计算。专利届满后法律终止保护。
2034-03-03
基本信息
有效性 有效专利 专利类型 发明专利
申请号 CN201410074511.8 申请日 2014-03-03
公开/公告号 CN103873254B 公开/公告日 2017-01-25
授权日 2017-01-25 预估到期日 2034-03-03
申请年 2014年 公开/公告年 2017年
缴费截止日
分类号 H04L9/32H04L29/06 主分类号 H04L9/32
是否联合申请 独立申请 文献类型号 B
独权数量 1 从权数量 0
权利要求数量 1 非专利引证数量 1
引用专利数量 6 被引证专利数量 0
非专利引证 1、龙艳花,郭武等.采用韵律特征的说话人确认系统《.数据采集与处理》.2010,(第1期),全文. 郭伟,李辉等.基于高维空间映射失配补偿方法的说话人确认《.中国科学技术大学学报》.2010,第40卷(第2期),全文.;
引用专利 CN102064937A、CN102324232A、CN102800316A、WO2013/124862A1、US2010/0223057A1、CN101938489A 被引证专利
专利权维持 4 专利申请国编码 CN
专利事件 事务标签 公开、实质审查、授权
申请人信息
申请人 第一申请人
专利权人 杭州电子科技大学 当前专利权人 杭州电子科技大学
发明人 吴震东、李进 第一发明人 吴震东
地址 浙江省杭州市下沙高教园区2号大街 邮编
申请人数量 1 发明人数量 2
申请人所在省 浙江省 申请人所在市 浙江省杭州市
代理人信息
代理机构
专利代理机构是经省专利管理局审核,国家知识产权局批准设立,可以接受委托人的委托,在委托权限范围内以委托人的名义办理专利申请或其他专利事务的服务机构。
杭州君度专利代理事务所 代理人
专利代理师是代理他人进行专利申请和办理其他专利事务,取得一定资格的人。
杜军
摘要
本发明提出了一种声纹生物密钥生成方法。本发明将声纹特征序列向高维空间中投影,在高维空间中将特征序列稳定到可接受的波动范围内,再对稳定后的特征序列编码,从编码中提取生物密钥。整个方法在待认证用户端、认证服务器端均无需记录用户声纹模板,用户通过采集自身的语音在本地生成(用户名、密钥)对,通过(用户名、密钥)对衍生的各种认证方法进行网络身份认证。声纹生物密钥不仅可以用于网络身份认证,更可以用于加密各种用户私有数据,安全方便。用户无需记忆冗长的密码,同时又能获得足够长度的密钥序列。本发明提取正常人类声纹生物密钥的密钥长度可大于256bit。
  • 摘要附图
    一种人类声纹生物密钥生成方法
  • 说明书附图:图2
    一种人类声纹生物密钥生成方法
  • 说明书附图:图1
    一种人类声纹生物密钥生成方法
  • 说明书附图:图3
    一种人类声纹生物密钥生成方法
  • 说明书附图:图4
    一种人类声纹生物密钥生成方法
法律状态
序号 法律状态公告日 法律状态 法律状态信息
1 2017-01-25 授权
2 2016-11-16 著录事项变更 发明人由吴震东变更为吴震东 李进
3 2014-07-16 实质审查的生效 IPC(主分类): H04L 9/32 专利申请号: 201410074511.8 申请日: 2014.03.03
4 2014-06-18 公开
权利要求
权利要求书是申请文件最核心的部分,是申请人向国家申请保护他的发明创造及划定保护范围的文件。
1.一种人类声纹生物密钥生成方法,其特征在于该方法包括以下步骤:声纹生物密钥训练部分和声纹生物密钥提取部分;
声纹生物密钥训练部分具体步骤为:
第Ⅰ步,用户录取自身语音,10秒以上;
第Ⅱ步,从录取语音中提取MFCC系数;用MFCC系数训练用户GMM高斯混合模型,取混合数为8~32阶,记为N;
第Ⅲ步,混合数为N的高斯混合模型由N个高维高斯分布组成,取每一个高维高斯分布的均值向量,组成N×20维的矩阵,20为MFCC系数个数;高斯混合模型对应每一个高维高斯分布有一个权值,组合在一起为1×N维的权值向量,记为λ,在用户端存储λ;
第Ⅳ步,将N×20维矩阵记为S,将N×20维矩阵扩展为2个矩阵,L×L维的随机误差方阵EX,L×L维的标准值方阵EY,L>N且L>20;具体方法如下:
取矩阵S的N个行向量,求均值,得1×20维的均值向量EB;
设定波动范围Er,为EB增加随机误差扰动,计算公式为

Sj代表S矩阵中的第j行,EXj代表一个行向量;rand(-1,1)函数返回(-1,1)之间的随机数;将EXj以行为单位装配为L×20维的矩阵;
构造L-20个非线性函数,输入变量是一维行向量,x1,x2,…,x20,输出为一维行向量(x1,x2,…,x20,…,xL),L个元素;取如下非线性函数:
Z(t)=(x1-x2)×sin(t)+(t^2)×(x3%10),t为整数,0sin(t)为三角函数,(t^2)表示t的平方,(x3%10)表示x3模10运算;
用构造的Z(t)对EXj进行运算,j遍历1~L,得L×L维矩阵,即随机误差方阵EX;
EY构造方法为:
将均值向量EB重复L行,得L×20维矩阵,记为EYt;用Z(t)对EYtj 进行运算,j遍历1~L,得L×L维矩阵,即标准值方阵EY;
第Ⅴ步,求解EX的广义逆矩阵,记为IEX,将IEX左乘矩阵EY得到高维空间投影矩阵PEX=IEX×EY,在用户端存储高维空间投影矩阵PEX;
第Ⅵ步,选取标准值方阵EY的前N×D个分量组成矩阵T,1第Ⅶ步,设定一个n阶的多项式函数,形如:
f(x)=a0+a1*x+a2*x2+a3*x3+…+an*xn,
其中n为阶数,a0~an∈正整数,其值域范围为0~224,即每个系数有24bit;将矩阵T1的每一个分量代入f(x),计算后得结果矩阵T2,T2为正整数矩阵;在用户端存储T2及n值;
声纹生物密钥训练完成;
声纹生物密钥提取部分具体步骤为:
第一步,用户录取自身语音,3秒左右;
第二步,从录取语音中提取MFCC系数;依据声纹生物密钥训练时存储的λ,训练用户GMM高斯混合模型,取混合数阶数与声纹生物密钥训练时一致,记为N;
第三步,取每一个高斯分布的均值向量,组成N×20维的矩阵;
第四步,将N×20维矩阵扩展为N×L维矩阵,记为EC,扩展方法与声纹生物密钥训练阶段扩展方法保持一致;
第五步,将EC左乘PEX,得N×L维矩阵,取矩阵前N×D个分量组成矩阵;对矩阵的每一个分量进行一次棋盘法运算及正整数转化,方法与声纹生物密钥训练时一致,得矩阵ED;
第六步,从矩阵ED中选取n+2个分量值,排序;从存储的T2矩阵中选取n+2个分量值,排序;
将两组排序结果依次配对,组成(z,f(z))的形式,z为ED中选取的值,f(z)为T2中选取的值;
将n+2个(z,f(z))对,代入函数f(z)=a0+a1*z+a2*z2+a3*z3+…+an*zn,生成n+2个线性方程,其中,a0~an为n+1个未知数,a0~an∈正整数;
如方程组有唯一解,则解得的(a0,a1,a2,a3,…,an)组成的数字序列即为提取的声纹生物密钥;如方程组没有唯一解,则从矩阵ED、T2中重新选取 n+2个分量,组成(z,f(z))对,再次尝试解方程组;遍历ED、T2的所有n+2个分量的排列组合,解得声纹生物密钥;密钥序列长度为24×(n+1)bit。
说明书

技术领域

[0001] 本发明属于信息安全技术领域,具体涉及一种从人类声纹中经由高维空间转换直接提取稳定生物密钥的方法,其能够为网络身份认证提供一种新的认证方法和思路。

背景技术

[0002] 声纹识别技术是现今比较成熟的生物特征识别技术,在低噪音环境中声纹识别准确率可达到95%以上。基于声纹的网络身份认证技术,其基本方法为:1)采集用户语音信号,经语音信号处理提取用户声纹特征,生成声纹特征模板,存储在远端网络认证服务器中;2)当某用户需要进行身份认证时,再次采集用户语音信号,提取用户声纹特征;3)将用户声纹特征与认证服务器中的相应用户声纹特征模板进行比对,一致则认证通过,不一致则认证失败。
[0003] 这一经典的网络身份认证模型需要在认证服务器端存储用户语音,或者用户声纹特征模板。采集用户语音存储在认证服务器中,不方便并且会消耗比较大的服务器资源。服务器需要开辟语音通道接收用户的语音流,这增加了整套认证系统的复杂性。也阻碍了声纹认证在网络认证服务中的运用。
[0004] 曾经有科研工作者尝试过直接从声纹中提取生物密钥。如中国发明专利ZL201110003202.8基于声纹的文档加密及解密方法,提出了一个从声纹信息中提取稳定密钥序列的方案。但是该方案仅用棋盘法稳定声纹特征值,稳定效果有限。并且棋盘法事实是通过缩小编码空间来稳定特征值,如1024的值空间映射为16的值空间,这使得密钥序列的长度缩短,降低了安全性。

发明内容

[0005] 本发明提出了一种声纹生物密钥生成方法。方法将声纹特征序列向高维空间中投影,在高维空间中将特征序列稳定到可接受的波动范围内,再对稳定后的特征序列编码,从编码中提取生物密钥。整个方法在待认证用户端、认证服务器端均无需记录用户声纹模板,用户通过采集自身的语音在本地生成(用户名、密钥)对,通过(用户名、密钥)对衍生的各种认证方法进行网络身份认证。声纹生物密钥不仅可以用于网络身份认证,更可以用于加密各种用户私有数据,安全方便。用户无需记忆冗长的密码,同时又能获得足够长度的密钥序列。本发明提取正常人类声纹生物密钥的密钥长度可大于256bit。
[0006] 声纹生物密钥提取分两部分,第一部分为声纹生物密钥训练部分,第二部分为声纹生物密钥提取部分。
[0007] 声纹生物密钥训练部分具体步骤为:
[0008] 第一步,用户录取自身语音,10秒以上。
[0009] 第二步,从录取语音中提取MFCC系数(Mel频率倒谱系数);用MFCC系数训练用户GMM高斯混合模型,取混合数为8~32阶,阶数可由用户根据经验选定,记为N。
[0010] 第三步,混合数为N的高斯混合模型由N个高维高斯分布组成,取每一个高斯分布的均值向量,组成N×20维的矩阵,20为MFCC系数个数。高斯混合模型对应每一个高维高斯分布有一个权值,组合在一起为1×N维的权值向量,记为λ,在用户端存储λ。
[0011] 第四步,将N×20维矩阵扩展为2个矩阵,L×L维的随机误差方阵EX,L×L维的标准值方阵EY,L>N and L>20。
[0012] 第五步,求解EX的广义逆矩阵,记为IEX,将IEX左乘矩阵EY得到高维空间投影矩阵PEX=IEX×EY,在用户端存储投影矩阵PEX。
[0013] 第六步,选取标准值方阵EY的前N×D个分量组成矩阵T,1
[0014] 第七步,设定一个n阶的多项式函数,形如
[0015] f(x)=a0+a1*x+a2*x2+a3*x3+…+an*xn,
[0016] n为阶数,a0~an∈正整数,其值域范围为0~224,即每个系数有24bit;将矩阵T1的每一个分量代入f(x),计算后得结果矩阵T2,T2为正整数矩阵。在用户端存储T2及n值。
[0017] 声纹生物密钥训练完成。
[0018] 声纹生物密钥提取部分具体步骤为:
[0019] 第一步,用户录取自身语音,3秒左右。
[0020] 第二步,从录取语音中提取MFCC系数(Mel频率倒谱系数);依据声纹生物密钥训练时存储的λ,训练用户GMM高斯混合模型,取混合数阶数与声纹生物密钥训练时一致,记为N。
[0021] 第三步,取每一个高斯分布的均值向量,组成N×20维的矩阵。
[0022] 第四步,将N×20维矩阵扩展为N×L维矩阵,记为EC,扩展方法与声纹生物密钥训练阶段扩展方法保持一致。
[0023] 第五步,将EC左乘PEX,得N×L维矩阵,取矩阵前N×D个分量组成矩阵;对矩阵的每一个分量进行一次棋盘法运算及正整数转化,方法与声纹生物密钥训练时一致,得矩阵ED。
[0024] 第六步,从矩阵ED中选取n+2个分量值,排序;从存储的T2矩阵中选取n+2个分量值,排序。
[0025] 将两组排序结果依次配对,组成(z,f(z))的形式,z为ED中选取的值,f(z)为T2中选取的值。
[0026] 将n+2个(z,f(z))对,代入函数f(z)=a0+a1*z+a2*z2+a3*z3+…+an*zn,生成n+2个线性方程,其中,a0~an为n+1个未知数,a0~an∈正整数。
[0027] 如方程组有唯一解,则解得的(a0,a1,a2,a3,。。。,an)组成的数字序列即为提取的声纹生物密钥;如方程组没有唯一解,则从矩阵ED、T2中重新选取n+2个分量,组成(z,f(z))对,再次尝试解方程组;遍历ED、T2的所有n+2个分量的排列组合,解得声纹生物密钥。密钥序列长度为24×(n+1)bit。
[0028] 本发明的有益效果:本发明提出了一种声纹生物密钥生成方法。可以改变传统的网络生物特征身份认证模式,认证服务器无需存储用户的任何语音信息,只对用户提供的密钥进行认证,而密钥是由用户声纹信息唯一生成的。该方法可以使网络身份认证更灵活,也可以帮助用户免去记忆冗长密钥的记忆负担。

实施方案

[0033] 下面结合附图对本发明作进一步说明。
[0034] 虽然在低噪音环境中声纹识别准确率可达到95%以上,但是直接从声纹中提取生物密钥依然存在诸多困难。声纹生物特征是依概率进行识别的,从语音信号中提取的声纹特征存在很大的波动性。如果不作处理,直接比较两组声纹特征数字序列,99%的概率没有一个数字是相同的。现有的稳定声纹特征数字序列的方法主要是棋盘法,但其稳定效果有限,提取声纹生物密钥的成功率偏低。本发明提出了在高维空间中稳定声纹特征数字序列的技术,并进一步提出了对稳定后的声纹特征数字序列容错提取的技术。两者结合,可使声纹生物密钥提取成功率达到80%以上。
[0035] 本发明分二部分,声纹生物密钥训练部分与声纹生物密钥提取部分。
[0036] 声纹生物密钥训练部分的具体实施步骤为:
[0037] 第一步,用户录取自身语音,10秒以上。
[0038] 第二步,从录取语音中提取MFCC系数(Mel频率倒谱系数),如图1所示。具体方法为:
[0039] 1)预增强(Pre-Emphasis)
[0040] 以S1(n() n:0..N-1)表示语音时域信号,预增强公式为:
[0041] S(n)=S1(n)–a*S1(n-1)(0.9
[0042] 2)音框化(Framing)
[0043] 音框化即对语音信号分帧。
[0044] 3)汉明窗(Hamming Windowing)处理
[0045] 假设音框化后的信号为S(n),n=0,1,…,N-1。那么乘上汉明窗后为:
[0046] S’(n)=S(n)*W(n)
[0047]
[0048] 4)快速傅立叶转换(FFT)
[0049] 对S’(n)实施基2FFT变换,得到线性频谱X(k)。
[0050] 5)三角带通滤波器(Triangle Filters)
[0051] 计算每个滤波器输出的对数能量z(m),m=0,1,…,Ms-1,计算公式为其中Hm(k)为第m个梅尔尺度的三角形滤波器的频率响应,Ns
为语音信号的点数,一般取256,Ms为三角带通滤波器个数,一般取20。
[0052] 6)离散余弦转换(DCT)
[0053] 对上一步所获得的对数能量进行DCT变换,获得DCT系数数组r[20],r[]=dct(z[]);
[0054] dct()变换公式为
[0055]
[0056] r[]即一帧语音信号的MFCC参数,一般为20个。
[0057] MFCC系数计算方法为语音信号处理领域通用算法。
[0058] 用MFCC系数训练用户GMM高斯混合模型,取混合数为8~32阶,阶数可由用户根据经验选定,记为N。GMM高斯混合模型如图2所示。图中有N个混合数,每个混合数对应一个高维高斯分布,维数为MFCC参数个数,一般为20;μi为高斯分布的均值向量,∑i为高维高斯分布的协方差矩阵,pi为对应高斯分布在整个GMM高斯混合模型中所占的比例权值,∑pi=1。GMM训练方法采用语音信号处理领域通用算法。
[0059] 第三步,混合数为N的高斯混合模型由N个高维高斯分布组成,取每一个高斯分布的均值向量,组成N×20维的矩阵,20为MFCC系数个数。高斯混合模型对应每一个高维高斯分布有一个权值,组合在一起为1×N维的权值向量,记为λ,用户端存储λ。
[0060] 第四步,将N×20维矩阵(记为S)扩展为2个矩阵,L×L维的随机误差方阵EX,L×L维的标准值方阵EY,L>N and L>20。
[0061] 取矩阵S的N个行向量,求均值,得均值向量EB(1×20维);
[0062] 设定波动范围Er,如Er=4;为EB增加随机误差扰动,计算公式为
[0063]
[0064] Sj代表S矩阵中的第j行,EXj代表一个行向量;rand(-1,1)函数返回(-1,1)之间的随机数;将EXj以行为单位装配为L×20维的矩阵。
[0065] 构造L-20个非线性函数,输入变量是一维行向量(x1,x2,…,x20),输出为一维行向量(x1,x2,…,x20,…,xL),L个元素。非线性函数可由用户自行定义,作为示例,可取如下非线性函数
[0066] Z(t)=(x1-x2)×sin(t)+(t^2)×(x3%10)(t为整数,0
[0067] sin(t)三角函数,(t^2)表示t的平方,(x3%10)表示x3模10运算。
[0068] 用构造的Z(t)对EXj进行运算,j遍历1~L,得L×L维矩阵,即随机误差方阵EX。
[0069] EY构造方法为:
[0070] 将均值向量EB重复L行,得L×20维矩阵,记为EYt。用Z(t)对EYtj进行运算,j遍历1~L,得L×L维矩阵,即标准值方阵EY。
[0071] 第五步,求解EX的广义逆矩阵,记为IEX,将IEX左乘矩阵EY得到高维空间投影矩阵PEX=IEX×EY,在用户端存储投影矩阵PEX。
[0072] 第六步,选取标准值方阵EY的前N×D个分量组成矩阵T,1
[0073] 对T的每一个分量进行一次棋盘法运算、正整数转化。
[0074] 棋盘法运算,伪代码为:
[0075] 对T中的每一个元素记为Ti
[0076]
[0077] mod()为取模函数,maxdis标记棋盘法的格子大小,取奇数,具体值可由用户根据经验选定。
[0078] 正整数转化方法为,对Ti四舍五入取整,再取绝对值,得正整数。
[0079] 运算完成得结果矩阵T1。
[0080] 第七步,设定一个n阶的多项式函数,形如f(x)=a0+a1*x+a2*x2+a3*x3+…+an*xn,n为阶数,a0~an∈正整数,其值域范围为0~224,即每个系数有24bit;将矩阵T1的每一个分量代入f(x),计算后得结果矩阵T2,T2为正整数矩阵。在用户端存储T2及n值。
[0081] 声纹生物密钥训练完成。
[0082] 声纹生物密钥提取流程如图4所示,具体实施步骤为:
[0083] 第一步,用户录取自身语音,3秒左右。
[0084] 第二步,从录取语音中提取MFCC系数(Mel频率倒谱系数)。提取方法与声纹生物密钥训练时一致。
[0085] 依据声纹生物密钥训练时存储的λ,保持GMM高斯混合模型中pi的权值不变,训练用户GMM高斯混合模型,取混合数阶数与声纹生物密钥训练时一致,记为N。训练方法为语音信号处理领域通用方法。
[0086] 第三步,取每一个高斯分布的均值向量,组成N×20维的矩阵。
[0087] 第四步,将N×20维矩阵扩展为N×L维矩阵,记为EC,扩展方法与声纹生物密钥训练阶段扩展方法保持一致。
[0088] 第五步,将EC左乘PEX,得N×L维矩阵,取矩阵前N×D个分量组成矩阵;对矩阵的每一个分量进行一次棋盘法运算及正整数转化,方法与声纹生物密钥训练时一致,得矩阵ED。
[0089] 第六步,从矩阵ED中选取n+2个分量值,排序;从声纹生物密钥训练阶段存储的T2矩阵中选取n+2个分量值,排序;
[0090] 将两组排序结果依次配对,组成(z,f(z))的形式,z为ED中选取的值,f(z)为T2中选取的值;
[0091] 将n+2个(z,f(z))对,代入函数f(z)=a0+a1*z+a2*z2+a3*z3+…+an*zn,生成n+2个线性方程,其中,a0~an为n+1个未知数,a0~an∈正整数;
[0092] 如方程组有唯一解,则解得的(a0,a1,a2,a3,。。。,an)组成的数字序列即为提取的声纹生物密钥;如方程组没有唯一解,则从矩阵ED、T2中重新选取n+2个分量,组成(z,f(z))对,再次尝试解方程组;遍历ED、T2的所有n+2个分量的排列组合,解得声纹生物密钥。密钥序列长度为24×(n+1)bit。
[0093] 本技术领域中的普通技术人员应当认识到,以上实施例仅是用来说明本发明,而并非作为对本发明的限定,只要在本发明的实质范围内,对以上实施例的变化、变型都将落在本发明的保护范围。

附图说明

[0029] 图1为Mel频率倒谱系数计算流程图。
[0030] 图2为GMM高斯混合模型示意图。
[0031] 图3为矩阵前N×D个分量选取示意图。
[0032] 图4为声纹生物密钥提取流程图。
版权所有:盲专网 ©2023 zlpt.xyz  蜀ICP备2023003576号