网站地图 | Tags | 热门标准 | 最新标准 | 订阅
您当前的位置:首页 > 行业标准 > 团体标准

T/UNP 252-2024 语声纹库管理系统技术规范

  • 文件大小:671.06 KB
  • 标准类型:综合团体标准
  • 标准语言:中文版
  • 文件类型:PDF文档
  • 更新时间:2025-02-26
  • 下载次数
  • 标签

资料介绍

ICS 35.080
UNSPSC 43.23.15
CCS L 77
团体标准
T/UNP 252—2024
语声纹库管理系统技术规范
Technical specification for speech and voiceprint database management system
2024 - 11 - 07 发布 2024 - 11 - 07 实施
中国联合国采购促进会 发布

目次
前言 ................................................................................ III
引言 ................................................................................. IV
1 范围 ............................................................................... 1
2 规范性引用文件 ..................................................................... 1
3 术语、定义和缩略语 ................................................................. 1
术语和定义 ..................................................................... 1
缩略语 ......................................................................... 1
4 系统架构 ........................................................................... 1
5 功能要求 ........................................................................... 2
语音质量检测 ................................................................... 2
语音识别 ....................................................................... 2
声纹特征提取 ................................................................... 2
声纹模型预留 ................................................................... 3
声纹储存 ....................................................................... 3
声纹验证 ....................................................................... 3
声音预留模型比对 ............................................................... 3
声纹采集 ....................................................................... 3
质量判断 ....................................................................... 3
声纹变更 ...................................................................... 3
声纹管理 ...................................................................... 3
抗噪音能力 .................................................................... 3
抗时变能力 .................................................................... 3
6 性能要求 ........................................................................... 3
响应时间 ....................................................................... 3
易用性 ......................................................................... 4
可靠性 ......................................................................... 4
拓展性 ......................................................................... 4
储存时间 ....................................................................... 4
7 数据要求 ........................................................................... 4
数据加密 ....................................................................... 4
数据备份 ....................................................................... 4
隐私保护 ....................................................................... 4
8 安全要求 ........................................................................... 4
基本要求 ....................................................................... 4
声纹数据采集安全 ............................................................... 5
声纹数据存储安全 ............................................................... 5
声纹数据使用安全 ............................................................... 6
T/UNP 252—2024
II
9 运维要求 ............................................................................ 6
性能监测与优化 .................................................................. 6
安全漏洞排查与修复 .............................................................. 6
功能扩展与升级 .................................................................. 6
10 评价与改进 ......................................................................... 7
操作记录 ....................................................................... 7
评估与改进 ..................................................................... 7
参考文献 ............................................................................... 8
T/UNP 252—2024
III
前言
本文件按照GB/T 1.1—2020《标准化工作导则 第1部分:标准化文件的结构和起草规则》的规定
起草。
请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。
本文件由中国联合国采购促进会提出并归口。
本文件起草单位:武汉铃声科技有限公司、湖北睿唐空间智能科技有限公司、武汉吉客威睿数字科
技有限公司、湖北国威时代信息技术有限公司、武汉锐佳讯科技有限公司。
本文件主要起草人:郑伟莲、卢蹁跹、余汉汉、李嘉茵、胡彬。
T/UNP 252—2024
IV
引言
为助力中国企业参与国际贸易,推动企业高质量发展,中国联合国采购促进会依托联合国采购体系,
制定服务于国际贸易的系列标准,这些标准在国际贸易过程中发挥了越来越重要的作用,对促进贸易效
率提升,减少交易成本和不确定性,确保产品质量与安全,增强消费者信心具有重要的意义。
联合国标准产品与服务分类代码(UNSPSC,United Nations Standard Products and Services
Code)是联合国制定的标准,用于高效、准确地对产品和服务进行分类。在全球国际化采购中发挥着至
关重要的作用,它为采购商和供应商提供了一个共同的语言和平台,促进了全球贸易的高效、有序发展。
围绕UNSPSC进行相关产品、技术和服务团体标准的制定,对助力企业融入国际采购,提升国际竞争
力具有十分重要的作用和意义。
本文件采用UNSPSC分类代码由6位组成,对应原分类中的大类、中类和小类并用小数点分割。
本文件UNSPSC代码为“43.23.15”,由3段组成。其中:第1段为大类,“43”表示“信息技术广播
和电信”,第2段为中类,“23”表示“系统”,第3段为小类,“15”表示“特定于业务功能的系统”。
T/UNP 252—2024
1
语声纹库管理系统技术规范
1 范围
本文件规定了语声纹库管理系统的系统架构、功能要求、性能要求、数据要求、安全要求、运维要
求和评价与改进。
本文件适用于语声纹库管理系统的设计、部署和应用。
2 规范性引用文件
下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,
仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本
文件。
GB/T 35273 信息安全技术 个人信息安全规范
GB/T 37036.1 信息技术 移动设备生物特征识别 第1部分:通用要求
3 术语、定义和缩略语
术语和定义
下列术语和定义适用于本文件。
3.1.1
声纹 voiceprint
对语音中所蕴含的、能表征和标识说话人的语音特征,以及基于这些特征(参数)所建立的语音模
型。
[来源:SJ/T 11380—2008,3.1.1]
3.1.2
声纹特征 voiceprint feature
从说话人的语音中所提取出来的、可表征该说话人语音的个性特征的参数。
注: 常用的特征参数包括频谱(spectrum)、倒频谱(cepstrum)、线性预测系数(LPC)、音高(pitch)、声调
(tone)、共振峰(formant)、音质(voice quality)、声韵(prosody)、习语(phoneme/word idiolect)
各种层次的信息。
[来源:SJ/T 11380—2008,3.1.2]
3.1.3
声纹模型 voiceprint model
对声纹特征进行描述的数学模型。
注: 常用的数学模型有:高斯混合模型(Gaussian mixture model),基于通用背景模型的高斯混合模型(Gaussian
mixture model-universal background mode1),隐马尔可夫模型(hidden Markov model),人工神经网络
(artificial neural network),支持向机(support vector machine)等。通常,一个声纹模型对应一名说
话人,但一名说话人可有多个声纹模型,以对应各种不同的应用环境或声纹信息层次,如一名说话人可在不同
的信道条件下有不同的声纹模型。
[来源:SJ/T 11380—2008,3.1.3]
缩略语
下列缩略语适用于本文件。
AES:密码学中的高级加密标准(Advanced Encryption Standard)
RSA:非对称加密算法(Rivest Shamir Adleman)
W3C:万维网联盟(World Wide Web Consortium)
4 系统架构
T/UNP 252—2024
2
语声纹库管理系统架构包括的应用层、支撑层、网络层、硬件层、安全层和运维层,其中应用层包
括内容语音质量检测、语音识别、声纹特征提取、声纹模型预留、声纹储存、声纹验证、声纹预留模型
比对、声纹采集、质量判断、声纹变更、声纹管理、抗噪音能力、抗时变能力等功能,系统架构图见图
1。
安全层维运层
应用层
语音质量检测语音识别声纹特征提取
声纹模型预留
声纹预留模型比对声纹采集
声纹管理
声纹验证
支撑层
网络层
硬件层
声纹验证声纹储存
质量判断声纹变更
抗噪音能力抗时变能力
图1 系统架构图
5 功能要求
语音质量检测
读取用户的语音进行质量检测,剔除静音、白噪及信噪比低的语音,识别出有效语音。语音质量检
测结果包括:
a) 语音音量小于45 dB;
b) 语音音量大于70 dB;
c) 语音信噪比小于30 dB;
d) 语音长度小于2 s;
e) 语音过零率小于0.1。
语音识别
对用户的语音进行识别,判断语音内容是否与要求的内容一致。语音识别结果包括:
a) 语音识别成功;
b) 语音为空;
c) 有效语音为空;
d) 有效语音分配失败;
e) 防录音语音无效等。
声纹特征提取
移动设备声纹识别应从通过质量判断的用户声纹语音样本中提取用户的声纹特征项,提取过程宜
采用不可逆的方式。
T/UNP 252—2024
3
声纹模型预留
移动设备声纹识别应从说话人有效语音中提取声纹特征项后,估计其声纹模型参数并生成数学模
型。
声纹储存
声纹特征提取后,应将声纹模型文件存储到声纹数据库中。声纹数据库可采用不同的存储方式,如
采用关系型数据库、非关系型数据库或文件系统等进行存储。根据实际需求和系统设计选择存储方式。
声纹验证
包含动态声纹密码校验和声纹确认,实现对关联主体身份的验证。
声音预留模型比对
应对经过语音质量检测、语音识别的用户录制语音,通过算法引擎提取相应的特征,与预留的模型
进行比对,生成置信度分数,并根据设定的分数阈值,判断该次比对认证是否为本人。
声纹采集
符合GB/T 37036.1—2018中6.2.1的要求,包括但不限于:
a) 在以声纹建模为目的的声纹语音样本采集前,结合其他身份鉴别手段对用户身份进行认证;
b) 提示用户采集的环境要尽量保持安静,避免周围环境噪声和其他说话声音的干扰,避免回音,
避免录音现场的各类电磁干扰;
c) 具有明显的用户提示,告知用户对其声纹语音样本进行了采集,若采集过程分多次进行,宜向
用户明示每一次采集的进度;
d) 具备异常情况判定及处理能力,如声纹语音样本未通过质量判断、检测到呈现攻击等的相应处
理机制。
质量判断
声纹识别应具备对采集到的用户声纹语音样本进行质量判断的能力,确定当前声纹语音样本是否
满足声纹识别处理的需求,包括但不限于对截幅比例、信噪比和声纹语音样本完整程度进行质量判断。
声纹变更
在服务中开启声纹应用的自学习功能,服务应选取离自学习工作时间最近的自学习需要的语音,筛
选出符合自学习的语音分数的语音,与原始模型的语音一起进行重新建模,更新用户的声纹模型。
声纹管理
声纹管理功能模块的操作包括数据的添加、删除、修改和查询等。管理员可根据需要对声纹数据进
行维护和管理,保证数据库的完整性和安全性。
抗噪音能力
系统应具备抗噪音能力,能过滤背景噪音,并生成清晰、无杂音的语音。
抗时变能力
系统应具备对抗年龄变化的算法能力,保证能适应用户随着时间而产生的变化。
6 性能要求
响应时间
系统响应时间应满足以下要求:
a) 进行声纹注册时,从系统提示用户已成功录制最后一条声纹语音样本起,到提示注册结果为止,
所需时间小于或等于3 s;
T/UNP 252—2024
4
b) 进行声纹比对时,从系统提示用户已成功录制声纹语音样本起,到提示识别结果为止,所需时
间小于或等于2 s。
易用性
6.2.1 系统的易用性应符合GB/T 25000.51—2016 中5.3.4 的规定。
6.2.2 系统用户界面设计应简洁,操作流程应直观易懂,并提供清晰的操作指引和提示信息,帮助用
户在使用过程中快速解决问题。
6.2.3 系统应考虑不同用户群体的需求和使用习惯,支持个性化的设置和优化,提高用户的使用体验。
可靠性
6.3.1 系统应运行稳定,准确完成数据采集、存储、管理任务。
6.3.2 系统应具备容错能力,出现意外情况时,应自动检测并采取相应的补救措施,保证系统的正常
运行。
拓展性
6.4.1 系统应支持通过增加服务器节点来扩展系统容量和提升系统计算、数据处理、并发处理等能力。
6.4.2 系统应支持通过升级硬件配置来提升单个服务器节点的性能。
6.4.3 系统的各个模块应分工明确,负责系统的一个特定功能或服务,便于进行模块的独立升级和维
护。
储存时间
6.5.1 系统应具备高效的数据读写性能,支持快速存储和检索大量的声纹数据。
6.5.2 系统应支持历史数据的归档和定期删除,系统储存数据时间应大于5 年。
7 数据要求
数据加密
7.1.1 对敏感数据进行加密处理,在传输、存储时,防止数据被未授权读取。
7.1.2 使用强加密算法,如AES、RSA 等,确保数据的加密安全。
数据备份
7.2.1 数据备份和恢复,包括但不限于:
a) 完全数据备份应至少每天一次,备份介质场外存放;
b) 应提供异地实时备份功能,利用通信网络将数据实时备份至灾难备份中心;
c) 应提供虚拟机快速恢复能力;
d) 应支持基于磁盘的备份与恢复。
隐私保护
7.3.1 系统应实现访问控制机制,确保只有授权用户才能访问敏感数据和系统功能。
7.3.2 实施SSL/TLS 证书安全认证机制,建立安全的通信通道。
7.3.3 对用户进行身份认证,确保只有合法用户能访问系统。
8 安全要求
基本要求
对生物特征识别信息保护的基本原则如下:
a) 应满足GB/T 35273—2020 中对个人信息控制者的要求;
b) 应遵循GB/T 35273—2020 第4 章中的个人信息安全基本原则,并应遵循以下原则:
T/UNP 252—2024
5
1) 自主选择:在开展身份识别相关活动的场景,保证个人有使用或不使用生物特征识别信息
的选择权,确保个人在自愿的情况下,通过直接方式提供生物特征识别信息,并确保个人
对其生物特征识别信息持续的控制权;
2) 多样更新:使用具备不可逆、不可链接、多样化、可更新等特性的生物特征识别比对信息;
3) 充分知情:保证生物特征识别信息主体对其生物特征识别信息处理情况和安全事件的知
情权。
声纹数据采集安全
对生物特征识别信息控制者的要求如下:
a) 除保护公共利益和个人重大利益场景外,不应限定收集生物特征识别信息作为唯一实现业务
目标的方式;
b) 收集生物特征识别信息前,应向生物特征识别信息主体告知以下信息,并征得生物特征识别信
息主体的明示同意:
1) 收集、使用生物特征识别信息的目的、方式、范围和授权存储时间等;
2) 收集的生物特征识别信息处理方式的描述;
3) 生物特征识别信息控制者的联系信息,包括组织机构信息、联系方式等;
4) 生物特征识别信息主体实现査看、修改、撤回其授权同意的方式。
c) 不应收集不属于该生物特征识别信息主体的生物特征识别信息,包括生物特征识别原始信息;
d) 不应采用间接方式从非生物特征识别信息主体处获取其信息;
e) 生物特征识别信息主体无法完成信息收集时,应告知后续可用替代处理流程;
f) 根据国家相关法律法规等规定收集生物特征识别信息时,应将相关要求以及收集的生物特征
识别信息类型告知生物特征识别信息主体。
声纹数据存储安全
对生物特征识别信息控制者的要求如下:
a) 应将生物特征识别信息与生物特征识别信息主体的身份相关信息采用技术隔离手段存储;
注: 隔离方式包括逻辑隔离、物理隔离等。
b) 存储生物特征识别信息时,应具备不可逆性;
c) 不应直接存储生物特征识别原始信息,可采取的措施包括但不限于:
1) 仅存储生物特征识别信息的摘要信息;
2) 在采集终端中直接使用生物特征识别信息实现身份识别、认证等功能;
3) 在使用面部识别特征、指纹、掌纹、虹膜等实现识别身份、认证等功能后,删除生物特征
识别原始信息。
注1:摘要信息通常具有不可逆性。
注2:生物特征识别信息控制者履行法律法规规定的义务相关的情形除外。
d) 应使用多样化过程支持生成可更新、可撤销的生物特征识别比对信息:
1) 多样化过程产生的生物特征识别比对信息,应具备不可逆性;
2) 通过多样化过程产生的同一生物特征识别信息主体的各个生物特征识别比对信息,应具
有不可链接性。
注: 多样化过程是指将一个生物特征识别信息主体的单个或多个生物特征识别原始信息变换成多个独立的生物特
征识别比对信息,用于生物特征识别比对信息的更新或为不同的应用程序分别提供独立的生物特征识别比对信
息。
e) 存储生物特征识别比对信息时,应考虑数据泄露风险、进行安全处理,可使用的机制包括但不
限于:
1) 通过在个人令牌或卡上存储生物特征识别比对信息,通过逻辑、物理方式进行安全保护;
2) 使用仅生物特征识别信息控制者或生物特征识别信息主体知道的密钥执行加密操作;
3) 减少存储的生物特征识别比对信息;
4) 使用不可直接关联到生物特征识别信息主体的标识符。
T/UNP 252—2024
6
f) 应保持生物特征识别比对信息在应用程序或数据库间的不可链接性,防止生物特征识别比对
信息被用于链接同一数据库中不同应用程序或不同数据库中的同一信息主体:不可链接性可
通过以下机制的组合获得:
1) 在应用程序之间使用不同的密钥或机制对生物特征比对信息进行加密,阻止对生物特征
识别信息主体的链接,原则上不同密钥应交不同人员保管;
2) 在应用程序之间使用以下方式或其组合:采用不同的生物特征识别模式、采用不兼容的特
征提取算法、采用不兼容的生物特征识别数据交换格式。
g) 生物特征识别信息的复制信息,如备份信息、归档信息等,存储时应具备与被复制信息相同的
保护措施;
h) 应只存储满足生物特征识别信息主体授权同意的目的所需最少的生物特征识别信息;
i) 应只在生物特征识别信息主体授权的存储时间内存储生物特征识别信息,超出存储期限后,应
及时对生物特征识别信息进行删除或匿名化处理。
声纹数据使用安全
对生物特征识别信息控制者的要求如下:
a) 使用生物特征识别信息进行算法精度优化等,应彻底去除与生物特征识别信息主体的身份关
联,充分评估安全风险,并在使用目标完成后及时删除相关信息;
b) 应使用可更新、可撤销、具有不可逆性的生物特征识别比对信息进行身份识别;
c) 不应基于生物特征识别信息自身生成用户画像和统计分析,包括但不限于:
1) 不应基于生物特征识别信息自身描述有关民族、种族、宗教、残疾、性取向、暴力倾向等
信息;
2) 不应基于生物特征识别信息自身进行统计分析,需统计分析时,应事先进行个人信息安全
影响评估,仅使用经匿名化后的数据。
d) 不应基于生物特征识别信息自身进行个性化推荐,包括但不限于:
1) 不应基于个人基因、面部识别特征、指纹、声纹、耳廓、步态等的特点发送商业性信息;
示例:不应基于个人基因、面部识别特征、指纹、声纹、耳、步态的特征或变化推荐美容、医疗等服务。
2) 不应基于个人面部识别特征、声纹、步态等分析个人行为习惯、意见观点等进行信息推送。
e) 不应使用生物特征识别比对信息作为汇聚融合的直接关联点;
f) 应对生物特征识别信息的复制、下载等重要操作进行控制,应仅在实现已获授权同意目的所必
须的情况下进行,应明确特定人员执行、保证操作过程安全、及时收回执行人员的操作权限。
9 运维要求
性能监测与优化
9.1.1 应持续监测系统的性能指标,如服务器负载、网络带宽占用、内容发布速度等,及时发现性能
瓶颈。
9.1.2 应采用性能优化技术,如缓存技术、负载均衡、数据库优化等,提高系统的响应速度和处理能
力。
9.1.3 应对系统进行压力测试和模拟高负载场景,确保系统在极端情况下能稳定运行。
安全漏洞排查与修复
9.2.1 定期进行安全漏洞扫描,包括对系统软件、服务器配置、网络连接等方面的检查,及时发现潜
在的安全风险。
9.2.2 应对发现的安全漏洞进行及时修复,更新安全补丁,加强系统的安全防护能力。
9.2.3 应建立安全事件应急响应机制,在发生安全事件时应迅速采取措施,降低损失。
功能扩展与升级
9.3.1 应及时了解语声纹库管理的新技术、新应用和新需求,评估其对系统的影响和价值。
9.3.2 根据用户需求和行业发展趋势,制定系统功能扩展计划。明确新功能的目标、需求、技术方案
和实施时间表,确保功能扩展的有序进行。
T/UNP 252—2024
7
9.3.3 定期对系统的现有功能进行评估和优化,提高功能的性能和稳定性。
10 评价与改进
操作记录
10.1.1 应建立完善的操作记录与审计日志机制,对系统服务操作和数据访问活动进行有效监控与追
溯。
10.1.2 系统应自动记录关键操作,包括但不限于用户登录、数据访问、修改、删除、权限变更等,并
确保审计日志的完整性、真实性和不可篡改性。
10.1.3 审计日志应包含一系列运作信息,便于在需要时进行事件重建和责任追溯。
评估与改进
10.2.1 应定期对系统服务操作与数据安全进行评估,验证其系统合规性、及时发现潜在风险并提出改
进建议。
10.2.2 评估活动应由独立的审计团队或第三方机构执行,确保审计过程的客观性和公正性。
10.2.3 评估内容应包括但不限于本文件第5 章、第6 章、第7 章、第8 章、第9 章。
10.2.4 评估结果应形成报告,并及时向相关管理层汇报,对发现的问题应制定具体的整改措施和时限。
T/UNP 252—2024
8
参考文献
[1] SJ/T 11380 自动声纹识别(说话人识别)技术规范

下载说明

关于本站 | 联系我们 | 下载帮助 | 下载声明 | 信息反馈 | 网站地图