中国科学院机构知识库网格系统: 基于RefineNet的端到端语音增强方法

中国科学院机构知识库网格

Chinese Academy of Sciences Institutional Repositories Grid

基于RefineNet的端到端语音增强方法

文献类型：期刊论文


作者	蓝天; 彭川; 李森; 钱宇欣; 陈聪; 刘峤
刊名	自动化学报
出版日期	2022
卷号	48 期号:2 页码:554-563
关键词	语音增强端到端 RefineNet 多目标联合优化深度神经网络
ISSN号	0254-4156
DOI	10.16383/j.aas.c190433
英文摘要	为提高神经网络对语音信号时域波形的直接处理能力,提出了一种基于RefineNet的端到端语音增强方法.本文构建了一个时频分析神经网络,模拟语音信号处理中的短时傅里叶变换,利用RefineNet网络学习含噪语音到纯净语音的特征映射.在模型训练阶段,用多目标联合优化的训练策略将语音增强的评价指标短时客观可懂度(Short-time objective intelligibility, STOI)与信源失真比(Source to distortion ratio, SDR)融入到训练的损失函数.在与具有代表性的传统方法和端到端的深度学习方法的对比实验中,本文提出的算法在客观评价指标上均取得了最好的增强效果,并且在未知噪声和低信噪比条件下表现出更好的抗噪性.
源URL	[http://ir.ia.ac.cn/handle/173211/56420]
专题	自动化研究所_学术期刊_自动化学报
推荐引用方式 GB/T 7714	蓝天,彭川,李森,等. 基于RefineNet的端到端语音增强方法[J]. 自动化学报,2022,48(2):554-563.
APA	蓝天,彭川,李森,钱宇欣,陈聪,&刘峤.(2022).基于RefineNet的端到端语音增强方法.自动化学报,48(2),554-563.
MLA	蓝天,et al."基于RefineNet的端到端语音增强方法".自动化学报 48.2(2022):554-563.

入库方式： OAI收割

来源：自动化研究所

浏览0

下载0

收藏0

其他版本

除非特别说明，本系统中所有内容都受版权保护，并保留所有权利。