基于RefineNet的端到端语音增强方法
文献类型:期刊论文
作者 | 蓝天; 彭川; 李森; 钱宇欣; 陈聪; 刘峤 |
刊名 | 自动化学报
![]() |
出版日期 | 2022 |
卷号 | 48期号:2页码:554-563 |
关键词 | 语音增强 端到端 RefineNet 多目标联合优化 深度神经网络 |
ISSN号 | 0254-4156 |
DOI | 10.16383/j.aas.c190433 |
英文摘要 | 为提高神经网络对语音信号时域波形的直接处理能力,提出了一种基于RefineNet的端到端语音增强方法.本文构建了一个时频分析神经网络,模拟语音信号处理中的短时傅里叶变换,利用RefineNet网络学习含噪语音到纯净语音的特征映射.在模型训练阶段,用多目标联合优化的训练策略将语音增强的评价指标短时客观可懂度(Short-time objective intelligibility, STOI)与信源失真比(Source to distortion ratio, SDR)融入到训练的损失函数.在与具有代表性的传统方法和端到端的深度学习方法的对比实验中,本文提出的算法在客观评价指标上均取得了最好的增强效果,并且在未知噪声和低信噪比条件下表现出更好的抗噪性. |
源URL | [http://ir.ia.ac.cn/handle/173211/56420] ![]() |
专题 | 自动化研究所_学术期刊_自动化学报 |
推荐引用方式 GB/T 7714 | 蓝天,彭川,李森,等. 基于RefineNet的端到端语音增强方法[J]. 自动化学报,2022,48(2):554-563. |
APA | 蓝天,彭川,李森,钱宇欣,陈聪,&刘峤.(2022).基于RefineNet的端到端语音增强方法.自动化学报,48(2),554-563. |
MLA | 蓝天,et al."基于RefineNet的端到端语音增强方法".自动化学报 48.2(2022):554-563. |
入库方式: OAI收割
来源:自动化研究所
浏览0
下载0
收藏0
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。