鸡尾酒会问题与相关听觉模型的研究现状与展望
文献类型:期刊论文
作者 | 黄雅婷2,3![]() ![]() ![]() ![]() |
刊名 | 自动化学报
![]() |
出版日期 | 2019-02 |
卷号 | 45期号:2页码:234-251 |
英文摘要 | 近些年, 随着电子设备和人工智能技术的飞速发展, 人机语音交互的重要性日益凸显. 然而, 由于干扰声源的存在, 在鸡尾酒会等复杂开放环境下的语音交互技术远没有达到令人满意的程度. 现阶段, 开发一个具备较强自适应性和鲁棒性的听觉计算系统仍然是一件极具挑战性的任务. 因此, 鸡尾酒会问题的深入探索对智能语音处理领域中的说话人识别, 语音识别, 关键词唤醒等一系列重要任务都具有非常重要的研究意义和应用价值. 本文综述了鸡尾酒会问题相关听觉模型研究的现状与展望. 在简要介绍了听觉机理的相关研究, 并概括了解决鸡尾酒会问题的多说话人语音分离相关计算模型之后, 本文还讨论了受听觉认知机理启发的听觉注意建模方法, 认为融入声纹记忆和注意选择的听觉模型在复杂的听觉环境下具有更好的适应性. 之后, 本文简单回顾了近期的多说话人语音识别模型. 最后, 本文讨论了目前各类计算模型对于处理鸡尾酒会问题时仍然存在的困难和挑战, 并对未来的研究方向进行了展望. |
语种 | 中文 |
源URL | [http://ir.ia.ac.cn/handle/173211/49726] ![]() |
专题 | 数字内容技术与服务研究中心_听觉模型与认知计算 |
通讯作者 | 许家铭 |
作者单位 | 1.中国科学院脑科学与智能技术卓越创新中心 上海 200031 2.中国科学院大学 北京 100049 3.中国科学院自动化研究所 北京 100190 |
推荐引用方式 GB/T 7714 | 黄雅婷,石晶,许家铭,等. 鸡尾酒会问题与相关听觉模型的研究现状与展望[J]. 自动化学报,2019,45(2):234-251. |
APA | 黄雅婷,石晶,许家铭,&徐波.(2019).鸡尾酒会问题与相关听觉模型的研究现状与展望.自动化学报,45(2),234-251. |
MLA | 黄雅婷,et al."鸡尾酒会问题与相关听觉模型的研究现状与展望".自动化学报 45.2(2019):234-251. |
入库方式: OAI收割
来源:自动化研究所
浏览0
下载0
收藏0
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。