中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
热门
基于深度卷积神经网络的关键点检测算法研究

文献类型:学位论文

作者李杰
答辩日期2022-06-01
文献子类博士
授予单位中国科学院大学
授予地点中国科学院光电技术研究所
关键词关键点检测 深度卷积神经网络 去冗余设计 交互增强建模方法 偶然不确定性测试时增强
学位名称工学博士
英文摘要

       关键点检测是光电成像测量的基础,是提高扩展目标跟踪精度并准确估计其运动姿态与行为意图的关键技术。作为计算机视觉中的重要领域,其也在行为识别、自动驾驶、虚拟或增强现实等领域得到广泛应用。近年来,基于深度卷积神经网络的人体关键点检测研究尤为火热,并且发展了以HRNet为代表的一系列关键点检测算法。然而对于运动目标姿态测量的实时精确需求而言,这些算法在面临着环境光照变化、目标尺度变化、视角旋转和背景干扰等任务挑战的同时,还需解决深度卷积神经网络普遍存在的计算复杂度高、参数量大以及缺乏可解释性等共性问题。着眼于发展高精度、轻量化、低计算量的运动目标姿态测量技术,本文基于深度卷积神经网络对关键点检测进行了如下研究:

       为了满足对高精度、低计算量网络的应用需求,首先对关键点检测网络HRNet进行了冗余性分析和去冗余设计,去除了其参数量大、冗余度高的第四阶段,形成了一种简单直接的去冗余高分辨网络 HRNet_W32_S3。同时,针对HRNet_W32_S3因第四尺度特征缺失和充分特征交融而导致的性能退化问题,提出了一种HRNet_W32_S3与UNet模块相级联的网络,即去冗余级联高分辨网络CHRNet_W32。MPII数据集和COCO数据集测试结果表明,只有HRNet_W32网络40%参数量却与前者精度相近的CHRNet_W32,不仅较大程度地去除了冗余结构,而且大幅减缓了因参数量减少而导致的性能退化问题。

      为了解决现有轻量化模型的性能退化问题,通过交互增强建模方法 MEME 重构高效基准网络 EffBase,创新地提出了一种高效率且高性能关键点检测模型 EEffKPNet。 MPII数据集和COCO 数据集上的实验结果表明,只有HRNet_W48网络14%参数量却实现了精度突破的EEffKPNet_P0,不仅实现了高效率且高性能的关键点检测,还验证了MEME解决小模型性能退化问题的有效性。

      为了解决现有模型的热力图输出缺乏可解释评估和对数据变换鲁棒性不足的问题,提出了一种基于偶然不确定性的测试时增强方法TTA-AU,并将其即插即用在各关键点检测模型中,构建了一系列“基于测试时增强的关键点检测算法”。大量实验表明,增强后的关键点检测算法在评估热力图输出的不确定性的同时,进一步提升了关键点检测的精度和鲁棒性。

      为了将上述网络或算法在刚体目标上进行应用与分析,构建了具诸多有代表性困难和挑战的固定翼飞机关键点检测数据集 Airplane,并在该数据集上实现了HRNet_W32、CHRNet_W32 和 EffKPNet_P0 等网络及其 TTA-AU 增强算法的训练和测试。定量指标和定性分析表明,各网络和算法在固定翼飞机上得到了预期的普适性验证。具体地,在单卡 GTX-1080Ti GPU 平台上,EffKPNet_P0实现了高效率(22+帧的推理速度)且高性能(87.3%AP和90.0%AR的检测结果)的关键点检测,且其TTA-AU增强算法在得到额外精度的同时仍保持了足够快的推理速度。

语种中文
源URL[http://ir.ioe.ac.cn/handle/181551/10283]  
专题光电技术研究所_光电技术研究所博硕士论文
推荐引用方式
GB/T 7714
李杰. 基于深度卷积神经网络的关键点检测算法研究[D]. 中国科学院光电技术研究所. 中国科学院大学. 2022.

入库方式: OAI收割

来源:光电技术研究所

浏览0
下载0
收藏0
其他版本

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。