中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
面向异构IoT设备协作的DNN推断加速研究

文献类型:期刊论文

作者孙胜1; 李叙晶1; 刘敏1; 杨博1; 过晓冰2
刊名计算机研究与发展
出版日期2020
卷号57.0期号:004页码:709
关键词深度神经网络推断加速 异构设备协作 进化增强学习 多层预测模型 拆分策略
ISSN号1000-1239
英文摘要深度神经网络(deep neural network,DNN)已经广泛应用于各种智能应用,如图像和视频识别.然而,由于DNN任务计算量大,资源受限的物联网(Internet of things,IoT)设备难以本地单独执行DNN推断任务.现有云协助方法容易受到通信延迟无法预测和远程服务器性能不稳定等因素的影响.一种非常有前景的方法是利用IoT设备协作实现分布式、可扩展DNN任务推断.然而,现有工作仅研究IoT设备同构情况下的静态拆分策略.因此,迫切需要研究如何在能力异构且资源受限的IoT设备间自适应地拆分DNN任务,协作执行任务推断.上述研究问题面临2个重要挑战:1)DNN任务多层推断延迟难以准确预测;2)难以在异构动态的多设备环境中实时智能调整协作推断策略.为此,首先提出细粒度可解释的多层延迟预测模型.进一步,利用进化增强学习(evolutionary reinforcement learning,ERL)自适应确定DNN推断任务的近似最优拆分策略.实验结果表明:该方法能够在异构动态环境中实现显著DNN推断加速.
语种英语
源URL[http://119.78.100.204/handle/2XEOYT63/31920]  
专题中国科学院计算技术研究所期刊论文_中文
作者单位1.中国科学院计算技术研究所
2.联想研究院
3.中国科学院大学
推荐引用方式
GB/T 7714
孙胜,李叙晶,刘敏,等. 面向异构IoT设备协作的DNN推断加速研究[J]. 计算机研究与发展,2020,57.0(004):709.
APA 孙胜,李叙晶,刘敏,杨博,&过晓冰.(2020).面向异构IoT设备协作的DNN推断加速研究.计算机研究与发展,57.0(004),709.
MLA 孙胜,et al."面向异构IoT设备协作的DNN推断加速研究".计算机研究与发展 57.0.004(2020):709.

入库方式: OAI收割

来源:计算技术研究所

浏览0
下载0
收藏0
其他版本

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。