南开智芯 深度神经网络技术快速发展,在图像识别、语音识别、语义分析、目标检测等应用领域表现突出。但深度神经网络模型往往较为庞大,需要高计算消耗和高网络带宽,很难在边缘计算环境中的移动设备上提供智能服务。因此拟在边缘计算环境中,通过压缩优化深度神经网络模型、设计实现神经网络加速器、自动重构神经网络裁剪与加速器,实现深度神经网络,在资源集约的设备上实现高效的网络模型,满足边缘应用服务中的计算加速需求。研究围绕软硬件协同设计展开,分为三方面内容:1.网络模型压缩与优化。在特征分析的基础上,研究网络冗余压缩、网络裁剪及面向硬件的数据量化方法。2.高性能神经网络加速器。抽象硬件特征,通过优化技术进行加速器共享、可拓展等设计。3.量化裁剪框架及其自动化。建立高复用的神经网络模型基础算子及核心部件,实现量化裁剪优化方法框架,自动构建加速器类编译流程,面对具体应用时,使网络模型的型的实现、部署,达到可重构的流程自动化。