机器学习深层神经网络加速部署
切瓦,许可方的DSP为蜂窝IP平台,多媒体和连通性,介绍了精益深层神经网络(CDNN),一个实时神经网络软件框架,精简机器学习在低功耗嵌入式系统部署。
利用CEVA-XM4成像的处理能力和视觉DSP,CDNN使嵌入式系统执行深度学习任务3 x速度比主要基于gpu的消费30 x系统,而耗电更少,要求15 x更少内存带宽。例如,运行一个基于深层神经网络(款)在28 nm行人检测算法需要不到30 mw 1080 p每秒30帧视频。
关键性能、低功率和低内存带宽能力CDNN是精益网络发生器、专有自动化技术,将客户的网络结构和权重苗条,定制的网络模型用于实时。这可以实现更快的网络模型消耗显著降低功率和内存带宽,只有不到1%的退化精度比原来的网络。一旦生成定制embedded-ready网络,它运行在CEVA-XM4成像和视觉DSP使用完全优化的卷积神经网络(CNN)层,软件库和api。
φ算法解决方案,精益的CEVAnet伙伴计划的一员,利用CDNN实现CNN-based通用对象探测器CEVA-XM4 DSP算法。现在可用于应用程序开发人员和oem运行各种应用程序包括行人检测和人脸检测安全、ADAS和其他嵌入式设备基于低功耗camera-enabled系统。
“精益深层神经网络框架提供了一个快速和平滑路径从线下培训为我们的卷积神经网络实时检测算法为基础,”史蒂文•汉娜说总裁兼联合创始人在φ算法解决方案。“在几天内我们能够得到一个优化的实现我们的独特的对象检测网络,同时大大降低功耗相比其他平台。CEVA-XM4成像和视觉DSP一起CDNN框架非常适合嵌入式视觉设备和铺平了道路人工智能设备的进步在未来几年使用深度学习技术。”
”与20多个设计获得装备,我们继续引领行业在嵌入式视觉处理器领域和不断加强我们的愿景IP组合产品,帮助我们的客户以最小的风险,更快地进入市场”说伊兰Briman,在精益营销副总裁。“我们新的深层神经网络框架的CEVA-XM4是第一个在嵌入式行业,为开发人员提供重要一步实现可行的深度学习算法在嵌入式系统电量有限。”
CDNN软件框架作为源代码,提供扩展CEVA-XM4现有的Application Developer Kit(理应)。它是灵活和模块化的,能够支持完整的CNN实现或特定的层。它适用于各种网络和结构,如网络发达和咖啡,火炬或Theano培训框架,或专有的网络。CDNN包括实时模型示例图像分类、定位和目标识别。它的目的是用于对象和场景识别,高级驾驶员辅助系统(ADAS)、人工智能(AI),视频分析,增强现实(AR),虚拟现实(VR)和类似的计算机视觉应用。
滚珠开关http://www.cxesw.com |