Contact us

在新窗口打开 在新窗口打开

东芝汽车级图像识别芯片集成深度神经网络加速器

2019年02月26日

东芝电子元件及存储装置株式会社

东京-- 东芝电子元件及存储装置株式会社(“东芝”)今日宣布成功开发出一款汽车级图像识别芯片(SoC),与东芝上一代产品相比,该产品使深度学习加速器的速度提升10倍,功效提高4倍[1]。该技术成果的详情于2月19日在旧金山举行的2019 IEEE国际固态电路会议(ISSCC)上公诸于众。  

自动紧急刹车等先进驾驶员辅助系统可提供越来越先进的功能,但实现这些功能需要图像识别芯片在低功耗条件下高速识别道路交通信号和路况。

深度神经网络(DNN)是模仿大脑神经网络的算法,与传统模式识别和机器学习相比,DNN的识别处理精度要高得多,预计将会在汽车领域得到广泛应用。而采用传统处理器的DNN图像识别耗时较长,因为它依赖大量的乘积累加(MAC)计算。同时,采用传统高速处理器的DNN还存在功耗过高问题。

东芝通过在硬件上实现深度学习的DNN加速器解决了这一难题。它具有三大特点。

  • 并行MAC单元。DNN处理需要大量MAC计算。东芝的新产品有四个处理器,每个处理器包含256个MAC单元。因此提高了DNN的处理速度。
  • 减少了动态随机存取存储器(DRAM)存取。传统的系统级芯片没有本地内存,无法在靠近DNN执行单元的位置保存临时数据,并且在访问本地内存时会产生较大功耗。同时,加载用于MAC计算的加权数据也会产生较大功耗。东芝新产品可在DNN执行单元附近执行静态随机存取存储器(SRAM),并将DNN处理分为多个子处理块,因此可将临时数据保存在SRAM内,从而减少了DRAM存取。此外,东芝还在加速器上增加了一个解压缩单元。可通过解压缩单元加载预先压缩并存储在DRAM中的加权数据。因此,降低了加载来自DRAM的加权数据时产生的功耗。
  • 减少了SRAM存取。传统深度学习需要在处理DNN的每一层之后访问DRAM,因此功耗过高。该加速器在DNN的DNN执行单元中设计有管线层结构,以便在一次SRAM存取期间执行一系列DNN计算。

新系统级芯片符合全球汽车功能安全标准ISO26262的要求。  

东芝将继续提高所开发的系统级芯片的功效和处理速度,且东芝下一代图像识别处理器ViscontiTM5的样品发货将于今年九月启动。  

DNN加速器

DNN Accelerator

最新开发SoC

The developed SoC

[1] 东芝在2015 IEEE国际固态电路会议上发表的一篇论文《面向图像识别应用采用基于颜色的对象分类加速器的1.9TOPS与564GOPS/W异构多核系统级芯片》中提及的图像识别芯片  

* ViscontiTM是东芝电子元件及存储装置株式会社的商标

* 所有其他公司名称、产品名称和服务名称均为其各自公司的商标。.

Information in this document, including product prices and specifications, content of services and contact information, is current on the date of the announcement but is subject to change without prior notice.

To Top
·Before creating and producing designs and using, customers must also refer to and comply with the latest versions of all relevant TOSHIBA information and the instructions for the application that Product will be used with or for.