嘉楠一代AI芯片勘智K210功耗仅0.3W  加速国产AIoT架构轻量化

每日热读 2019-06-28 16:20:00

原标题:嘉楠一代AI芯片勘智K210功耗仅0.3W  加速国产AIoT架构轻量化

AIoT正重塑人们的生活场景。无论是客厅里的智能音箱、自动驾驶系统,还是机场安检口的人脸识别闸机,终端设备越来越聪明,为人们提供更高效、更具人性的智能服务。这背后,正是轻量化AI计算架构与边缘侧庞大市场需求合流的结果。

作为国产芯片的新生势力,嘉楠科技在轻量化计算架构的设计上另辟蹊径,推出量产全球首款基于RISC-V自研商用边缘智能计算芯片,加速RISC-V生态在产业界的推广,同时也为国产AIoT架构轻量化设计提出了新的解决方案。

算法轻量化使AIoT架构成为可能

AIoT的兴起源于边缘侧设备对轻量化算法的需求。2012年,AlexNet横空出世,CNN作为一种新型神经网络结构在图像分类、目标检测等领域得到普及。但随着网络层数和性能的提升,大量权值参数和庞大的计算量严重拖垮了CNN的任务处理效率。

以2016年为分水岭,随着权重量化、剪枝等压缩算法涌现,AI算法模型的计算量和权重大小持续减弱,轻量化网络结构成为趋势。结构尺度的成倍缩小使得如今的算法模型能够匹配终端对于功耗的苛刻限制,为AIoT的兴起提供了技术条件。

同时,从市场需求看,在云计算接管企业级市场的背景下,边缘侧设备与云中心的协同需要智能化调度控制。云端芯片与算法无法应对低功耗的需求,偏向于推理场景的AIoT芯片能更好地填补边缘侧智能的空白。

AIoT架构设计需要轻量化的指令集

业内人士普遍认为,算力需求一定的前提下,计算效率和计算面积比越高,对成本降低和能效比的提升越有利。在诸如CPU、MCU等传统的计算架构中,由于通用指令集的限制,单次计算需要多条指令的组合才能完成,计算效率低。而且,传统芯片的计算单元面积占比小,算力优势并不突出。

出于对低功耗的严格限制,目前的解决方案多局限于叠加模块的方式提升算力,例如在芯片中加入NPU弥补AI算力,或者在CPU等传统处理器的组合上优化软件库来支持AIoT应用。但这对AI算法的适应性以及对计算效率的提升并不显著。

目前,一些厂商另辟蹊径,从指令集设计的角度出发提升芯片计算效率。其中,精简指令集RISC-V的基础指令集仅有47条,在设计处理器的时候更容易做到大幅节省芯片的逻辑面积,降低动态功耗,从而适配对功耗有严格限制的小型边缘设备。

嘉楠量产基于RISC-V自研商用边缘智能计算芯片

作为RISC-V联盟成员,嘉楠科技在芯片设计中采用RISC-V架构,是联盟前五家使用RISC-V芯片的厂商之一。在其量产全球首款基于RISC-V自研商用边缘智能计算芯片中,勘智K210采用内置FPU的RISC-V双核64位处理器架构,精简了相对庞大的指令集。

RISC-V在计算效率和功耗上均显示出较大优势。以CoreMark测试程序为例,RISC-V BOOM的程序运行时间为14.26秒,而其他RISC指令集处理器的程序运行时间则为18.15秒。且RISC-V BOOM无论在总指令数、CPI还是时钟周期上均低于其他RISC指令集处理器,更为敏捷。

在功耗方面,勘智K210自身功耗仅为0.3W,即便搭载摄像头等外部设备,其功耗也仅为1W左右。

在采用RISC-V架构设计的同时,勘智K210还在芯片中集成了机器视觉和机器听觉能力。勘智K210的机器视觉基于嘉楠科技自主研发的神经网络KPU,支持低功耗状态下进行CNN计算,高效完成基于神经网络的图像分类任务,例如人脸检测和人脸识别,以及对检测目标进行分类,在智能安防、智能家居、智慧工业等领域有广泛应用。

在机器听觉能力上,芯片在音频处理方面无需DSP,自带APU语音处理单元,最高可支持8路音频数据,16个方向。无需占用主CPU资源,仅一颗芯片就可实现声源定向、声场成像、波束形成、语音唤醒、语音识别等机器听觉功能。

目前,嘉楠科技已经相继发布量产全球首个基于自研的7nm芯片,以及量产全球首款基于RISC-V 自研商用边缘智能计算芯片,加速为区块链和边缘侧智能的落地提供算力支撑。同时,嘉楠科技于近日和清华长三角研究院杭州分院、OK集团共同开放了区块链赋能中心B-LABS众创空间,将为自身芯片的算力探寻更多应用场景。

(免责声明:此文内容为第三方自媒体作者发布的观察或评论性文章,所有文字和图片版权归作者所有,且仅代表作者个人观点,与极客网无关。文章仅供读者参考,并请自行核实相关内容。投诉邮箱:editor@fromgeek.com)

标签芯片
  • 每日热读
    邮箱:caoceng@fromgeek.com
    分享本文到