AI驱动计算架构向ASIC演进 嘉楠科技发布二代AI芯片勘智K510

自2016年起,AI算法的突破深刻影响了计算架构的演进。面对计算密集型场景,通用处理器的计算效率已无法跟上算法迭代速度,取而代之的则是异构计算体系。尤其在推理场景中,ASIC凭借最高的计算效率拔得头筹,正成为边缘AI场景中计算架构的领头羊。

作为一家ASIC芯片设计公司,嘉楠科技已从事5年边缘AI芯片研发。本届世界人工智能大会,嘉楠科技首次发布勘智AI系列的新款芯片勘智K510,其中加入了自主研发的神经网络引擎GNNE,提升3倍算力,目标场景为智能家居、车载后装、智慧零售和智能社区等。

AI驱动计算架构向ASIC演进 嘉楠科技发布二代AI芯片勘智K510

AI驱动的算力演进:从通用到专用

过去5年中,算力演进的主要方向集中于服务器端,结合传统处理器与图形计算引擎,英伟达率先发现了大规模并行计算的方法,使算法训练的效率获得数量级提升。

AI算法训练需要进行大量矩阵乘加运算。面对这一应用场景,传统的处理器CPU处理能力显得捉襟见肘,其原因在于CPU的设计针对串行程序进行了大量优化,用来处理预测分支、乱序执行和多级流水等复杂的控制逻辑。因此CPU中很大一部分硅面积为存储和控制单元,负责逻辑运算的ALU只占据很少一部分。

与之相反,GPU核心中大部分是逻辑运算单元,拥有大量并行处理数据的能力。如果在TensorFlow中分别用CPU和GPU进行矩阵乘运算,GPU的效率可以达到CPU的千倍以上,这也由此拉开了AI领域异构计算的序幕。

异构计算的另一个分支是FPGA。对终端和软件应用公司而言,GPU的架构是固定的,其支持的硬件原生指令也是固定的,无法根据实际的场景进行调整。FPGA的可编程性能对此做了很好的弥补,多数公司都用它来做前期算法的验证。

从GPU和FPGA这两个例子可以看出,AI算法模型一直在驱动计算架构的演进。GPU弥补了传统处理器的算力短板,而根据不同算法调整硬件资源又催生了FPGA。从长期而言,随着AI算法趋于成熟,计算架构将从FPGA过渡到ASIC,即专用计算。谷歌的TPU已经证明了ASIC架构的巨大潜力。在使用TPU之前,AlphaGo曾内置1202个CPU和176个GPU,而2015年AlphaGo部署的TPU仅有48个。

算力的部署:从云端走向边缘

ASIC芯片计算效率最高,适合于推理计算场景。区别于算法训练,推理计算是根据成熟的模型对输入数据给出精准的预测结果。而随着算法模型逐渐趋同,彼此的差异局限于参数优化,推理计算在AI场景中的地位正越来越高。与此同时,算力的部署逐渐从云端向边缘迁移,边缘智能迎来新的发展机遇。

AI的典型应用场景主要为训练和推理。由于对数据的高吞吐,算法训练通常部署在云端服务器进行,需要调用大量计算资源来实现参数的优化。边缘计算场景由于更加靠近应用现场,没有数据中心的算力条件,对时延和设备的功耗都要求严苛。

在云边协同的框架下,设备对原始数据的预处理,不仅能有效降低数据中心的载荷,以及数据传输的带宽成本,也有利于客户业务数据的脱敏。可以说,边缘计算是一种更加敏捷和经济的计算方式。

随着物联网在终端市场展开,第二轮数据爆发周期已经开始。据IoT Analytic调研,2020年全球AIoT设备连接数已经超过非AIoT设备连接数,云边协同处理数据成为必然。另一方面,剪枝、知识蒸馏等算法的出现,也在技术上为算法模型在设备端的部署提供可能。

物联网市场尚处发展早期,虽然谷歌、英伟达等AI巨头将其版图延伸至边缘计算领域,打造覆盖云边端的全栈布局,但尚未形成诸如云端训练市场的垄断态势。在多元化的物联网市场,国内已涌现出一批以嘉楠科技为代表的边缘AI芯片厂商。

嘉楠科技:专注边缘AI芯片自主研发

嘉楠科技在过去8年中积累了大量ASIC芯片设计经验和知识产权,涵盖算法开发和优化,标准单元设计和优化,低电压和高能效操作,高性能设计系统和散热等芯片设计底层共性技术领域。

AI驱动计算架构向ASIC演进 嘉楠科技发布二代AI芯片勘智K510

2016年,嘉楠科技正式成立AI芯片部门,启动边缘芯片研发项目——勘智AI。研发团队在ISA选型、功耗和功能设计上都全面瞄准边缘AI,并在一开始就确立了依托开源架构研发自主IP核的技术路线。历经两年打磨,嘉楠科技研发业内首款RISC-V架构商用边缘AI芯片勘智K210,广泛应用于智能抄表、智能门禁、AI STEAM等场景。

本次发布的K510则是勘智AI系列的新款AI芯片,其最大特点就在于团队自主设计研发的IP核KPU2.0。结合动态3D PE阵列和GLB设计,KPU2.0独创的计算数据流技术提升3倍算力。同时,芯片在硬件配置上大幅优化视觉子系统能力,经典算法mobilenetv1运行帧率提升12倍,多款视觉算法帧率业内领先。

针对芯片的算力和功耗设计,K510的目标场景主要包括智能家居和高清航拍、视频会议、机器人等领域。

嘉楠科技拥有完整的封装、散热和量产工艺团队和丰富的大规模量产经验。截至2020年12月31日,嘉楠科技共完成了14次ASIC的流片,成功率均为 100%。同时,嘉楠科技与业内多家巨头晶圆厂均有合作关系,确保了稳定的产能保障。

(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )