了解一下什么是AI加速器生态系统

今天的设计团队如果采用传统的RTL设计流程,将花费很多时间才能将运算密集型网络带入到硬件中,该领域亟需一个有别于以往RTL流程,同时又能有效提高生产力的方法。

CATAPULT HLS平台的时代来临

15年前,Mentor认识到设计和验证团队需要从RTL升级到HLS层级,并开发Catapult HLS平台。该平台提供了从C + +到最佳化RTL的完整流程(图1)。

图1:Catapult HLS平台

Catapult HLS平台为算法设计师提供硬件设计解决方案,可以从C++/SystemC描述,生成高品质的RTL,并且以ASIC、FPGA或eFPGA为目标。此平台能在合成之前检查设计中的错误、为功能验证和覆盖率分析提供无缝且可重复使用的测试环境,同时支持在生成的RTL与原始HLS来源之间执行形式等效性检查。

该解决方案的优势包括:

支持后期阶段变更。可随时变更C++算法,重新生成RTL代码或使用新制程。

支持硬件评价。可迅速地探索功耗、性能和面积选项,而无需变更原始代码。

加快时程。将设计和验证所花时间从一年缩短至几个月,可在数日内增添新功能,使用的C/C++代码行数比RTL减少5倍。

AI加速器生态系统

同时,Mentor在Catapult HLS平台中部署了AI加速器生态系统(图2),为AI设计师提供能快速展开项目的环境。

图2:Catapult AI加速器生态系统

AC MATH数据库

Algorithmic C Math(AC Math)中的所有函数都以C ++模板参数写成,让设计师可依据目标应用来指定数值的精准度。许多函数都使用不同的近似策略,例如,自然对数提供两种形式,即分段线性近似和cordic形式。在可接受准确度稍有误差的情况下,前者较小且较快; 后者虽然较慢,但准确许多。所有情况下都能自定义来源以达成设计目标。每个功能/内存块都附有详细的设计文件和C ++验证程序。由于Catapult HLS平台会利用C ++验证程序,因此很容易根据来源设计来验证RTL准确度。

该数据库中的数学函数类别包括:

分段线性函数-绝对值、正规化、倒数、对数和指数(自然和底数2)、平方根、反平方根和正弦/余弦/正切(正和反)

激励函数,如双曲正切、S函数和Leaky ReLU函数

线性代数函数,如矩阵乘法和Cholesky分解

DSP数据库

Algorithmic C DSP(AC DSP)数据库定义了DSP设计师通常所需要的可合成C ++函数,例如滤波器和FFT。这些函数采用以C ++类别为主的设计,让设计师能轻松示例物件的众多变体,以打造复杂的DSP子系统。与AC Math数据库一样,输入和输出参数都会参数化,以便能在所需的定点精确度下执行算术,从而在为合成的硬件执行面积和性能折衷时,提供高度的弹性。

DSP数据库包含:

滤波器函数,如FIR、1-D移动均值,以及多相位抽取

快速傅立叶变换(FFT)函数,如radix-22单一延迟回授、radix-2x动态就位和radix-2就位图像处理数据库Algorithmic C图像处理数据库(AC IPL)首先会定义一些常见的像素格式类型定义。

AI加速器生态系统还可提供丰富的工具组,由真实且经过测试的加速器参考设计示例,团队可以研究、修改和复制这些示例,迅速展开项目。这些随Catapult提供的套件,包含了可设定的C++/SystemC IP原始代码、文件纪录、验证程序和指令码,让设计能进行HLS合成和验证流程。这些工具组展示了各种能用来对性能(延迟)、帧率、面积或功率的折衷进行实验的方法和编写程序技术。

12下一页>

(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )

赞助商
2020-05-26
了解一下什么是AI加速器生态系统
今天的设计团队如果采用传统的RTL设计流程,将花费很多时间才能将运算密集型网络带入到硬件中,该领域亟需一个有别于以往RTL流程,同时又能有效提高生产力的方法。

长按扫码 阅读全文