腾讯封建胜:高性能计算方兴未艾,硅基光电子如火如荼

1月12日消息(九九)在日前举行的2023中国光通信高质量发展论坛 - 硅光技术研讨会上,腾讯光网络架构师封建胜表示,硅光技术一直在以自身独特的节奏发展,各种应用也让人眼花缭乱,但好消息是硅光商业化的路径越来越清晰,可谓“乱花渐欲迷人眼,浅草才能没马蹄。”

封建胜介绍,腾讯从社交软件开始发展,从QQ到微信为越来越多的人提供便捷的通讯工具。截至2022年第三季度,微信月活跃账户数达到13亿,小程序日活跃账户数达到6亿,视频号日活跃账户达到5亿,目前还在继续增长中。在这些业务背后是腾讯庞大的数据中心在支持,腾讯数据中心分布在全球26个物理地区,包括70个可用区,国内加速节点超过2000个,海外加速节点超过800个。

数据中心是一个复杂的数字经济基础设施,核心是服务器与网络。目前腾讯在全球有接近200万服务器,数据存储规模超过EB级别,全球加速节点超过2800个,带宽储备达到200T。服务器与用户之间的连接便是光通讯网络,数据中心内部的光网络主要由网卡、交换机和光模块等硬件组成,目前腾讯的网卡端口速率达2×50G、2×100G, 2×200G的网卡芯片正在开发中;TOR交换机交换容量为8T,核心交换机容量达25.6T;对应的光模块有200G 1分2线缆,200G QSFP56封装的SR4光模块,以及200G QSFP56封装的FR4光模块。

封建胜指出,在腾讯微信、小程序、视频号等业务的背后,人工智能(AI)和机器学习(ML)等新技术发挥着越来越重要的作用。当前视频号的推荐越来越精准,这背后就是AI和ML在推动。

封建胜进一步指出,利用算法代替人工进行分级,推荐效率和精准性都得到了很大提升,但也面临着新的问题:滞后的硬件算力和滞后的网络带宽。最近10年,AI训练模型对算力的需求中,机器视觉、自然语言处理的增长速度为每两年15倍;Transformer大模型的增长速度更是达到每两年750倍,远远超过摩尔定律的每两年两倍。这意味着硬件的算力跟不上训练模型的需求。

不仅如此,存储和互联的速率增长速度更加缓慢。硬件算力在20年内增长了9万倍,内存总线,例如DRAM 20年内增长仅30倍,互联带宽在20年内也仅增长30倍,都远远低于硬件算力的增长。

封建胜表示,互联带宽和硬件算力之间的鸿沟越来越大,是困境、是挑战,更是机遇。封建胜认为,高性能计算是未来光通讯的重要增量场景。在过去的一年中,腾讯研发了第一台25.6T CPO交换机,在端口密度、功耗、延迟等方面都有收益,为高性能计算网络的建设奠定了基础。更进一步,硅光将光电转化部件移动到主要的电芯片近端,利用光I/O代替电I/O,实现互连带宽的快速增加,可能突破Memory Wall,“这个技术方向是我们非常看好的。”

在未来,腾讯将探索硅光在数据中心的更多应用,400G BR4或800G BR8规格是腾讯目前正在摸索的一个方向。

硅光在数据中心的另一应用场景,就是当前主流计算技术消耗了太多能量,能效低。2016年AlphaGo横空出世,全世界都在感慨人工智能、机器学习的强大,但却忽略了背后的能效比较。AlphaGo的功耗是150千瓦,而人脑的功耗约为20瓦,两者相差超7000倍。其根本原因在于,主流计算机采用的是冯·诺伊曼架构,存在冯·诺伊曼瓶颈。

最近几年很多初创公司在开发近程计算芯片,积极探索如何解决这一瓶颈。封建胜认为,最好的解决方案是存在一体,相比于电存算一体,光存算一体同样值得探索和研究。光计算具有高带宽、信息吞吐量大的特点,国内外也有不少初创公司在开发相关产品,但是数据还是存储在电学领域,需要大量的光电、电光转换,“或许当光学忆阻器成熟的时候,硅光在光计算上可以发挥其全部优势。”封建胜说。

(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )