收藏本站 | RSS订阅你身边的知识朋友
你现在的位置:首页 » 数码科技 » 正文
09月26日

未来互联网的发展趋势,人工智能终将成为核心技术

作者 : templebaike | 分类 : 数码科技 | 超过 142 人围观 | 已有 0 人发表了看法
人工智能无疑是世界上最热门的技术,也成为半导体行业最热门的新市场。在人工智能技术中,似乎最具影响力的技术将是大模型技术,其核心特征是通过使用巨大规模的模型(参数可以达到数百亿到数千亿数量级)和对海量数据的训练,实现人工智能能力的突破,实现新的应用。ChatGPT就是一个很好的例子,它从去年年底开始获得大量关注;在未来,大型模型的复杂性有望进一步提高,以满足应用的需求。 大型模型的训练和部署需要强大的硬件支持,这也是芯片成为人工智能时代核心技术的原因,因为大型模型所需的计算能力归根到底来自芯片,而人工智能市场的发展极大地推动了芯片产业的市场规模,以及相关芯片技术的演进。

在给人工智能大模型提供足够的算力用于训练和部署的核心芯片技术中,数据互联正在占据越来越重要的位置。芯片互联越来越重要主要出于两个原因:

首先,随着大规模模型的参数数量和训练数据容量的迅猛增长,最新的大模型的训练和部署一定会依赖于分布式计算。这是因为单一计算机几乎无法提供足够的计算能力来运行庞大的模型。分布式计算通过增加计算节点数量来提高理论计算能力,然而实际情况由于节点间数据交互需要额外的开销,计算能力的增长只能接近线性而非真正的线性。换句话说,随着模型规模的增大,所需的分布式节点数量也随之增加,对于分布式计算中节点间数据交互的需求(如带宽、延迟和成本等)也随之增加。否则,这种数据交互将成为整个计算过程的瓶颈,影响计算效率。 其次,从芯片角度考虑,随着摩尔定律逐渐接近物理极限,目前高级封装技术中的芯片粒(chiplet)已成为提升芯片性能的重要手段。通过将复杂的大芯片系统分割成多个小芯片粒,每个芯片粒都可以采用最适合的工艺独立生产,从而确保复杂的芯片系统可以以合理的成本和良率进行制造。对于人工智能大模型而言,所使用的训练和部署芯片规模非常庞大,因此chiplet技术将成为支持人工智能芯片的核心技术。在chiplet方案中,多个芯片粒之间的数据通信也需要高效的数据互联技术。换句话说,高带宽、高密度的数据互联将成为基于chiplet构建的人工智能加速芯片的核心组件。 综上所述,在人工智能时代,数据互联将成为核心技术。其中最关键且具备最大发展潜力的数据互联方案包括用于分布式计算的中长距离数据互联和用于chiplet场景的超短距离数据互联。

用于分布式计算的数据互联:硅光子技术成为关键

人工智能大模型的分布式计算,包括训练和部署,通常都在数据中心中完成。我们在数据中心数据互联中看到两个重要趋势,即常规长距离通信的进一步规模化,以及新的短距离应用的崛起。

在常规的长距离数据中心数据互联领域,目前为了满足人工智能等应用的需求,互联速度正在快速提升,从今天主流的100/200/400Gbps光互联技术快速进展到800Gbps光互联技术,而到2026年更是预期会使用上1.6Tbps光数据互联。除了数据率提升之外,在人工智能时代,数据中心中每台服务器上对于数据互联的需求也在提升,因此单台服务器会需要更多的光数据互联模块。与传统的分立式光互联模块相比,基于硅光技术的光互联模块能实现更高的集成度:在硅光技术中,波导器件、光栅和调制器等核心模块都可以集成在同一块芯片上,从而可以大大降低光互联模块的成本,这对于人工智能应用来说是一个重要优势,因为训练大模型中需要大量的高带宽数据互联同时也不能提高太多成本。

随着对于数据互联带宽的要求进一步提升,数据中心中的光互联带宽也需要进一步提升,功耗则需要进一步降低,而从这个角度,硅光子技术搭配共封装光学(co-packaged optics,CPO)也会成为下一代光互联带宽和功耗优化的核心技术。

在共封装光学技术中,使用硅光子技术实现的光互联模块和使用传统CMOS技术实现的数字逻辑(例如光互联模块后接的网络模块)将会使用高级封装技术集成在同一个封装里——而在传统的实现中,光互联模块和其他CMOS芯片并不会集成在同一个封装里。通过使用共封装光学技术,光互联模块和其他芯片之间的互联距离大大缩小,从而减小了光互联模块与电信号接口的信号传输衰减,而这对于超高带宽通信至关重要,因为在这些超高数据率的应用中,真正限制数据率的往往不是光信号,而是光信号在转换成电信号之后的信号衰减(即last-mile问题)。另一方面,通过减小信号衰减,光互联模块的整体功耗可以减小。而共封装光学是基于硅光技术之上的,因为传统的分立式光模块因为体积太大,无法使用共封装光技术和其他芯片集成到同一个封装里。

除了目前已经为人熟知的数据中心中长距离光互联模块之外,在人工智能时代将会崛起的另一个光互联技术将是计算集群中的中短距离光互联。如前所述,在大模型时代,分布式计算将会得到广泛应用,而在具体的大规模分布式计算拓扑结构中,常用的结构就是首先由物理位置相邻的服务器组成一个集群(cluster),在这样的计算集群中执行需要大量数据交换的任务,而计算集群之间再使用长距离数据互联连接在一起以提升计算规模。在这样的计算集群中,目前常规的数据互联是使用铜绞线的互联;但是随着对于数据带宽、延迟和功耗的需求越来越高,使用在计算集群中的光互联正在成为越来越重要的技术路径。

与长距离通信不同,计算集群间的数据互联需要延迟极低、功耗也较低,但是由于互联距离较小(即色散效应较小)因此可以允许更多的波分复用,因此光互联可以考虑多个波分复用信道,每个信道的数据率较小(例如16-64Gbps),这样做可以尽可能减小对于数字矫正技术的依赖(使用数字矫正技术将会提升延迟,同时也增加功耗),以满足对于功耗和延迟的需求。此外,在计算集群中,我们会预期光模块和CMOS芯片(例如GPU或者HBM)更紧密地集成在一起,因此在共封装光学CPO技术之上,我们可能会看到集成度更高的晶圆级共封装光学(WL-CPO)技术,该技术可以为光学互联模块和CMOS芯片之间提供更多互联接口,从而进一步增加通信带宽。

用于chiplet的超短距离数据互联

除了长距离光互连之外,另一个人工智能时代的重要数据互联技术是用于chiplet之间通信的超短距离数据互联。 摩尔定律接近物理极限,采用chiplet实现复杂芯片系统已成业界共识。在人工智能时代,随着对算力需求的提高,单芯片系统将使用越来越多的chiplet,从而导致chiplet之间的通信需求日益增加。长距离光通信数据互联的主要发展方向是新型封装技术,例如共封装光学技术。相比之下,超短距离chiplet数据互联的发展更多依赖于电路设计和系统设计。chiplet对于数据互联需求主要集中在两个方向: 1. 提高数据带宽和通信距离(从毫米级提升到厘米级)以及更严格的功耗要求。 2. 对通信协议的复杂要求。 首先看第一个方向,这方面要求chiplet数据互联的电路设计满足不断增长的需求。随着chiplet数量和系统复杂度的增加,chiplet之间的互连距离也会变长,这导致互联线上的信号衰减增大,因此需要更强的收发机。另一方面,随着人工智能对chiplet间数据通信带宽的要求提高,每个chiplet上的数据互联模块数量也会增加。然而,为了满足总功耗的限制,单个数据互联模块的功耗不能过大。此外,由于数据互联需求迅速增长,单个数据互联模块的芯片面积也不能太大,以满足chiplet上总互联接口的需求。因此,chiplet数据互联电路的关键指标包括能效比(J/bit),用于衡量数据传输速率与功耗之间的关系;以及数据率密度(bit/s/mm),用于衡量数据传输速率与芯片面积之间的关系。随着chiplet数据互联需求的增加,我们预计未来将实现更高的数据率密度和更好的能效比。 第二个方向是通信协议的需求,涉及到chiplet之间协同工作的方式。例如,在处理器系统中,需要解决chiplet之间缓存一致性的问题。未来,随着chiplet系统的复杂性增加,通信的复杂度也会增加,甚至可能将当前网络层次结构(NoC)的模式应用于chiplet之间。这对于chiplet数据互联IP的设计提出了新的发展方向。 总的来说,随着人工智能相关需求的增加,chiplet的数据互联在芯片IP领域将变得越来越重要。具体的技术方向将在电路设计的优化和系统/传输协议复杂度的提升方面不断演进。
上一篇:还在直接下锅炖豆腐?白菜炖豆腐这样做,轻松上手 下一篇:大揭秘!能用户多元化需求的新兴应用,支付宝小程序开发
640*60广告位

相关文章

额 本文暂时没人评论 来添加一个吧

发表评论

必填

选填

选填

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。