AI大模型驱动 定制化芯片之风渐起

来源:爱集微 #AWS# #定制芯片# #AI大模型# #微软# #Arm#
11w

(文/陈炳欣)近来,亚马逊、微软、Meta、Google等科技巨头纷纷加大自研芯片投入力度,希望以此降低对英伟达的依赖。值得注意的是,受人工智能、自动驾驶等应用推动,科技巨头大多选择定制芯片,以应对自身需求。定制化芯片的重要性正在凸显。

定制AI芯片风潮渐起

在AI大模型热潮的推动下,一家独大的英伟达正在将越来越多科技巨头逼到亲自下场制造AI芯片的地步。11月28日,亚马逊云科技(AWS)在2023 re:Invent全球大会上宣布推出专为训练人工智能系统而设计的第二代AI芯片Trainium2,以及通用Graviton4处理器。据亚马逊云科技首席执行官Adam Selipsky介绍,Trainium2的性能是第一代Trainium的四倍,能源效率是其前身的两倍。相当于每个芯片可提供650 teraflops(每秒执行一万亿次浮点运算)的计算能力。由10万个Trainium芯片组成的集群可以在数周内训练出3000亿参数的大语言模型。

而在11月16日举办的Ignite开发者大会上,微软也宣布推出两款自研芯片Maia100和Cobalt100。Maia 100用于加速AI计算任务,帮助人工智能系统更快处理执行识别语音和图像等任务;Cobalt 100集成128个计算核心。两款芯片均采用台积电5nm生产,预计明年初将可用于软数据中心当中。

除亚马逊、微软之外,Meta、Google、特斯拉等英伟达的大客户今年都在投入更多资源研发AI芯片,甚至OpenAI都开始筹备芯片项目。在越来越多的企业入局大模型领域,导致对A100和H100等高端GPU的需求直线增加之下,科技巨头投入定制AI芯片的风潮也愈演愈烈。

追求芯片性能与成本

高端GPU短缺是导致科技巨头加大力度进行AI大模型芯片开发的原因之一。随着越来越多的企业入局大模型领域,越来越多大模型出炉,导致市场上对A100和H100等高端GPU的需求直线增加。OpenAI的CEO Sam Altman便曾多次抱怨算力短缺问题。而据巴伦周刊此前报道,英伟达高端GPU的交付已排到2024年。为了减少对英伟达GPU的依赖,有能力的公司纷纷加大芯片开发力度,用于创建、训练和迭代大模型产品。

那么,为何亚马逊、微软等都不约而同地走向自主开发定制芯片的道路?首要的原因之一是各大厂商希望优化芯片性能、寻求差异化方案。在摩尔定律放缓的大背景之下,以往依靠摩尔定律推动着性能效益提升的途径越来越难以为继,要想得到最佳的计算性能,必须仰仗针对特定应用和数据集合的体系架构。特别是在AI大模型领域,不同厂商均有着不同的差异化需求,越来越多公司发现,一体适用的解决方案不再能满足其计算需求

Arm 高级副总裁兼基础设施事业部总经理Mohamed Awad表示,阿里巴巴、AWS、微软这样的超大规模云服务商都开始自研芯片,最主要的目的就是为了能够把每一颗芯片的性能、效率都发挥到极致,做到最佳优化。他们会根据自己的用例、工作负载,围绕服务器、机架甚至是自己的数据中心来进行个性化定制。随着 GPTs 等技术的发展,数据量和计算量只会越来越大。通过芯片的定制,厂商可以通过优化,支持不断激增的数据量和计算量。

降低成本或许也是各大巨头的一个现实考量。根据伯恩斯坦分析师StacyRasgon的分析,如果ChatGPT的查询规模增长到谷歌搜索的十分之一,那么它最初需要大约价值480亿美元的GPU,每年还需要约160亿美元的芯片来维持运营。面对高昂的运营成本,自研定制化芯片成为科技大厂的一致选择。有分析机构表示,与采用英伟达的产品相比,微软开发代号为Athena的芯片用于大模型的处理,预计可以将每颗芯片的成本降低1/3。

未来从云端向边缘延伸

Mohamed Awad认为,未来在基础设施领域,将有越来越多的厂商采用定制化的芯片解决方案。传统的服务器系统大多采用一颗CPU通过标准总线连接多个加速器的架构模式。但在 AI 时代,这样的架构已经很难满足日益增长的数据和计算量需求,因为它无法获得足够的内存带宽。为此,越来越多的模型厂商开始选择定制芯片,以便灵活调整芯片架构,重新构建系统。

其实,定制芯片对各大科技厂商来说并不陌生。亚马逊云科技于2018年开始设计定制AI芯片,推出自研AI推理芯片Inferentia,并于2023年推出Inferentia的迭代版Inferentia 2,将计算性能提高三倍。日前,亚马逊云科技发布训练芯片Trainium2。上一代产品Trainium为2020年底推出。谷歌定制芯片的历史更早。2020年谷歌实际已在其数据中心部署了人工智能芯片TPU v4。目前谷歌将负责AI芯片的工程团队转移到了谷歌云,旨在提高谷歌云开发AI芯片的能力。

谈到定制芯片市场的未来发展,相关专家指出,随着AI大模型、汽车等热门应用的推动,定制化芯片市场还将进一步扩大,目前汽车厂商如特斯拉等已经投入定制化芯片的开发与商用。未来,定制芯片将从云端计算、HPC向边缘计算延伸。这些应用虽然可以通过通用芯片进行处理,但针对特定工作量身订制的芯片,能够在更佳的成本与功耗效率下,达到性能或功能上优化,更好满足需求。专家也表示,这个趋势对于通用芯片厂商并不十分有利。但对于IC产业链的其他厂商来说,如EDA厂商、IP厂商,以及晶圆代工厂商等,却是一个利好。

责编: 张轶群
来源:爱集微 #AWS# #定制芯片# #AI大模型# #微软# #Arm#
THE END

*此内容为集微网原创,著作权归集微网所有,爱集微,爱原创

关闭
加载

PDF 加载中...