美国当地时间11月28日,亚马逊云科技(AWS)在拉斯维加斯的re:Invent大会上发布了两款自研芯片Graviton4和Trainium2,并推出企业级AI聊天机器人“Amazon Q”(下称“Q”)抢占AI硬件市场。
生成式AI热潮下,尽管云计算厂商对自研AI芯片热情高涨,但英伟达GPU目前仍是企业进行AI训练及推理的算力首选。
当天,英伟达创始人兼CEO黄仁勋也穿着标志性的皮衣现身大会现场,与亚马逊云科技CEO Adam Selipsky一起宣布扩大战略合作。双方将联合推出先进的基础设施、软件及服务,包括亚马逊云科技将支持英伟达最新推出的H200 GPU,托管英伟达的人工智能训练即服务(AI-training-as-a-service)平台DGX Cloud。此外,双方正设计世界上最快GPU驱动的云AI超级计算机,配置16384颗NVIDIA GH200超级芯片,以及构建更多基于英伟达芯片的云实例等,提高生成式AI、HPC高性能计算性能。
作为此次大会的重头戏,Graviton4和Trainium2分别瞄准数据中心通用计算和人工智能训练场景。亚马逊云科技称,基于Arm架构的服务器芯片Graviton4与前一代Graviton3处理器相比,性能提升30%,独立核心增加50%以上,内存带宽提升至少75%。
而Trainium2则是面向AI大模型的高性能训练芯片,与第一代Trainium芯片相比,Trainium2训练速度提升至4倍,能够部署在多达10万个芯片的计算集群中,大幅降低了模型训练时间,同时能效提升多达2倍。
据界面新闻了解,目前最先进的大模型通常包含数千亿甚至数万亿个参数或变量,这为芯片的计算能力带来了诸多挑战,既要保证高性能、安全可靠,也要低成本。Tranium2主要强调的也是低成本、高能效和更快的训练能力。
Tranium2已有了早期客户,数据分析平台公司Databricks以及由亚马逊支持的OpenAI竞争对手Anthropic都计划使用Trainium2芯片训练大模型。
除自研定制芯片外,亚马逊云科技还推出首个基于生成式AI开发的应用——办公助手“Q”,可通过聊天方式实现辅助云端开发、服务响应、企业数据查询等功能。
Q并非面向消费市场,而是围绕企业需求设计,其定位类似于一个专家助理。但Adam Selipsky特别强调,Q不会使用企业客户数据来训练其底层模型,Q的生成结果也不会跨越不同数据权限间的防火墙。Q可以设置为仅对安全团队的相关安全问题进行响应,非公司内部或与业务无关者,无法获得安全问题答案。
事实上,在提及亚马逊云科技此前推出的Bedrock AI基础模型服务时,Adam Selipsky也重点强调了安全与隐私问题。他还“不点名”地提到了最大竞争对手微软。
“你不会希望看到云供应商受制于一家模型提供商,而是需要一个真正的选择……过去10天发生的事件已经非常清楚地表明了这一点。” Adam Selipsky说。他口中的“事件”指的是OpenAI刚刚经历的一场戏剧性的人事动荡。
re:Invent至今已举办了12年,云市场的竞争环境也增加了很多变量——尽管亚马逊云科技在公有云领域保持着领先优势,但竞争对手微软Azure凭借与OpenAI的深度合作关系,正不断扩大市场份额。
据市场调查机构Canalys公布的最新报告,亚马逊云科技今年第二季度占全球云基础设施服务(IaaS)支出为30%,同比增长12%。与去年同期相比,亚马逊云科技收入增长已减少一半以上,这也促使该公司加大对人工智能领域投资,以寻找更多增长动力。同期,微软Azure同比增长了26%,占据26%市场份额,增长率高于亚马逊云服务。而AI热潮很可能将进一步促进市场加大对微软云计算业务的支出,因为Azure承载着OpenAI和Meta等公司的AI计算需求。