埃隆·马斯克宣称 Grok 3 将在获得 100,000 个 Nvidia H100 GPU 训练后变得“尤为出色”

埃隆·马斯克表示,在经过 100,000 块 Nvidia H100 GPU 的训练后,Grok 3 将成为“尤为出色”的产品。

作为 AI 的关键组件,每块 Nvidia H100 GPU 的估计成本在 30,000 至 40,000 美元之间。

目前尚不清楚马斯克的公司购买了多少块 H100,也有可能租用 GPU 计算资源。

埃隆·马斯克正在对他的 AI 聊天机器人 Grok 的后续版本进行大肆宣传。

这位亿万富翁在星期一回复了一篇在 X 上发布的帖子,称在经过 100,000 块 H100 的训练后,xAI 的聊天机器人 Grok 3 的最新版本“尤为出色”。

Grok 3 在经过 100,000 块 H100 的训练后,今年年底的表现真的尤为出色

——埃隆·马斯克 (@elonmusk) 2024 年 7 月 1 日

马斯克指的是 Nvidia 的 H100 图形处理器,又名 Hopper,它是一种 AI 芯片,有助于处理大型语言模型 (LLM) 的数据。这些芯片是人工智能发展的关键组成部分,也是硅谷的热门商品,因为科技公司竞相构建更智能的 AI 产品。

据估计,每块 Nvidia H100 GPU 芯片的售价约为 30,000 美元,尽管一些估计认为成本高达 40,000 美元。批量购买还可以享受折扣。

根据这些估计,这意味着 Grok 3 正在接受价值 30 亿至 40 亿美元的 AI 芯片的训练——但目前尚不清楚马斯克的公司是否直接购买了这些芯片。从云服务提供商那里租用 GPU 计算资源也是可能的,The Information 在 5 月报道称,马斯克的 xAI 初创公司正在与 Oracle 谈判,打算花费 100 亿美元租用云服务器。

但我们确实知道,马斯克的公司近年来一次性购买了大量 H100。据报道,特斯拉首席执行官将原本打算运往特斯拉的价值 5 亿美元的 Nvidia H100 转运到了 X。

基于 100,000 块 GPU 进行训练将比 Grok 2 有更大的进步。马斯克在 4 月份接受挪威主权基金负责人尼古拉·坦根采访时表示,Grok 2 将需要大约 20,000 块 H100 进行训练。

到目前为止,xAI 已经发布了 Grok-1 和 Grok-1.5,最新版本仅供 X(以前称为 Twitter)上的早期测试人员和现有用户使用。马斯克在 X 上发布的星期一帖子中表示,Grok 2 将在 8 月发布,并在另一篇关于 GPU 的帖子中暗示,Grok 3 将在今年年底发布。

xAI 尚未回复评论请求。

100,000 块 GPU 听起来很多——确实如此。但其他科技巨头,例如 Meta,正在积攒更多 GPU。马克·扎克伯格在 1 月份表示,Meta 将在 2024 年底前购买约 350,000 块 Nvidia H100 GPU。他还表示,Meta 将拥有约 600,000 块芯片,其中包括其他 GPU。

如果情况属实,那么 Meta 将花费大约 180 亿美元来构建其 AI 能力。

H100 芯片的积攒也加剧了去年争夺顶级 AI 人才的激烈程度。

AI 初创公司 Perplexity 的创始人兼首席执行官阿拉文德·斯里尼瓦斯谈到了被 Meta 的一名 AI 研究人员拒绝聘用的经历,部分原因是扎克伯格拥有大量 AI 芯片。

斯里尼瓦斯说:“我试图从 Meta 聘用一位非常资深的研究人员,你知道他们说了什么吗?'当你拥有 10,000 块 H100 GPU 时再来找我。'”

阅读 Business Insider 上的原文

原创文章,作者:星阁,如若转载,请注明出处:http://www.xgrl.net/n/202407040822591673.shtml

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注