马斯克全新发布Grok3模型坐拥20万张卡的新王
分享
最新发布:xAI,Grok 3
刚刚,马斯克所说的“地表最强的 AI”终于来了。
在 200 多万人的见证下,马斯克的 AI 公司 xAI 正式推出 Grok 3!

“我们非常高兴能够推出 Grok 3,我们认为,在很短的时间内,它的功能比 Grok 2 强大一个数量级。这要归功于一支不可思议的团队的辛勤工作,我很荣幸能与这样一支优秀的团队合作。”马斯克在发布会上说道。
插个题外话,为什么取名 Grok,马斯克是这么说的:
Grok 这个词来自罗伯特·海因莱因的小说《异乡异客》(Stranger in a Strange Land)。这是一个火星词,意思是充分而深刻地理解某事。
Grok 真的以极其 夸张的速度进行迭 代 。 。
而这背后,离不开强大的算力与训练方式。
Grok 3 由 Colossus 超级计算机训练完成,这台计算机是在短短八个月内建成的,搭载了 10 万颗英伟达 H100 GPU,提供了超过 2 亿 GPU 小时的计算资源——是 Grok 2 的 10 倍。
同时,在训 练方法上,xAI 采取了一些新的策略来优化 Grok 3 的能力,包括合成数据集、自我纠错机制和强化学习。

xAI 最开始搭建这个 10 万 GPU 集群(全球最大的全连接 H100 集群)用了 122 天,后续拓展到 20 万集群仅用了 92 天。
再摆一个数据:
Grok 3 的算力消耗是 De epSeek-V3 的 263 倍。
马斯克真的凭着钞能力追到了第一梯队。。
铺垫了这么多,接下来进入正题, 我们来聊一聊 Grok 的能力 。
根据发布会的顺序:Grok 3、Grok 3 Reasoning、Agents。
一、首先是不带推理能力的 Grok 3。

Grok 3 和 Grok 3 mini 在数学、科学和编程基准测试「AIME'24(一个高水平的数学竞赛)、GPQA(一个研究生水平的科学知识测试)、LCB Oct-Feb(编程能力测试)」上超越了所有主流模型,包括 GPT-4o、Claude 3.5 Sonnet、De epSeek-V3 和 Gemini-2 Pro 等。
二、接下来是带推理能力的 Grok 3 Reasoning。
令人印象最深刻的是一个模拟航天器的任务,生成一 个地球发射、火星着陆以及利用霍曼转移轨道返回地球的动画 3D 代码。
这个问题的难点在于,过程中涉及到了大量数学和物理模型的计算。在此之前,团队从未试过让大模型去计算航天的发射窗口。
Grok 3很快生成了完整可运行的3D动画。 以下是 3D 动画的画面,直观展示了任务过程中,太阳、地球、火星和飞船之间的位置关系。
研究者经过检查后表示:Grok-3 给的答案完全正确!
马斯克还说,这就是SpaceX真正的探索轨道。他充满信心地表示,两年内,地球和火星就会被连接在


共有 0 条评论