20万GPU缔造“神话”？马斯克的“地球上最聪明AI”Grok-3震撼登场｜科技观察

封面新闻记者边雪

在人工智能领域，一个新的里程碑被树立了。

北京时间2025年2月18日，埃隆·马斯克（Elon Musk）领导的xAI团队，成功发布了被他称为“地球上最聪明的AI”——Grok-3。

得益于前所未有的20万块GPU的训练资源，这款AI模型在多个国际榜单上迅速崭露头角。凭借其强大的推理能力、多模态分析能力以及深度搜索功能，迅速在多个基准测试中刷新纪录，超越了包括o3-mini（high）和DeepSeek-R1在内的诸多竞争对手，引发了全球科技界的广泛关注。

在这场加速上演的AI竞赛中，Grok-3是否已经到达了马斯克口中的“最聪明”？

“大模型在它达到真正的超级智能之前，应该都是两条路：一条是通用，让每个人都能用上一个高质量的人工智能；另外一条，就是在各领域中加上自己的知识库，做垂类大模型来适应于不同行业。”清华大学新闻与传播学院/清华大学人工智能学院双聘教授沈阳告诉封面新闻记者，“如果大模型能够达到超越人类已知‘聪明’最高程度时，行业大模型和通用大模型就合二为一了。”

20万块GPU的训练规模与算力投入

Grok-3的诞生，标志着AI计算能力的全新时代。

封面新闻记者注意到，Grok-3的训练规模堪称史无前例，xAI公司动用了20万块英伟达GPU，构建了全球最大的超算集群Colossus。这一训练过程分为两个阶段：第一阶段使用10万块GPU，耗时122天；第二阶段扩展至20万块GPU，耗时92天。如此庞大的算力投入，使得Grok-3的训练计算量达到前代Grok-2的10倍。

Grok-3的训练数据集极其庞大，包括了合成数据、公共网络数据以及专有数据，旨在增强模型的推理能力、解决复杂问题和理解人类语言的深度。马斯克在直播中强调，Grok-3不仅是性能上的提升，更是一个在设计理念上的突破，它能够在推理过程中进行“自我反思”，这意味着AI可以识别并纠正错误，从而减少“幻觉”（hallucinations）现象。

“Grok-3在代码生成和调试上的表现让我惊叹，它不但能写出高效的代码，还能指出可能的漏洞和优化点，在使用感受上确实优于此前的大模型。”作为第一批“吃螃蟹的人”，软件开发者李子明在体验过Grok-3后告诉封面新闻记者。

在发布会上，xAI团队展示了Grok-3如何通过“Think”模式生成复杂的3D动画代码，模拟从地球发射飞船到火星并返回的完整过程。这一任务涉及大量数学和物理计算，Grok-3不仅成功完成，还展示了其思维过程，体现了极高的逻辑一致性。此外，Grok-3在多模态分析方面也表现出色，能够处理文本、图像、代码等多种数据类型，展现了其作为通用人工智能的潜力。

值得注意的是，Grok-3还引入了深度搜索（DeepSearch）功能，允许用户通过互联网进行深入研究，并生成详细、合理的答案。这一功能不仅提高了信息检索的效率，还增强了用户对搜索过程的控制力。此外，Grok-3的智能体能力使其能够自主执行复杂任务，例如规划太空任务轨迹或开发混合游戏，展现了AI在现实世界中的应用潜力。

除了利用先进的算法和超大规模计算资源，推动Grok-3成为“全球最智能”的AI，离不开背后的智囊团。

封面新闻记者注意到，Grok-3的研发团队由xAI公司的一群顶尖AI专家组成，团队核心成员包括首席工程师Igor Babuschkin，曾在Google DeepMind任职，带来了丰富的深度学习经验；科学家Toby Pohlen和Greg Yang，在数学和深度学习方面有深厚的造诣。此外，Grok-3研发团队也汇集了来自Tesla、OpenAI和微软等公司的技术人才，如Jay Nordeen曾在Tesla担任技术项目经理，专注于超计算。

Grok-3在多项AI基准测试中表现优异

Grok-3和其家族成员——Grok-3 mini、Grok-3 Reasoning（Beta）、Grok-3 mini Reasoning，在多个知名AI基准测试中表现出色。特别是Grok-3 Reasoning，展示了其在数学、科学和编程问题上的强大推理能力，超越了o3-mini（high）和DeepSeek-R1。

Grok-3的出色不仅在理论上，实际应用中也证明了其领先地位：在美国数学专业能力测试（AIME 2025）中，Grok-3取得了93分的高分，远超其他模型。此外，Grok-3的推理模型Grok-3 Reasoning在逻辑一致性测试中也表现突出，击败了o3-mini和DeepSeek-R1；在LiveCodeBench平台上，Grok-3的代码编写和问题解决能力显著领先。

Grok-3的发布进一步加剧了AI领域的竞争。OpenAI即将推出GPT-4.5和GPT-5，而谷歌的Gemini系列也在不断迭代。Grok-3凭借其强大的推理能力和深度搜索功能，正在挑战这些巨头的市场地位。马斯克甚至表示，Grok-3的推理能力“优于目前所有已发布的产品”，这无疑为AI领域的竞争增添了新的变数。

Grok-3能成为“理解宇宙的工具”吗？

马斯克在发布会上提到，Grok-3是“理解宇宙的工具”，这不仅仅是AI技术的进步，更是人类探索未知世界的一把钥匙。未来，Grok系列模型将继续进化，目标是帮助人类更深入地理解宇宙的奥秘，同时解决地球上的一些最棘手的问题。

Grok-3的商业化策略也相对保守，不同于DeepSeek-R1上线即开放给所有用户使用，Grok-3目前仅面向X平台的Premium Plus用户开放，订阅费用为每月40美元。在Grok-3上线后，封面新闻记者更新网页仍只能使用Grok-2。

马斯克在发布会上透露，Grok-3将在几个月后全面开源。这一举措不仅有助于吸引开发者参与生态建设，还可能推动AI技术的普及和创新。xAI还计划成立AI游戏工作室，进一步探索Grok-3在内容创作和娱乐领域的应用。

封面新闻记者注意到，xAI还推出了SuperGrok订阅服务，提供深度搜索和思考模型等高级功能。这一策略既保证了Grok-3的高端定位，也为未来的市场扩展留下了空间。

尽管Grok-3在性能上取得了显著突破，但其训练成本和能耗问题仍是未来需要解决的挑战。xAI团队表示，他们正在研究如何降低数据中心的能耗，并计划在未来推出更高效的模型。此外，Grok-3的深度搜索和智能体能力也为其在金融、医疗等领域的应用提供了广阔的前景。

“随着发布ChatGPT O3、Grok-3等新版本的发布，中美在AI领域的博弈将进入新阶段。”沈阳教授告诉封面新闻记者：“我们期待中国AI在这一过程中继续超越，并推动全球开源知识共享的理念实现。”

评论 22

打开微信“扫一扫”，打开网页后点击屏幕右上角分享按钮