封面新闻记者 边雪
在人工智能领域,一个新的里程碑被树立了。
北京时间2025年2月18日,埃隆·马斯克(Elon Musk)领导的xAI团队,成功发布了被他称为“地球上最聪明的AI”——Grok-3。
得益于前所未有的20万块GPU的训练资源,这款AI模型在多个国际榜单上迅速崭露头角。凭借其强大的推理能力、多模态分析能力以及深度搜索功能,迅速在多个基准测试中刷新纪录,超越了包括o3-mini(high)和DeepSeek-R1在内的诸多竞争对手,引发了全球科技界的广泛关注。
在这场加速上演的AI竞赛中,Grok-3是否已经到达了马斯克口中的“最聪明”?
“大模型在它达到真正的超级智能之前,应该都是两条路:一条是通用,让每个人都能用上一个高质量的人工智能;另外一条,就是在各领域中加上自己的知识库,做垂类大模型来适应于不同行业。”清华大学新闻与传播学院/清华大学人工智能学院双聘教授沈阳告诉封面新闻记者,“如果大模型能够达到超越人类已知‘聪明’最高程度时,行业大模型和通用大模型就合二为一了。”
20万块GPU的训练规模与算力投入
Grok-3的诞生,标志着AI计算能力的全新时代。
封面新闻记者注意到,Grok-3的训练规模堪称史无前例,xAI公司动用了20万块英伟达GPU,构建了全球最大的超算集群Colossus。这一训练过程分为两个阶段:第一阶段使用10万块GPU,耗时122天;第二阶段扩展至20万块GPU,耗时92天。如此庞大的算力投入,使得Grok-3的训练计算量达到前代Grok-2的10倍。
Grok-3的训练数据集极其庞大,包括了合成数据、公共网络数据以及专有数据,旨在增强模型的推理能力、解决复杂问题和理解人类语言的深度。马斯克在直播中强调,Grok-3不仅是性能上的提升,更是一个在设计理念上的突破,它能够在推理过程中进行“自我反思”,这意味着AI可以识别并纠正错误,从而减少“幻觉”(hallucinations)现象。
“Grok-3在代码生成和调试上的表现让我惊叹,它不但能写出高效的代码,还能指出可能的漏洞和优化点,在使用感受上确实优于此前的大模型。”作为第一批“吃螃蟹的人”,软件开发者李子明在体验过Grok-3后告诉封面新闻记者。
在发布会上,xAI团队展示了Grok-3如何通过“Think”模式生成复杂的3D动画代码,模拟从地球发射飞船到火星并返回的完整过程。这一任务涉及大量数学和物理计算,Grok-3不仅成功完成,还展示了其思维过程,体现了极高的逻辑一致性。此外,Grok-3在多模态分析方面也表现出色,能够处理文本、图像、代码等多种数据类型,展现了其作为通用人工智能的潜力。
值得注意的是,Grok-3还引入了深度搜索(DeepSearch)功能,允许用户通过互联网进行深入研究,并生成详细、合理的答案。这一功能不仅提高了信息检索的效率,还增强了用户对搜索过程的控制力。此外,Grok-3的智能体能力使其能够自主执行复杂任务,例如规划太空任务轨迹或开发混合游戏,展现了AI在现实世界中的应用潜力。
除了利用先进的算法和超大规模计算资源,推动Grok-3成为“全球最智能”的AI,离不开背后的智囊团。
封面新闻记者注意到,Grok-3的研发团队由xAI公司的一群顶尖AI专家组成,团队核心成员包括首席工程师Igor Babuschkin,曾在Google DeepMind任职,带来了丰富的深度学习经验;科学家Toby Pohlen和Greg Yang,在数学和深度学习方面有深厚的造诣。此外,Grok-3研发团队也汇集了来自Tesla、OpenAI和微软等公司的技术人才,如Jay Nordeen曾在Tesla担任技术项目经理,专注于超计算。
Grok-3在多项AI基准测试中表现优异
Grok-3和其家族成员——Grok-3 mini、Grok-3 Reasoning(Beta)、Grok-3 mini Reasoning,在多个知名AI基准测试中表现出色。特别是Grok-3 Reasoning,展示了其在数学、科学和编程问题上的强大推理能力,超越了o3-mini(high)和DeepSeek-R1。
Grok-3的出色不仅在理论上,实际应用中也证明了其领先地位:在美国数学专业能力测试(AIME 2025)中,Grok-3取得了93分的高分,远超其他模型。此外,Grok-3的推理模型Grok-3 Reasoning在逻辑一致性测试中也表现突出,击败了o3-mini和DeepSeek-R1;在LiveCodeBench平台上,Grok-3的代码编写和问题解决能力显著领先。
Grok-3的发布进一步加剧了AI领域的竞争。OpenAI即将推出GPT-4.5和GPT-5,而谷歌的Gemini系列也在不断迭代。Grok-3凭借其强大的推理能力和深度搜索功能,正在挑战这些巨头的市场地位。马斯克甚至表示,Grok-3的推理能力“优于目前所有已发布的产品”,这无疑为AI领域的竞争增添了新的变数。
Grok-3能成为“理解宇宙的工具”吗?
马斯克在发布会上提到,Grok-3是“理解宇宙的工具”,这不仅仅是AI技术的进步,更是人类探索未知世界的一把钥匙。未来,Grok系列模型将继续进化,目标是帮助人类更深入地理解宇宙的奥秘,同时解决地球上的一些最棘手的问题。
Grok-3的商业化策略也相对保守,不同于DeepSeek-R1上线即开放给所有用户使用,Grok-3目前仅面向X平台的Premium Plus用户开放,订阅费用为每月40美元。在Grok-3上线后,封面新闻记者更新网页仍只能使用Grok-2。
马斯克在发布会上透露,Grok-3将在几个月后全面开源。这一举措不仅有助于吸引开发者参与生态建设,还可能推动AI技术的普及和创新。xAI还计划成立AI游戏工作室,进一步探索Grok-3在内容创作和娱乐领域的应用。
封面新闻记者注意到,xAI还推出了SuperGrok订阅服务,提供深度搜索和思考模型等高级功能。这一策略既保证了Grok-3的高端定位,也为未来的市场扩展留下了空间。
尽管Grok-3在性能上取得了显著突破,但其训练成本和能耗问题仍是未来需要解决的挑战。xAI团队表示,他们正在研究如何降低数据中心的能耗,并计划在未来推出更高效的模型。此外,Grok-3的深度搜索和智能体能力也为其在金融、医疗等领域的应用提供了广阔的前景。
“随着发布ChatGPT O3、Grok-3等新版本的发布,中美在AI领域的博弈将进入新阶段。”沈阳教授告诉封面新闻记者:“我们期待中国AI在这一过程中继续超越,并推动全球开源知识共享的理念实现。”
评论 22
fm2147128 2025-02-20 发表于四川
阅
vamp 2025-02-19 发表于四川
学校
vamp 2025-02-19 发表于四川
看看