2月18日消息,埃隆·马斯克旗下的人工智能初创公司xAI发布最新版Grok 3聊天机器人,同OpenAI和DeepSeek等大模型展开新一轮竞争。马斯克曾多次将Grok 3描述为“地球上最聪明的人工智能”,在上线之前便引起了业界的广泛关注。
马斯克表示,Grok 3首先面向X的Premium Plus 订阅用户开放,他们将作为首批体验者。此外,xAI还为忠实粉丝推出了名为Super Grok的独立订阅服务,提供最先进的功能和最早的新特性访问权限。
xAI表示,Grok 3的预训练已经完成,整个团队一直在积极地将推理能力整合到当前的Grok 3模型中。然而,这种集成仍处于早期阶段,需要更多的改进。Grok 3目前正在继续接受训练。
除了Grok 3推理模型外,xAI还在训练一个该推理模型的迷你版。可以将Grok 3的推理数据与迷你推理模型进行对比,有时其后者的表现甚至会略微优于Grok 3推理模型。
号称性能超越DeepSeek和ChatGPT
在发布会上,马斯克表示,xAI 之所以将其聊天机器人命名为Grok,是因为这个词源自美国科幻作家 罗伯特·海因莱因的小说 《异乡异客》(Stranger in a Strange Land)。在书中,“Grok” 由一位在火星上长大的角色使用,意指对某事物全面且深刻的理解。
马斯克和他的人工智能团队声称,Grok 3测试版的推理能力超过了现有的人工智能模型。在有关推理和测试时间的基准测试中,Grok 3取得了比DeepSeek-R1、OpenAI o1、OpenAI o3 mini- high、Gemini-2 Flash Thinking更优的效果。
根据xAI的比较基准显示,Grok 3在科学、编码和数学方面的得分高于Gemini 2 Pro、Deepseek V3、ChatGPT 4o等。并且,在盲测方面,xAI的Grok-3(早期版本) 在 lmArena 排行榜中以1402 分的历史最高成绩登顶,成为首个突破1400分的AI模型。这一成绩超越了Google、OpenAI、DeepSeek等业界主要竞品。
122天打造AI超算中心,使其性能翻倍
在演示过程中,马斯克和xAI的几位高管分享了他们如何构建Grok。马斯克透露,由于xAI希望尽快推出Grok 3,时间非常紧迫。因此,他们意识到必须在短短四个月内建成数据中心。
xAI表示,他们花了122天让首批10万颗GPU上线并运行,这是目前全球最大的全连接H100集群。随后,xAI进一步加速扩建数据中心,仅用92天便完成第二阶段建设,使计算能力再次翻倍(依此计算约有20万块GPU)。
xAI团队还展示了Grok 3如何执行有趣的任务。例如计算从地球到火星的航天器任务。Grok 3 生成了一张太空发射的动画 3D 轨迹图(即从地球到火星然后再返回地球的可行轨迹)。这涉及一些复杂的物理知识,Grok 3需要理解这些内容。
Grok 3还展示了在自动化游戏开发方面的潜力。xAI团队要求Grok 3现场创造一款融合《俄罗斯方块》和《宝石迷阵》的新游戏。Grok 3生成的Python脚本定义了游戏的常量、颜色、方块形状等元素,并呈现出独特玩法:当连接了至少三个相同颜色的方块时,会触发重力机制使方块消除,这种方式类似《宝石迷阵》。
此外,Grok 3包含一个名为Big Brain的功能,这是一个推理模型模式,允许在处理查询时进行更深入的思考。马斯克指出,17个月前,最初的Grok模型几乎不能解决高中问题,而现在它已经进步了很多,他幽默地比喻“Grok已经准备好上大学了”。
开发深度搜索功能、考虑开源Grok 2
除了推出 Grok 3 之外,xAI 还透露,该公司正在筹建一家人工智能游戏工作室,该工作室将专注于为消费者提供服务。
此外,xAI正在为Grok开发深度搜索功能(DeepSearch)。这将成为其AI智能体的核心能力之一。DeepSearch是一款推理聊天机器人,能够阐述其理解查询内容的过程以及规划回复的方式。演示显示,DeepSearch具有研究、头脑风暴和数据分析等功能。马斯克团队还表示,他们打算“尽快”推出一款基于语音的聊天机器人。
对于Grok 3是否会开源,马斯克表示,“我们通常会在新模型发布的时候,开源上一代模型,所以几个月后,我们也会对Grok 2进行开源。”
随着Grok-3不断刷新纪录,人工智能竞赛正加速升温。xAI通过强化推理能力、构建超大算力集群,并在游戏等应用领域进行实验性探索,正快速跻身DeepSeek、ChatGPT 等头部大模型的竞争行列。Grok-3 的持续迭代表明,AI竞赛不仅未见终点,反而正在进入更激烈的阶段。(腾讯科技特约编译金鹿)