
2025 年 7 月 10 日,特斯拉首席执行官埃隆・马斯克旗下的 xAI 公司正式发布了 Grok 4,马斯克宣称其为全球最强 AI 模型,在处理学术问题上的表现已达博士级别。
Grok 4 系列包含 Grok 4 和 Grok 4 Heavy 两个纯推理模型。其中,Grok 4 是单代理版本,订阅费为每月 30 美元;Grok 4 Heavy 为多代理版本,支持四个代理同时工作,上下文窗口最高支持 256k tokens,其订阅费用为每月 300 美元。
xAI 官方表示,Grok 4 在自然语言、数学和推理方面的性能无与伦比,是用户的最佳选择。据 xAI 的内部基准测试结果,Grok 4 在涵盖多学科的 Humanity’s Last Exam 考试中,仅通过文本输入就达到了约 25% 的正确率,虽与 OpenAI 的 Deep Research 工具此前公布的成绩相近,但 xAI 强调两者测试方式不同。而在其他测试中,Grok 4 的表现更是令人惊叹。其在 AIME 25 测试中,Grok 4 Heavy 取得了 100% 的满分;在 GPQA 测试中,得分高达 88.9%,超越了所有对手。
Grok 4 的强大性能得益于其强大的算力支持与独特的技术架构。据悉,Grok 4 的训练是在拥有超过 20 万张 H100 GPU 的超级计算机集群上完成的,相比 Grok 2,训练量提升了 100 倍。同时,Grok 4 Heavy 采用了多智能体协作机制,遇到复杂问题时,内部智能体会从不同角度思考,再通过 “比较笔记” 环节整合出最佳答案。
此外,Grok 4 还新增了五种声音模式,反应速度较早期几乎缩短了一半。为应对 GPT‑4 系列和 Meta Gemini 在编码领域的竞争,Grok 4 加入了专门的编程模型 Grok 4 Code,能为开发者提供更专业的代码生成、调试支持。并且,Grok 4 还首次尝试具备多模态信息处理潜力,使其在社交媒体内容应用上更具优势。
不过,Grok 4 的推出也伴随着争议。其旧版本 Grok 3 曾因传播不当言论遭外界批评,若 xAI 不能在短期内提供更完善的模型安全机制,公布更透明的训练方式,Grok 4 恐难以摆脱 “高性能之下的高风险” 形象。
马斯克强调,Grok 4 的更新目标是 “成为尽可能追求真相的 AI”。他还满怀期待地设想,通过 Grok 4 与类人机器人结合,有望在今年年底或明年发现新技术,甚至新物理定律。
公开资料显示,xAI 成立于 2023 年 7 月,创始团队成员除马斯克外,还有来自谷歌 DeepMind、OpenAI 等机构的 11 名成员,其中有 4 名华人,他们曾参与过诸多知名 AI 项目,为 Grok 4 的研发奠定了坚实的人才基础。