正文内容
2025年7月10日,马斯克旗下xAI公司推出的Grok-4系列模型,以“地表最强AI”之姿引发全球关注。这款跳过3.5版本直接迭代的模型,被马斯克称为“在所有学科领域超越博士级通才”的存在。
核心性能数据:
基准测试碾压级表现:在被誉为“人类终极考试”(HLE)的跨学科测试中,Grok-4 Heavy版本得分44.4%(使用工具后达50.7%),远超谷歌Gemini 2.5 Pro的21%;美国数学邀请赛(AIME)满分,研究生物理问答(GPQA)得分87-88%,与OpenAI的GPT-4o、谷歌Gemini 2.5 Pro并列顶尖。
多智能体协作架构:Grok-4 Heavy支持多AI代理并行任务,通过交叉验证模拟人类团队协作,在复杂问题解决中展现更高鲁棒性。
推理能力升级:采用“第一性原理”逻辑,训练计算量是前代Grok-2的100倍,强化学习算力投入达其他模型的10倍以上,实现从“规模堆砌”到“深度推理”的质变。
Grok 3是什么
Grok 3是人工智能初创公司xAI团队研发的第三代大语言模型。2025年2月18日正式发布,同步发布的还有名为Deepsearch的Grok 3智能搜索引擎。