Grok 4:挑战人类知识极限
科技前沿 2025/07/14 10:34 管理员
原创内容,转载请注明出处。
Grok 4:挑战人类知识极限

Grok 4于2025年7月9日正式发布,是该系列迄今最先进的一代模型,发布会直播曝光其性能优于主要竞争对手,号称“超越大多数博士生”的思考能力。

Grok 4标志着xAI在算法和硬件上的大幅升级,其训练依靠位于Tennessee的Colossus超级计算机(约200,000张NVIDIA GPU);拥有标准版Grok 4和多代理协作的Grok 4 Heavy版本,后者通过多个AI agent并行工作模拟“学习小组”,可解决更复杂问题;支持超大上下文窗口(API支持最高256,000 token)并具备文本+图像处理功能,集成“Eve”语音助手,拥有英式嗓音与唱歌能力。

Grok 4发布会

在新推出的“Humanity’s Last Exam”(2500道PhD级跨学科试题)中,Grok 4在无工具环境下得分约25.4%,使用工具后重启至38.6%;Grok 4 Heavy则可达约44.4%的高分,领先GPT‑4‑style模型与Gemini‑Pro,表现强劲;在ARC‑AGI‑2、GPQA、AIME等数学、科学类测试中,Grok 4的表现也接近或超过主要竞争对手。

Grok 4 Code:专为开发者设计的编程模型,擅长代码生成、调试及优化,在SWE-Bench编程评测中成绩优异(约72‑75%);实时DeepSearch功能可通过X平台或网络获取最新数据;具备文本摘要、市场趋势分析、新闻实时追踪等实时应用能力。Grok 4应于特斯拉FSD上,响应速度也提升了近40%。

Grok 4性能介绍

xAI宣称Grok 4有望成为学术与研发领域的思考型AI助力工具,未来甚至可用于科学发现、自动研究协作等高级任务。替代人类搞科研,并帮助人类在科学研究领域取得突破,指日可待!