Grok 4：挑战人类知识极限

科技前沿 2025/07/14 10:34 管理员

原创内容，转载请注明出处。

Grok 4于2025年7月9日正式发布，是该系列迄今最先进的一代模型，发布会直播曝光其性能优于主要竞争对手，号称“超越大多数博士生”的思考能力。

Grok 4标志着xAI在算法和硬件上的大幅升级，其训练依靠位于Tennessee的Colossus超级计算机（约200,000张NVIDIA GPU）；拥有标准版Grok 4和多代理协作的Grok 4 Heavy版本，后者通过多个AI agent并行工作模拟“学习小组”，可解决更复杂问题；支持超大上下文窗口（API支持最高256,000 token）并具备文本+图像处理功能，集成“Eve”语音助手，拥有英式嗓音与唱歌能力。

在新推出的“Humanity’s Last Exam”（2500道PhD级跨学科试题）中，Grok 4在无工具环境下得分约25.4%，使用工具后重启至38.6%；Grok 4 Heavy则可达约44.4%的高分，领先GPT‑4‑style模型与Gemini‑Pro，表现强劲；在ARC‑AGI‑2、GPQA、AIME等数学、科学类测试中，Grok 4的表现也接近或超过主要竞争对手。

Grok 4 Code：专为开发者设计的编程模型，擅长代码生成、调试及优化，在SWE-Bench编程评测中成绩优异（约72‑75%）；实时DeepSearch功能可通过X平台或网络获取最新数据；具备文本摘要、市场趋势分析、新闻实时追踪等实时应用能力。Grok 4应于特斯拉FSD上，响应速度也提升了近40%。

xAI宣称Grok 4有望成为学术与研发领域的思考型AI助力工具，未来甚至可用于科学发现、自动研究协作等高级任务。替代人类搞科研，并帮助人类在科学研究领域取得突破，指日可待！

魔兜科技祝您：新春快乐！

OpenAI正式发布GPT-5

电话

邮箱

3 小时

1 对 1

99 %