谷歌最强 Gemini 2.5 Pro 免费了！数学碾压人类研究生-AI Spot

【本文要点】
Gemini 2.5 Pro被认定为当前最佳的大模型，智商达到130，在数学方面表现优异，超越许多研究生。它在各类基准测试中表现突出，包括门萨IQ测试和MathArena测试，且在哈佛-麻省理工大学数学竞赛中领先对手15%。现在，谷歌已向所有Gemini用户免费推出该模型的实验版。尽管有速率限制，高级用户享有更好的访问权限。社区普遍认为，谷歌的Gemini在大模型竞争中已明显超越OpenAI与Anthropic。此外，Gemini 2.5 Pro的编程能力强大，可以模拟复杂情况，其代码质量被广泛认可。

【正文】

【新智元导读】如今，有越来越多的网友发现，Gemini 2.5 Pro已经成为全球大模型中名副其实的冠军，刷爆各类基准测试和智商测试！它的智商达到130，其中数学方面已经强于大多数研究生，甚至几句提示，就能模拟宇宙规律。虽然又被GPT-4o吉卜力生图的光芒掩盖了，但毫无疑问，上周的另一技术核弹Gemini 2.5 Pro，也是无可争议的强！在试用过程中，网友们逐渐发现，这个模型真的强到发指。在门萨Norway的IQ测试中，它已经突破了130。

图片[1]-谷歌最强 Gemini 2.5 Pro 免费了！数学碾压人类研究生-AI Spot

随后，更硬核的证据来了——在MathArena测试中，它直接获得了第一名！

注意，这里用的基本都是LLM从未见过的题。

图片[2]-谷歌最强 Gemini 2.5 Pro 免费了！数学碾压人类研究生-AI Spot

在哈佛-麻省理工大学数学竞赛（HMMT）中，领先第二名15%

图片[3]-谷歌最强 Gemini 2.5 Pro 免费了！数学碾压人类研究生-AI Spot

AIME 2025 I和AIME 2025 II是今年美国全国数学奥林匹克竞赛的选拔赛

它在数学方面已经比大多数研究生要强，这已经是一个可以公开验证的事实。

在这位网友统计的AI模型能力表上，Gemini的领先趋势已经非常明显。

图片[4]-谷歌最强 Gemini 2.5 Pro 免费了！数学碾压人类研究生-AI Spot 图片[5]-谷歌最强 Gemini 2.5 Pro 免费了！数学碾压人类研究生-AI Spot

Gemini 2.5 Pro (exp)，免费用户也能用

好消息是，现在所有用户都能用上Gemini 2.5 Pro了。

就在今天，谷歌官宣：向所有Gemini用户，推出Gemini 2.5 Pro实验版！

而且，还是全免费。

图片[6]-谷歌最强 Gemini 2.5 Pro 免费了！数学碾压人类研究生-AI Spot

唯一美中不足的是，Gemini 2.5 Pro目前还会有速率限制。

但Gemini Advanced用户，就可以享有更高级的访问权限，和更大的上下文窗口。

图片[7]-谷歌最强 Gemini 2.5 Pro 免费了！数学碾压人类研究生-AI Spot

在上周三刚刚发布时，Gemini 2.5 Pro，还仅仅面向Gemini Advanced订阅者开放，订阅价格为每月19.99美元。

图片[8]-谷歌最强 Gemini 2.5 Pro 免费了！数学碾压人类研究生-AI Spot

而随后，模型还会被推广到安卓和iOS应用上。

目前尚不清楚，谷歌是否会将2.5 Pro的稳定版本免费提供给所有Gemini用户，还是说今天的举措仅针对测试阶段。

在此之前，似乎2.0 Flash Thinking和2.0 Flash都将是免费提供的版本。

社区网友公认：大模型赛，谷歌已经领先了

AI社区Reddit上的网友们公认：在客观上，谷歌的模型已经领先了。

或许是有史以来第一次，OpenAI明确处于落后地位，Anthropic也是如此。

虽然凭吉卜力表情包抢了风头，但这种廉价的伎俩只会在短期内有用。在大模型赛中，局面已经从根本上改变了。

细数LiveBench、LMSYS、人类最后的考试、智商测试，几乎一切投票都表明，Gemini是无可争议的领军者。

图片[9]-谷歌最强 Gemini 2.5 Pro 免费了！数学碾压人类研究生-AI Spot 图片[10]-谷歌最强 Gemini 2.5 Pro 免费了！数学碾压人类研究生-AI Spot

有媒体表示谷歌Gemini 2.5 Pro是最聪明的模型

根据Artificial Analysis的评估，Gemini 2.5在大部分测试中都遥遥领先，成绩排名第一。

同时，输出速度仅次于 Gemini 2.0 Flash，位列第二。

图片[11]-谷歌最强 Gemini 2.5 Pro 免费了！数学碾压人类研究生-AI Spot

当然，如果从原理上看，LLM的确没有在做数学，因为它们的本质仍然是概率性的，是做从训练数据中预测最可能的答案。

图片[12]-谷歌最强 Gemini 2.5 Pro 免费了！数学碾压人类研究生-AI Spot

最强编程模型：模拟宇宙都可以

谷歌的技术主管Addy Osmani，表示Gemini 2.5 Pro是谷歌最好的编程模型，而且免费！

图片[13]-谷歌最强 Gemini 2.5 Pro 免费了！数学碾压人类研究生-AI Spot

他给出了一段Gemini制作的3D飞行小游戏。

只需提示一次，Gemini 2.5 Pro可以在Three.js中的物理模拟！

多次提示，还可以改进编程效果。

开源链接：https://github.com/gemsjohn/physics-sims

网友Gadgetify直接复刻了自己「宇宙模拟器」，只需几次提示。

建立AI智能体DAIR.AI的elvis，则认为Gemini 2.5 Pro是Claude 3.7 Sonnet的最强对手。

Gemini 2.5 Pro是一款优质代码模型：

· 代码质量真的很好

· 1M个token的上下文

· 原生多模态

· 长代码生成

· 理解大型代码库

利用Gemini和Windsurf，他生成了AI搜索代理应用。

不少网友体验Gemini 2.5 Pro编程之后，表示Claude的确危险了！

图片[14]-谷歌最强 Gemini 2.5 Pro 免费了！数学碾压人类研究生-AI Spot 图片[15]-谷歌最强 Gemini 2.5 Pro 免费了！数学碾压人类研究生-AI Spot 图片[16]-谷歌最强 Gemini 2.5 Pro 免费了！数学碾压人类研究生-AI Spot

初步的编码测试中的结果显示，Gemini 2.5 Pro把行业水平提升了一个档次。

图片[17]-谷歌最强 Gemini 2.5 Pro 免费了！数学碾压人类研究生-AI Spot

对此，「AI智能体先驱」的创始人Silas Alberti，表示编程助手Devin正在引入Gemini 2.5 Pro。

而从事SEO行业的Julian Goldies放出Gemini 2.5 Pro MCP Servers教程，让智能体自动化一切。

图片[18]-谷歌最强 Gemini 2.5 Pro 免费了！数学碾压人类研究生-AI Spot

甚至，有人用Gemini 2.5 Pro测试了一个项目，使用A*算法为高速列车寻找最优解，这个过程中涉及了优化坡度、转弯半径、多目标优化等难题。

令人惊喜的是，虽然它经常搞乱语法，比如试图把所有代码压缩到一行，但它完成了不少高质量的工作。

图片[19]-谷歌最强 Gemini 2.5 Pro 免费了！数学碾压人类研究生-AI Spot 图片[20]-谷歌最强 Gemini 2.5 Pro 免费了！数学碾压人类研究生-AI Spot

参考资料：https://artificialanalysis.ai/models/gemini-2-5-prohttps://x.com/petergyang/status/1906007718961492391https://x.com/QiaochuYuan/status/1905967688310268168https://x.com/omarsar0/status/1906404825509560408

https://x.com/renderfiction/status/1905998185962643767https://x.com/GeminiApp/status/1906131622736679332https://x.com/silasalberti/status/1905826070370144450https://www.reddit.com/r/singularity/comments/1jnbtu2/testing_gemini_25_pro_with_a_project_a_algorithm/

【新闻来源】

文章版权归作者所有，未经允许请勿转载。

THE END

AI 资讯

谷歌最强 Gemini 2.5 Pro 免费了！数学碾压人类研究生

请登录后发表评论