【本文要点】
Gemini 2.5 Pro被认定为当前最佳的大模型,智商达到130,在数学方面表现优异,超越许多研究生。它在各类基准测试中表现突出,包括门萨IQ测试和MathArena测试,且在哈佛-麻省理工大学数学竞赛中领先对手15%。现在,谷歌已向所有Gemini用户免费推出该模型的实验版。尽管有速率限制,高级用户享有更好的访问权限。社区普遍认为,谷歌的Gemini在大模型竞争中已明显超越OpenAI与Anthropic。此外,Gemini 2.5 Pro的编程能力强大,可以模拟复杂情况,其代码质量被广泛认可。
【正文】
【新智元导读】如今,有越来越多的网友发现,Gemini 2.5 Pro已经成为全球大模型中名副其实的冠军,刷爆各类基准测试和智商测试!它的智商达到130,其中数学方面已经强于大多数研究生,甚至几句提示,就能模拟宇宙规律。虽然又被GPT-4o吉卜力生图的光芒掩盖了,但毫无疑问,上周的另一技术核弹Gemini 2.5 Pro,也是无可争议的强!在试用过程中,网友们逐渐发现,这个模型真的强到发指。在门萨Norway的IQ测试中,它已经突破了130。
![图片[1]-谷歌最强 Gemini 2.5 Pro 免费了!数学碾压人类研究生-AI Spot](https://www.aispot.com.cn/wp-content/uploads/2025/04/0656923e19type_png_size_1080_145_end.png)
随后,更硬核的证据来了——在MathArena测试中,它直接获得了第一名!
注意,这里用的基本都是LLM从未见过的题。
![图片[2]-谷歌最强 Gemini 2.5 Pro 免费了!数学碾压人类研究生-AI Spot](https://www.aispot.com.cn/wp-content/uploads/2025/04/33143c15b3type_png_size_1080_168_end.png)
在哈佛-麻省理工大学数学竞赛(HMMT)中,领先第二名15%
![图片[3]-谷歌最强 Gemini 2.5 Pro 免费了!数学碾压人类研究生-AI Spot](https://www.aispot.com.cn/wp-content/uploads/2025/04/ab9045d6b8type_png_size_1080_379_end.png)
AIME 2025 I和AIME 2025 II是今年美国全国数学奥林匹克竞赛的选拔赛
它在数学方面已经比大多数研究生要强,这已经是一个可以公开验证的事实。
在这位网友统计的AI模型能力表上,Gemini的领先趋势已经非常明显。
![图片[4]-谷歌最强 Gemini 2.5 Pro 免费了!数学碾压人类研究生-AI Spot](https://www.aispot.com.cn/wp-content/uploads/2025/04/72e9a7a362type_png_size_1080_158_end.png)
![图片[5]-谷歌最强 Gemini 2.5 Pro 免费了!数学碾压人类研究生-AI Spot](https://www.aispot.com.cn/wp-content/uploads/2025/04/df1af0861etype_png_size_1080_104_end.png)
Gemini 2.5 Pro (exp),免费用户也能用
好消息是,现在所有用户都能用上Gemini 2.5 Pro了。
就在今天,谷歌官宣:向所有Gemini用户,推出Gemini 2.5 Pro实验版!
而且,还是全免费。
![图片[6]-谷歌最强 Gemini 2.5 Pro 免费了!数学碾压人类研究生-AI Spot](https://www.aispot.com.cn/wp-content/uploads/2025/04/f9047c4a38type_png_size_1080_200_end.png)
唯一美中不足的是,Gemini 2.5 Pro目前还会有速率限制。
但Gemini Advanced用户,就可以享有更高级的访问权限,和更大的上下文窗口。
![图片[7]-谷歌最强 Gemini 2.5 Pro 免费了!数学碾压人类研究生-AI Spot](https://www.aispot.com.cn/wp-content/uploads/2025/04/4e1ec03512type_png_size_1080_231_end.png)
在上周三刚刚发布时,Gemini 2.5 Pro,还仅仅面向Gemini Advanced订阅者开放,订阅价格为每月19.99美元。
![图片[8]-谷歌最强 Gemini 2.5 Pro 免费了!数学碾压人类研究生-AI Spot](https://www.aispot.com.cn/wp-content/uploads/2025/04/e301d5972atype_png_size_1080_100_end.png)
而随后,模型还会被推广到安卓和iOS应用上。
目前尚不清楚,谷歌是否会将2.5 Pro的稳定版本免费提供给所有Gemini用户,还是说今天的举措仅针对测试阶段。
在此之前,似乎2.0 Flash Thinking和2.0 Flash都将是免费提供的版本。
社区网友公认:大模型赛,谷歌已经领先了
AI社区Reddit上的网友们公认:在客观上,谷歌的模型已经领先了。
或许是有史以来第一次,OpenAI明确处于落后地位,Anthropic也是如此。
虽然凭吉卜力表情包抢了风头,但这种廉价的伎俩只会在短期内有用。在大模型赛中,局面已经从根本上改变了。
细数LiveBench、LMSYS、人类最后的考试、智商测试,几乎一切投票都表明,Gemini是无可争议的领军者。
![图片[9]-谷歌最强 Gemini 2.5 Pro 免费了!数学碾压人类研究生-AI Spot](https://www.aispot.com.cn/wp-content/uploads/2025/04/08f957f99ctype_png_size_1080_225_end.png)
![图片[10]-谷歌最强 Gemini 2.5 Pro 免费了!数学碾压人类研究生-AI Spot](https://www.aispot.com.cn/wp-content/uploads/2025/04/7d4f6a5200type_png_size_1080_371_end.png)
有媒体表示谷歌Gemini 2.5 Pro是最聪明的模型
根据Artificial Analysis的评估,Gemini 2.5在大部分测试中都遥遥领先,成绩排名第一。
同时,输出速度仅次于 Gemini 2.0 Flash,位列第二。
![图片[11]-谷歌最强 Gemini 2.5 Pro 免费了!数学碾压人类研究生-AI Spot](https://www.aispot.com.cn/wp-content/uploads/2025/04/2d12f71649type_png_size_1080_71_end.png)
当然,如果从原理上看,LLM的确没有在做数学,因为它们的本质仍然是概率性的,是做从训练数据中预测最可能的答案。
![图片[12]-谷歌最强 Gemini 2.5 Pro 免费了!数学碾压人类研究生-AI Spot](https://www.aispot.com.cn/wp-content/uploads/2025/04/979a078987type_png_size_1080_184_end.png)
最强编程模型:模拟宇宙都可以
谷歌的技术主管Addy Osmani,表示Gemini 2.5 Pro是谷歌最好的编程模型,而且免费!
![图片[13]-谷歌最强 Gemini 2.5 Pro 免费了!数学碾压人类研究生-AI Spot](https://www.aispot.com.cn/wp-content/uploads/2025/04/8319b31e34type_png_size_1080_173_end.png)
他给出了一段Gemini制作的3D飞行小游戏。
只需提示一次,Gemini 2.5 Pro可以在Three.js中的物理模拟!
多次提示,还可以改进编程效果。
开源链接:https://github.com/gemsjohn/physics-sims
网友Gadgetify直接复刻了自己「宇宙模拟器」,只需几次提示。
建立AI智能体DAIR.AI的elvis,则认为Gemini 2.5 Pro是Claude 3.7 Sonnet的最强对手。
Gemini 2.5 Pro是一款优质代码模型:
· 代码质量真的很好
· 1M个token的上下文
· 原生多模态
· 长代码生成
· 理解大型代码库
利用Gemini和Windsurf,他生成了AI搜索代理应用。
不少网友体验Gemini 2.5 Pro编程之后,表示Claude的确危险了!
![图片[14]-谷歌最强 Gemini 2.5 Pro 免费了!数学碾压人类研究生-AI Spot](https://www.aispot.com.cn/wp-content/uploads/2025/04/7644aefac3type_png_size_1080_285_end.png)
![图片[15]-谷歌最强 Gemini 2.5 Pro 免费了!数学碾压人类研究生-AI Spot](https://www.aispot.com.cn/wp-content/uploads/2025/04/55bbc53450type_png_size_1080_345_end.png)
![图片[16]-谷歌最强 Gemini 2.5 Pro 免费了!数学碾压人类研究生-AI Spot](https://www.aispot.com.cn/wp-content/uploads/2025/04/3a9681b6f7type_png_size_1080_412_end.png)
初步的编码测试中的结果显示,Gemini 2.5 Pro把行业水平提升了一个档次。
![图片[17]-谷歌最强 Gemini 2.5 Pro 免费了!数学碾压人类研究生-AI Spot](https://www.aispot.com.cn/wp-content/uploads/2025/04/9433427ccatype_png_size_1080_170_end.png)
对此,「AI智能体先驱」的创始人Silas Alberti,表示编程助手Devin正在引入Gemini 2.5 Pro。
而从事SEO行业的Julian Goldies放出Gemini 2.5 Pro MCP Servers教程,让智能体自动化一切。
![图片[18]-谷歌最强 Gemini 2.5 Pro 免费了!数学碾压人类研究生-AI Spot](https://www.aispot.com.cn/wp-content/uploads/2025/04/02d8a7ad06type_png_size_1080_455_end.png)
甚至,有人用Gemini 2.5 Pro测试了一个项目,使用A*算法为高速列车寻找最优解,这个过程中涉及了优化坡度、转弯半径、多目标优化等难题。
令人惊喜的是,虽然它经常搞乱语法,比如试图把所有代码压缩到一行,但它完成了不少高质量的工作。
![图片[19]-谷歌最强 Gemini 2.5 Pro 免费了!数学碾压人类研究生-AI Spot](https://www.aispot.com.cn/wp-content/uploads/2025/04/5de7b084aetype_png_size_1080_292_end.png)
![图片[20]-谷歌最强 Gemini 2.5 Pro 免费了!数学碾压人类研究生-AI Spot](https://www.aispot.com.cn/wp-content/uploads/2025/04/69c2302342type_png_size_1080_123_end.png)
参考资料:https://artificialanalysis.ai/models/gemini-2-5-prohttps://x.com/petergyang/status/1906007718961492391https://x.com/QiaochuYuan/status/1905967688310268168https://x.com/omarsar0/status/1906404825509560408
https://x.com/renderfiction/status/1905998185962643767https://x.com/GeminiApp/status/1906131622736679332https://x.com/silasalberti/status/1905826070370144450https://www.reddit.com/r/singularity/comments/1jnbtu2/testing_gemini_25_pro_with_a_project_a_algorithm/
【新闻来源】














暂无评论内容