生成式AI
一、马斯克Grok 4.1一夜之间登顶LMArena,情商智商在线
1. xAI发布Grok 4.1双版本模型,Thinking版以1483 Elo登顶LMArena,非推理版本1465 Elo排名第二,超越Gemini 2.5 Pro;
2. 该模型在EQ-Bench情商测试中以1586 Elo成绩登顶,创意写作比上代提升600分,幻觉率暴降3倍,强调情商智商双在线;
3. xAI将后训练阶段RL规模扩大一个数量级,利用前沿AI智能体推理模型作为奖励模型自动优化回答质量,对所有人免费开放。
https://mp.weixin.qq.com/s/Y9LiMMk-qvxPvVpbPWfRVQ
二、贝佐斯创业物理AI!亲任CEO,首轮获投62亿美元融资
1. 61岁贝佐斯创立Project Prometheus亲任联席CEO,首轮获62亿美元融资约合人民币440亿,员工规模达上百人;
2. 公司研究项目包括将AI应用于机器人、药物设计和科学发现等物理任务,重点放在计算机、汽车、航空航天等高科技领域;
3. 另一联席CEO是物理学家兼化学家Vik Bajaj,曾在谷歌X研究机构与谢尔盖·布林紧密合作,创立并领导多家科技创新企业。
https://mp.weixin.qq.com/s/a13d5jfrwuXzaKz-tFVj6g
三、谷歌AI科学家内测,锦标赛制”炼”想法,一次跑40分钟
1. 谷歌为Gemini Enterprise开发多智能体系统,可扮演联席科学家角色,通过锦标赛式评估生成并排序约100个想法;
2. 该系统可让Gemini单个问题持续运行约40分钟,代表L3级AI能力,每个想法附带完整评审报告和锦标赛表现分析;
3. 系统包含”想法生成”和”联席科学家”两款核心智能体,用户需审查并批准计划摘要后才能启动任务,确保巨大算力投入的合理性。
https://mp.weixin.qq.com/s/D0C-oyo3ZaXv-GiDAvmv4Q
四、Physical Intelligence发布了最新机器人基础模型 π*0.6
1. Physical Intelligence发布最新机器人基础模型π*0.6,采用Recap方法结合演示训练、纠错指导和自主经验强化学习,大幅提升具身智能成功率和处理效率;
2. 该模型在制作咖啡、折叠衣物和组装纸箱等复杂任务上成功率达90%以上,吞吐量提高2倍以上,失败率降低2倍或更多;
3. π*0.6基于π0.6改进而来,通过价值函数解决信用分配难题,完全使用真实世界数据训练,能够在新环境中灵活执行未知任务。
https://mp.weixin.qq.com/s/EVxkL1yX41fEUv0dBzFYeg
五、MiniMax M2 推出9.9元编程套餐,OpenRouter Top5
4. MiniMax M2推出编程套餐首月仅9.9元,在OpenRouter平台token调用量冲至全球Top5,成为调用量最大的国产模型;
5. 该模型性能位列全球榜单第五,价格仅为Claude的8%,TPS稳定在100+,响应速度快且代码质量与Claude Sonnet 4.5基本持平;
6. M2支持Anthropic和OpenAI两种标准格式,可无缝接入Claude Code、Cursor等主流编程工具,5分钟即可完成配置。
https://mp.weixin.qq.com/s/NSSTLQhKzjnlSX-ZTl6Pfg
六、PixVerse上线升级版:V5 Fast 及「Modify」精修功能
7. PixVerse发布V5 Fast和Modify精修功能,视频生成速度提升超30%,5秒高清视频1分钟内完成,支持端到端视频编辑;
8. Modify功能支持元素替换、风格修改、材质调整、光线色调和人物编辑,可对生成视频进行多维度精细化修改而无需重新生成;
9. V5 Fast通过推理结构轻量化和帧间计算依赖缩短实现加速,爱诗科技已完成1亿元B+轮融资,平台累计服务超一亿用户。
https://mp.weixin.qq.com/s/el1VE1_1JBd3dXiiEw0q4Q
七、蚂蚁推出的全模态通用 AI 助手「灵光」,快速生成应用
1. 蚂蚁集团推出全模态通用AI助手「灵光」,支持自然语言30秒生成小应用,可全代码生成多模态内容;
2. 该助手支持3D数字模型、音频、图标、动画、地图等全模态信息输出,让对话更生动交流更高效;
3. 「灵光」首批上线”灵光对话”、”灵光闪应用”、”灵光开眼”三大功能,已同步登陆安卓与苹果应用商店。
https://mp.weixin.qq.com/s/71fn2gAkz6Huymr6siM3tg
八、全球首个「氛围游戏」Agent来了,一句话生成完整游戏
1. Gambo AI推出全球首个专为游戏开发打造的”氛围编程”Agent,输入一句话5-10分钟即可生成可商业化发布的完整游戏;
2. 平台贯穿美术资源生成、动画制作、音乐作曲、关卡设计、商业变现全自动流水线,零代码零美术基础纯自然语言驱动;
3. 集成变现功能可自动在游戏中嵌入广告点位实现”发布即盈利”,但目前仅支持2D平台跳跃类型游戏,复杂关卡可能需手动微调。
https://mp.weixin.qq.com/s/5imR6hkvaTFNBn8dR9zq7w
前沿科技
九、DeepMind推出新WeahterNext 2,分辨率可达1小时
1. 谷歌DeepMind推出WeatherNext 2气候预测模型,以8倍速度生成预报,分辨率最高可达1小时,单次预测在单个TPU上不到一分钟;
2. 该模型采用功能生成网络FGN新方法,可从单个起点预测数百种可能的天气结果,在99.9%的变量和预测时间上超越前代模型;
3. 预报数据已在Earth Engine和BigQuery中可获取,谷歌云Vertex AI平台推出定制模型推断抢先体验项目,已升级搜索、Gemini等产品。
https://mp.weixin.qq.com/s/Mfr2r4TwzuNdvYwesYm9cA
报告观点
十、CB Insights报告:Voice AI引爆,6大趋势定义AI新战场
1. CB Insights报告显示2024年AI Agent创业公司融资总额达38亿美元是2023年三倍,Voice AI成增长最快赛道2025年已融资4亿美元;
2. Coding AI Agents领跑全场Cursor以500M美元ARR居首,Customer service AI估值倍数高达219x远超80x平均水平;
3. Reasoning models使输出Token量激增20倍导致成本倒挂,2025年已发生超35起收购案,Agent监控工具成企业级新刚需。

















暂无评论内容