AI 每日速递 20251107

生成式AI

一、Gemini 3 Pro预览版灰度测试,1M上下文窗口或成亮点

1. 谷歌计划11月面向部分开发者和企业用户开放Gemini 3 Pro预览版,正式发布可能在12月;

2. 该模型上下文窗口可达100万tokens,适合处理长文档和复杂数据流水线,尤其适合AI研究者和对上下文容量有极高要求的团队;

3. Gemini 3 Pro的发布还与谷歌即将推出的图像生成模型Nano Banana 2有关同步亮相。

https://mp.weixin.qq.com/s/SSFQQDCvMFBEEwQJt1vE2A

二、苹果或每年砸 10 亿美元,将谷歌Gemini 模型用于Siri

1. 苹果正接近与谷歌达成协议每年支付约10亿美元,换取Gemini模型为新版Siri提供摘要器和任务规划等核心AI能力;

2. Gemini将运行在苹果私有云计算服务器上,用户数据不会接触谷歌系统,谷歌提供的模型拥有1.2万亿参数,远超苹果现有的1500亿参数模型;

3. 苹果AI团队正面临严重人才流失,自7月至今已有数十名核心成员跳槽,基础模型团队负责人庞若鸣被Meta以2亿美元挖走。

https://mp.weixin.qq.com/s/FI5X2PDbaZvGj5X1pqGxtw

三、月之暗面正式发布Kimi-k2 thinking模型,擅长深度推理

1. 月之暗面正式发布Kimi-k2 thinking模型,具有通用Agentic能力和推理能力,可通过多轮工具调用解决复杂难题;

2. 实测显示该模型在编程方面表现出色,3分钟可生成完整网页项目,在2025 IMO数学竞赛题上表现空间

3. 价格方面kimi-k2-thinking输入4元/百万tokens、输出16元/百万tokens,高速版turbo输入8元、输出58元/百万tokens。

https://mp.weixin.qq.com/s/06e5HjC3_jnyhLocOAOosw

四、讯飞发布星火深度推理大模型X1.5,目标是真正"读懂你"

1. 科大讯飞发布全新星火深度推理大模型X1.5,基于全栈国产算力平台训练,采用MoE架构总参数293B,推理激活仅30B;

2. 该模型在AIME 2025数学竞赛中登顶第一,深度推理训练效率从25%提升至84%,推理速度相比X1提升100%;

3. 科大讯飞提出"更懂你的AI"新理念,强调不仅要懂语言更要懂情绪、懂任务更要懂意图,发布了多款软硬一体化AI产品。

https://mp.weixin.qq.com/s/FcyHqy6D9q_T7FgeI2QogA

五、腾讯云CodeBuddy接入Skills的标准化接口,国内首个

1. 腾讯云CodeBuddy成为国内首个支持Skills标准化接口的AI编程工具,开发者可为AI添加多样化技能包;

2. Skills将不同领域专业知识封装成独立可复用的技能模块,每个技能包是对应技能的SOP,让AI读完就能高效执行;

3. 结合已接入的MCP,CodeBuddy构建出强大智能开发体系,可实现PDF智能处理、自动生成PPT、全自动发小红书、全栈自动化开发等功能。

https://mp.weixin.qq.com/s/gi_AR71-4wlVC3seMCopuw

六、高德与小鹏达成合作,未来将共同提供 Robotaxi 服务

1. 高德宣布与小鹏汽车达成合作,未来将共同面向全球提供Robotaxi服务,这是高德空间智能能力的重要落地;

2. 高德通过TrafficVLM模型实现"超视距"能力,可在几公里外感知突发事故并预判拥堵发展,提前推送预警信息;

3. 拥有数十万亿级时空样本和多渠道数据融合体系,成为Robotaxi行业的"空间智能基础设施",降低行业创新门槛。

https://mp.weixin.qq.com/s/JrldVgzqUj8JU7qtFXWKcw

七、前Meta大佬推出智能戒指:内置聊天机器人、语音转写

1. 前Meta工程师创立的Sandbar推出智能戒指Stream Ring,配备麦克风和触摸板,支持语音转录、AI助手交互和音乐控制;

2. 该戒指售价249美元起,已获1300万美元融资,配套应用Stream无需订阅即可享受无限笔记支持,专业版每月10美元;

3. Stream Ring内置触觉反馈、全防水设计,可进行个性化声音设置,通过长按激活语音记录,预计明年夏天发货。

https://mp.weixin.qq.com/s/rBQwtGL04WPRhkN9Apni1Q

前沿科技

八、新一代AI科学家Kosmos,一天完成六个月科研工作量

1. 初创公司FutureHouse推出新一代AI科学家Kosmos,采用结构化世界模型,单次运行可解析1500篇论文并执行42000行分析代码;

2. 测试用户评估Kosmos一天完成的工作量相当于六个月科研投入,79.4%的研究结论经验证准确可靠,在神经科学、材料科学等领域实现七项突破性发现;

3. Kosmos每次分析定价200美元,学界用户可享免费额度,确保每项结论都能追溯至特定代码段或文献片段,具备完全可审计性。

https://mp.weixin.qq.com/s/KwOl3oeb5omGwYUjnSna1w

报告观点

九、a16z对话Replit创始人:最后要抽象掉的就是代码本身

1. Replit创始人Amjad Masad认为语法对人类来说是反直觉的,最终英语才是编程语言,用户身份从人类转移到AI Agent本身;

2. AI长时推理能力已从几分钟突破至数小时,关键在于强化学习和"验证环路",模型通过代码执行环境展开trajectory并获得奖励反馈;

3. 他认为当前AI可能已达"人类水平",真正AGI的定义应是"高效的持续学习",即在任何领域快速学习并迁移知识的能力。

https://mp.weixin.qq.com/s/NOnxBmN8n_1wmZaKLFDXkg

© 版权声明
THE END
喜欢就支持一下吧
点赞8 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容