AI 每日速递 20251024-AI Spot

生成式AI

一、谷歌上线AI学习平台Google Skills，三千课程全民可用

1. 谷歌推出AI学习平台Google Skills，整合Google Cloud、DeepMind、Google for Education等内容，提供超3000门课程，覆盖大型语言模型技术和伦理方面；

2. 平台采用游戏化激励方式包括连胜追踪、技能徽章和排行榜，过去1年已有2600万人在谷歌分散平台学技能，现集中到一个入口；

3. Google Skills打通招聘通道，招聘联盟包括150多家雇主，用户完成相关证书可跳过初筛直接进面试，构建学习-证明-就业闭环。

https://mp.weixin.qq.com/s/mkOexTs9fz978PFxE5ZbwQ

二、Sora 项目负责人发Sora2升级线路图，有四点重点变化

1. Sora2将推出”角色客串”功能，用户可将现实物品或生成的人物投射到虚拟世界，创建独特人物IP并进行互动；

2. 社交体验将优化，除全球动态流推荐外还将支持大学、公司、运动俱乐部等特定社群组队分享，同时减少过度内容审核；

3. 应用优化包括流畅度提升、视频编辑功能和多段拼接，安卓版即将上线，可在谷歌应用商店预注册。

https://mp.weixin.qq.com/s/8XWPurIIfsLmB6WE5z8fqg

三、快手进军AI编程！”模型+工具+平台”一口气放三个大招

1. 快手发布AI编程产品矩阵，推出KAT-Coder模型、CodeFlicker智能开发工具和万擎MaaS平台三位一体解决方案；

2. KAT-Coder在SWE-bench Verified榜单以73.4%解决率跻身GPT、Claude第一梯队，开源版KAT-Dev-72B-Exp达74.6%，收入8个月增长4倍；

3. CodeFlicker已在快手内部80%工程师使用，DeepWiki功能可自动生成代码仓库说明书，支持企业级定制化服务实现”编码即标注”数据飞轮。

https://mp.weixin.qq.com/s/Hg0y6BsdtPyAyEyJy5-PPA

四、港科大贾佳亚团队DreamOmni2开源，超Nano Banana?

1. 港科大贾佳亚团队推出DreamOmni2多模态图像编辑模型，GitHub两周揽星1.6K，可处理多个参考图像并理解抽象概念如风格、光影、笔触等；

2. 基于FLUX Kontext模型，DreamOmni2在传统任务上显著优于现有开源模型，抽象概念处理对标谷歌Nano Banana，支持风格迁移、动作模仿、多图编辑；

3. 创新三阶段数据构建范式和索引编码技术，首次实现从单一物体到完整3D场景的生成，已开源并上线Huggingface演示。

https://mp.weixin.qq.com/s/Wl-6rZn9zJNwOQkRp0A1Eg

五、字节发布Seed3D 1.0版本，一张图生成高精度 3D 模型

1. 字节跳动推出3D生成大模型Seed3D 1.0，基于Diffusion Transformer架构，可从单张图像生成包含精细几何、真实纹理和PBR材质的3D模型；

2. 其中，纹理材质生成性对标SOTA水平，1.5B参数的Seed3D 1.0能准确还原精细特征；

3. 生成的3D模型可导入Isaac Sim等仿真引擎供机器人训练，支持从单一物体扩展至完整3D场景生成。

https://mp.weixin.qq.com/s/nvFWcf0_HquG5rD8LbyD0A

六、Meta AI巨震！大神田渊栋被裁，成批华人科学家失业

1. Meta在AI部门进行大规模裁员约600个职位，华人AI大佬田渊栋及其团队受影响，FAIR实验室成为重灾区；

2. 杨立坤负责的FAIR实验室遭重创，有消息称其已向同事透露可能辞去首席科学家职位，而新成立的TBD超级智能实验室毫发无损仍在招聘；

3. Meta首席AI官备忘录显示公司认为原有架构过于官僚化，正将重心从开放式基础研究转向超级智能竞赛，近期达成270亿美元数据中心融资。

https://mp.weixin.qq.com/s/bQd3JyTkuNx6k7Cd4s6r8Q

七、AI终端又添一形态，科勒5000 块请 AI 看我「上厕所」？

1. 科勒推出Dekoda智能马桶售价599美元起，在马桶侧边安装AI摄像头，通过视觉分析排泄物判断肠道健康、水分状况和血液检测；

2. 使用需订阅Kohler Health应用，每人每年支出26至70美元，基于布里斯托大便分类法和超100万数据点训练的AI模型进行分析；

3. 产品面临隐私争议、高昂价格和使用门槛限制，仅支持白色马桶且边缘厚度需在32-58毫米之间，分析结果相对简单仅分为正常、硬便、稀便等类别。

https://mp.weixin.qq.com/s/58hjjW2UVIPZsoY_du57Zg

前沿科技

八、谷歌重大突破！量子计算首次可验证，登《Nature》封面

1. 谷歌发布量子回声算法在Willow芯片上运行，解决原子相互作用问题速度比Frontier超级计算机快13000倍，数小时完成需3.2年的计算；

2. 这是量子计算机首次在真实硬件上成功运行可验证算法，结果可在其他同等水平量子计算机上重复验证，确认正确性；

3. 算法可研究分子到黑洞的各种系统结构，通过量子回声测量OTOC期望值描述量子动力学混沌，为药物研发和材料科学应用铺路。

https://mp.weixin.qq.com/s/_ZO8KgYzjFBstgMlIf5j-w

报告观点

九、Vercel CEO爆Kimi K2智能体的准确率超GPT-5 50%？

1. 估值93亿美元的Vercel公司CEO公开表示，内部智能体测试中Kimi K2运行速度是GPT-5和Sonnet 4.5的5倍（2分钟vs8-10分钟）；

2. Kimi K2准确率超60%，比GPT-5（低于40%）高出50%，比Sonnet 4.5（低于50%）也有明显优势；

3. 硅谷多家公司如Cline、Cursor、Perplexity等已接入K2模型，”SPAC之王”查马斯透露其公司已将大量工作需求转移到K2，理由是性能强且价格更便宜。

https://mp.weixin.qq.com/s/dxFDLA4GIIOe9o0JoGr8Lg

十、a16z 新文章：视频模型不会一家通吃，将向专业化发展

1. a16z合伙人指出视频模型进入产品时代，Sora 2专注会导戏讲故事适合玩梗，Veo 3专注物理仿真和音视频同步适合专业创作，不同模型走向专业化；

2. 模型能力和产品之间存在巨大鸿沟，创作者需手动完成角色一致、串联首尾帧、控制镜头等工作，这些应该由产品层面解决；

3. 未来将出现针对特定场景的专用模型、帮用户选模型优化效果的产品和整合配音音乐的创作套件，就像LLM经历模型进步放缓后产品层爆发。

https://mp.weixin.qq.com/s/QnoQCQ5XW2QWmdC_u5bjzw

文章版权归作者所有，未经允许请勿转载。

THE END

AI 每日速递 AI 速递腾讯研究院
# 腾讯研究院 # AI 速递

AI 每日速递 20251024

请登录后发表评论