生成式AI
一、谷歌上线AI学习平台Google Skills,三千课程全民可用
1. 谷歌推出AI学习平台Google Skills,整合Google Cloud、DeepMind、Google for Education等内容,提供超3000门课程,覆盖大型语言模型技术和伦理方面;
2. 平台采用游戏化激励方式包括连胜追踪、技能徽章和排行榜,过去1年已有2600万人在谷歌分散平台学技能,现集中到一个入口;
3. Google Skills打通招聘通道,招聘联盟包括150多家雇主,用户完成相关证书可跳过初筛直接进面试,构建学习-证明-就业闭环。
https://mp.weixin.qq.com/s/mkOexTs9fz978PFxE5ZbwQ
二、Sora 项目负责人发Sora2升级线路图,有四点重点变化
1. Sora2将推出"角色客串"功能,用户可将现实物品或生成的人物投射到虚拟世界,创建独特人物IP并进行互动;
2. 社交体验将优化,除全球动态流推荐外还将支持大学、公司、运动俱乐部等特定社群组队分享,同时减少过度内容审核;
3. 应用优化包括流畅度提升、视频编辑功能和多段拼接,安卓版即将上线,可在谷歌应用商店预注册。
https://mp.weixin.qq.com/s/8XWPurIIfsLmB6WE5z8fqg
三、快手进军AI编程!"模型+工具+平台"一口气放三个大招
1. 快手发布AI编程产品矩阵,推出KAT-Coder模型、CodeFlicker智能开发工具和万擎MaaS平台三位一体解决方案;
2. KAT-Coder在SWE-bench Verified榜单以73.4%解决率跻身GPT、Claude第一梯队,开源版KAT-Dev-72B-Exp达74.6%,收入8个月增长4倍;
3. CodeFlicker已在快手内部80%工程师使用,DeepWiki功能可自动生成代码仓库说明书,支持企业级定制化服务实现"编码即标注"数据飞轮。
https://mp.weixin.qq.com/s/Hg0y6BsdtPyAyEyJy5-PPA
四、港科大贾佳亚团队DreamOmni2开源,超Nano Banana?
1. 港科大贾佳亚团队推出DreamOmni2多模态图像编辑模型,GitHub两周揽星1.6K,可处理多个参考图像并理解抽象概念如风格、光影、笔触等;
2. 基于FLUX Kontext模型,DreamOmni2在传统任务上显著优于现有开源模型,抽象概念处理对标谷歌Nano Banana,支持风格迁移、动作模仿、多图编辑;
3. 创新三阶段数据构建范式和索引编码技术,首次实现从单一物体到完整3D场景的生成,已开源并上线Huggingface演示。
https://mp.weixin.qq.com/s/Wl-6rZn9zJNwOQkRp0A1Eg
五、字节发布Seed3D 1.0版本 ,一张图生成高精度 3D 模型
1. 字节跳动推出3D生成大模型Seed3D 1.0,基于Diffusion Transformer架构,可从单张图像生成包含精细几何、真实纹理和PBR材质的3D模型;
2. 其中,纹理材质生成性对标SOTA水平,1.5B参数的Seed3D 1.0能准确还原精细特征;
3. 生成的3D模型可导入Isaac Sim等仿真引擎供机器人训练,支持从单一物体扩展至完整3D场景生成。
https://mp.weixin.qq.com/s/nvFWcf0_HquG5rD8LbyD0A
六、Meta AI巨震!大神田渊栋被裁,成批华人科学家失业
1. Meta在AI部门进行大规模裁员约600个职位,华人AI大佬田渊栋及其团队受影响,FAIR实验室成为重灾区;
2. 杨立坤负责的FAIR实验室遭重创,有消息称其已向同事透露可能辞去首席科学家职位,而新成立的TBD超级智能实验室毫发无损仍在招聘;
3. Meta首席AI官备忘录显示公司认为原有架构过于官僚化,正将重心从开放式基础研究转向超级智能竞赛,近期达成270亿美元数据中心融资。
https://mp.weixin.qq.com/s/bQd3JyTkuNx6k7Cd4s6r8Q
七、AI终端又添一形态,科勒5000 块请 AI 看我「上厕所」?
1. 科勒推出Dekoda智能马桶售价599美元起,在马桶侧边安装AI摄像头,通过视觉分析排泄物判断肠道健康、水分状况和血液检测;
2. 使用需订阅Kohler Health应用,每人每年支出26至70美元,基于布里斯托大便分类法和超100万数据点训练的AI模型进行分析;
3. 产品面临隐私争议、高昂价格和使用门槛限制,仅支持白色马桶且边缘厚度需在32-58毫米之间,分析结果相对简单仅分为正常、硬便、稀便等类别。
https://mp.weixin.qq.com/s/58hjjW2UVIPZsoY_du57Zg
前沿科技
八、谷歌重大突破!量子计算首次可验证,登《Nature》封面
1. 谷歌发布量子回声算法在Willow芯片上运行,解决原子相互作用问题速度比Frontier超级计算机快13000倍,数小时完成需3.2年的计算;
2. 这是量子计算机首次在真实硬件上成功运行可验证算法,结果可在其他同等水平量子计算机上重复验证,确认正确性;
3. 算法可研究分子到黑洞的各种系统结构,通过量子回声测量OTOC期望值描述量子动力学混沌,为药物研发和材料科学应用铺路。
https://mp.weixin.qq.com/s/_ZO8KgYzjFBstgMlIf5j-w
报告观点
九、Vercel CEO爆Kimi K2智能体的准确率超GPT-5 50%?
1. 估值93亿美元的Vercel公司CEO公开表示,内部智能体测试中Kimi K2运行速度是GPT-5和Sonnet 4.5的5倍(2分钟vs8-10分钟);
2. Kimi K2准确率超60%,比GPT-5(低于40%)高出50%,比Sonnet 4.5(低于50%)也有明显优势;
3. 硅谷多家公司如Cline、Cursor、Perplexity等已接入K2模型,"SPAC之王"查马斯透露其公司已将大量工作需求转移到K2,理由是性能强且价格更便宜。
https://mp.weixin.qq.com/s/dxFDLA4GIIOe9o0JoGr8Lg
十、a16z 新文章:视频模型不会一家通吃,将向专业化发展
1. a16z合伙人指出视频模型进入产品时代,Sora 2专注会导戏讲故事适合玩梗,Veo 3专注物理仿真和音视频同步适合专业创作,不同模型走向专业化;
2. 模型能力和产品之间存在巨大鸿沟,创作者需手动完成角色一致、串联首尾帧、控制镜头等工作,这些应该由产品层面解决;
3. 未来将出现针对特定场景的专用模型、帮用户选模型优化效果的产品和整合配音音乐的创作套件,就像LLM经历模型进步放缓后产品层爆发。












暂无评论内容