AI 每日速递 20251020-AI Spot

生成式AI

一、英伟达亮相首片用于AI的「美国造」Blackwell芯片晶圆

1. 英伟达与台积电在美国亚利桑那工厂历史性亮相首片Blackwell芯片晶圆，系列芯片首次实现「美国本土造」；

2. 台积电亚利桑那工厂总投资1650亿美元，将生产2纳米、3纳米、4纳米和A16等先进制程芯片；

3. Blackwell芯片采用NVIDIA与TSMC合作定制4NP工艺，拥有2080亿晶体管，两个子芯片通过NV-HBI连接速度达10TB/s。

https://mp.weixin.qq.com/s/Z-EhdEAoaT_zrMdDiTeqEw

二、Anthropic 发布了 Agent Skills，提示词、素材按需加载

1. Anthropic发布Agent Skills功能，允许将提示词、代码包等专业能力打包成可按需加载的skills，支持多个skills叠加且Claude自动识别所需能力；

2. Skills可在Claude apps、Claude Code和API三个平台通用移植，包含SKILL.md核心指令、可执行脚本文件和资源文件，仅在需要时加载最小必要信息；

3. 官方预设包括docx、xlsx、pptx、pdf等9个skills，用户可自定义上传，还提供skill-creator辅助创建新skills。

https://mp.weixin.qq.com/s/n9Q5GuKIUQYS21_wF6YUKQ

三、李飞飞新「世界模型」问世！单张H100实时生成3D世界

1. 李飞飞World Labs发布实时生成式世界模型RTFM，仅需单块H100 GPU即可实时渲染持久且3D一致的世界，无论真实场景还是想象空间；

2. RTFM采用自回归扩散Transformer架构，通过端到端学习大规模视频数据，无需构建显式3D表征，直接从2D图像生成新视角图像，学会模拟反射、阴影等复杂效果；

3. 模型通过带位姿的帧作为空间记忆实现无限持久性，配合”上下文调度”技术，可在长时间交互中保持大型世界几何形状持久性。

https://mp.weixin.qq.com/s/NaB4lEDRPqsk2arBCduyUA

四、Manus 1.5测试，搭网页、调Bug、检测、自动上线全包

1. Manus推出1.5版本，引入具备操作能力的”内建浏览器”，允许AI像用户一样点击网页按钮、测试功能、修复bug，将上线部署、网页测试等传统人工环节纳入Agent执行能力；

2. 新增Library文件库统一管理生成内容，开放多人进入同一Agent会话协同编辑，平均任务完成时长从15分36秒缩短至3分43秒；

3. 实测通过自然语言完全无代码完成音乐网页应用构建，包括歌词改写、情绪调节、音频上传等交互功能，支持点击式重写和实时刷新。

https://mp.weixin.qq.com/s/IvYeyEKuB4ajwP2Hf_GPoQ

五、Windows 11 大更新：AI 操控电脑，还有 Manus 强势上岗

1. Windows 11大更新引入”Hey Copilot”语音唤醒功能和Copilot Vision屏幕理解能力，可实时查看屏幕内容并手把手教用户操作；

2. Copilot Actions可在本地文件上执行操作如整理照片、提取PDF信息等，Copilot Connectors打通OneDrive、Outlook和Google全家桶；

3. 文件资源管理器集成Manus AI操作，可右键文档选择”使用Manus创建网站”自动生成网站，还整合Filmora视频编辑和Zoom会议安排功能。

https://mp.weixin.qq.com/s/KW7uY2JT05EIm1sJ1JKSAg

六、百度发布并开源自研多模态文档解析模型PaddleOCR-VL

1. 百度开源PaddleOCR-VL多模态文档解析模型，仅0.9B参数量在OmniDocBench V1.5榜单获92.6分全球第一，在文本识别、公式识别、表格理解、阅读顺序四大核心能力全部拿下SOTA；

2. 模型支持109种语言，覆盖手写、竖排、艺术字体等复杂形态，公式识别CDM得分0.9453，表格理解得分89.8，阅读顺序预测误差仅0.043；

3. 采用两阶段架构，融合NaViT动态分辨率视觉编码器与ERNIE-4.5-0.3B语言模型，在单张A100上推理速度达1881token/s，发布16小时内登顶HuggingFace Trending全球第一。

https://mp.weixin.qq.com/s/LDVTXB_LMCLJ2uFpUJdDxA

前沿科技

七、Hassabis官宣用AI点燃「人造太阳」！无限能源时代提速

1. Google DeepMind与核聚变能源巨头CFS合作，利用AI加速”人造太阳”SPARC装置研发，DeepMind开发的TORAX等离子体模拟器可运行数百万次虚拟实验测试托卡马克装置方案；

2. 合作聚焦三大方向：构建快速精准可微分的聚变等离子体模拟系统、寻找最大化聚变能量输出的高效路径、运用强化学习探索实时控制策略；

3. TORAX能在CPU与GPU灵活运行并无缝集成AI模型，已成为CFS日常研究重要工具，通过强化学习AI Agent可在模拟环境中探索海量潜在运行场景。

https://mp.weixin.qq.com/s/0rtvxXPfCHsqKgvnSLjeTg

报告观点

八、哈佛新研究追踪6200万人，提示AI 「入侵职场」的真相

1. 哈佛大学研究通过追踪近6200万劳动者、超2.45亿招聘信息发现，采用AI的企业初级岗位显著下降，主要通过放缓招聘而非裁员实现，工作越来越难找；

2. AI冲击最大的人群是第2档（强校）和第3档（普通名校）毕业生，顶尖精英大学和末流院校反而受影响较小，呈现”U型”格局；

3. 批发零售行业初级岗位风险最大，内容审核员、财会行政等办公室底层职位面临”去人化”，技能呈现”两极化”趋势。

https://mp.weixin.qq.com/s/1mpHKJem1QHP3tSX54O0qA

九、Reddit创始人预警「死亡互联网理论」，奥特曼公开发声

1. Reddit联合创始人Ohanian称”如今互联网大部分已经死了”，被AI生成内容淹没失去真实生命力，OpenAI CEO Sam Altman认为该理论可能有道理，现在存在很多大模型驱动的账号；

2. Cloudflare监测显示机器人流量约占整体应用流量31%，Imperva报告显示2024年自动化流量达51%，Graphite数据显示2024年11月AI生成文章数量首次超过人类撰写文章；

3. 牛津大学等研究机构论文指出，模型在AI生成数据上继续训练会导致”模型崩溃”，AI内容成为训练数据可能带来模型能力下降。

https://mp.weixin.qq.com/s/rhMBVub7LhkzBqDNUH_yMQ

十、Andrej Karpathy ：智能体都在装样子，AGI 十年也出不来

1. AI大神Andrej Karpathy在2小时采访中直言”智能体都在装样子，强化学习很糟糕”，认为AGI仍需十年时间，现有Agent存在诸多认知缺陷；

2. Karpathy强调强化学习通过”吸管吸取监督”方式噪声极大，人类并不真正使用强化学习，预训练是”糟糕的进化”，LLM被预训练文档记忆所困扰；

3. 他预计AGI将融入约2%GDP增长而非爆炸式增长，认为AI本质是计算的延伸和自动化进程的延续，教育是让人类在AI时代保持价值的关键。

https://mp.weixin.qq.com/s/Dg_ZSoWd-xsv2rN-fqdeBA

文章版权归作者所有，未经允许请勿转载。

THE END

AI 每日速递 AI 资讯 AI 速递腾讯研究院
# 腾讯研究院 # 腾讯

AI 每日速递 20251020

请登录后发表评论