生成式AI
一、英伟达亮相首片用于AI的「美国造」Blackwell芯片晶圆
1. 英伟达与台积电在美国亚利桑那工厂历史性亮相首片Blackwell芯片晶圆,系列芯片首次实现「美国本土造」;
2. 台积电亚利桑那工厂总投资1650亿美元,将生产2纳米、3纳米、4纳米和A16等先进制程芯片;
3. Blackwell芯片采用NVIDIA与TSMC合作定制4NP工艺,拥有2080亿晶体管,两个子芯片通过NV-HBI连接速度达10TB/s。
https://mp.weixin.qq.com/s/Z-EhdEAoaT_zrMdDiTeqEw
二、Anthropic 发布了 Agent Skills,提示词、素材按需加载
1. Anthropic发布Agent Skills功能,允许将提示词、代码包等专业能力打包成可按需加载的skills,支持多个skills叠加且Claude自动识别所需能力;
2. Skills可在Claude apps、Claude Code和API三个平台通用移植,包含SKILL.md核心指令、可执行脚本文件和资源文件,仅在需要时加载最小必要信息;
3. 官方预设包括docx、xlsx、pptx、pdf等9个skills,用户可自定义上传,还提供skill-creator辅助创建新skills。
https://mp.weixin.qq.com/s/n9Q5GuKIUQYS21_wF6YUKQ
三、李飞飞新「世界模型」问世!单张H100实时生成3D世界
1. 李飞飞World Labs发布实时生成式世界模型RTFM,仅需单块H100 GPU即可实时渲染持久且3D一致的世界,无论真实场景还是想象空间;
2. RTFM采用自回归扩散Transformer架构,通过端到端学习大规模视频数据,无需构建显式3D表征,直接从2D图像生成新视角图像,学会模拟反射、阴影等复杂效果;
3. 模型通过带位姿的帧作为空间记忆实现无限持久性,配合"上下文调度"技术,可在长时间交互中保持大型世界几何形状持久性。
https://mp.weixin.qq.com/s/NaB4lEDRPqsk2arBCduyUA
四、Manus 1.5测试,搭网页、调Bug、检测、自动上线全包
1. Manus推出1.5版本,引入具备操作能力的"内建浏览器",允许AI像用户一样点击网页按钮、测试功能、修复bug,将上线部署、网页测试等传统人工环节纳入Agent执行能力;
2. 新增Library文件库统一管理生成内容,开放多人进入同一Agent会话协同编辑,平均任务完成时长从15分36秒缩短至3分43秒;
3. 实测通过自然语言完全无代码完成音乐网页应用构建,包括歌词改写、情绪调节、音频上传等交互功能,支持点击式重写和实时刷新。
https://mp.weixin.qq.com/s/IvYeyEKuB4ajwP2Hf_GPoQ
五、Windows 11 大更新:AI 操控电脑,还有 Manus 强势上岗
1. Windows 11大更新引入"Hey Copilot"语音唤醒功能和Copilot Vision屏幕理解能力,可实时查看屏幕内容并手把手教用户操作;
2. Copilot Actions可在本地文件上执行操作如整理照片、提取PDF信息等,Copilot Connectors打通OneDrive、Outlook和Google全家桶;
3. 文件资源管理器集成Manus AI操作,可右键文档选择"使用Manus创建网站"自动生成网站,还整合Filmora视频编辑和Zoom会议安排功能。
https://mp.weixin.qq.com/s/KW7uY2JT05EIm1sJ1JKSAg
六、百度发布并开源自研多模态文档解析模型PaddleOCR-VL
1. 百度开源PaddleOCR-VL多模态文档解析模型,仅0.9B参数量在OmniDocBench V1.5榜单获92.6分全球第一,在文本识别、公式识别、表格理解、阅读顺序四大核心能力全部拿下SOTA;
2. 模型支持109种语言,覆盖手写、竖排、艺术字体等复杂形态,公式识别CDM得分0.9453,表格理解得分89.8,阅读顺序预测误差仅0.043;
3. 采用两阶段架构,融合NaViT动态分辨率视觉编码器与ERNIE-4.5-0.3B语言模型,在单张A100上推理速度达1881token/s,发布16小时内登顶HuggingFace Trending全球第一。
https://mp.weixin.qq.com/s/LDVTXB_LMCLJ2uFpUJdDxA
前沿科技
七、Hassabis官宣用AI点燃「人造太阳」!无限能源时代提速
1. Google DeepMind与核聚变能源巨头CFS合作,利用AI加速"人造太阳"SPARC装置研发,DeepMind开发的TORAX等离子体模拟器可运行数百万次虚拟实验测试托卡马克装置方案;
2. 合作聚焦三大方向:构建快速精准可微分的聚变等离子体模拟系统、寻找最大化聚变能量输出的高效路径、运用强化学习探索实时控制策略;
3. TORAX能在CPU与GPU灵活运行并无缝集成AI模型,已成为CFS日常研究重要工具,通过强化学习AI Agent可在模拟环境中探索海量潜在运行场景。
https://mp.weixin.qq.com/s/0rtvxXPfCHsqKgvnSLjeTg
报告观点
八、哈佛新研究追踪6200万人,提示AI 「入侵职场」的真相
1. 哈佛大学研究通过追踪近6200万劳动者、超2.45亿招聘信息发现,采用AI的企业初级岗位显著下降,主要通过放缓招聘而非裁员实现,工作越来越难找;
2. AI冲击最大的人群是第2档(强校)和第3档(普通名校)毕业生,顶尖精英大学和末流院校反而受影响较小,呈现"U型"格局;
3. 批发零售行业初级岗位风险最大,内容审核员、财会行政等办公室底层职位面临"去人化",技能呈现"两极化"趋势。
https://mp.weixin.qq.com/s/1mpHKJem1QHP3tSX54O0qA
九、Reddit创始人预警「死亡互联网理论」,奥特曼公开发声
1. Reddit联合创始人Ohanian称"如今互联网大部分已经死了",被AI生成内容淹没失去真实生命力,OpenAI CEO Sam Altman认为该理论可能有道理,现在存在很多大模型驱动的账号;
2. Cloudflare监测显示机器人流量约占整体应用流量31%,Imperva报告显示2024年自动化流量达51%,Graphite数据显示2024年11月AI生成文章数量首次超过人类撰写文章;
3. 牛津大学等研究机构论文指出,模型在AI生成数据上继续训练会导致"模型崩溃",AI内容成为训练数据可能带来模型能力下降。
https://mp.weixin.qq.com/s/rhMBVub7LhkzBqDNUH_yMQ
十、Andrej Karpathy :智能体都在装样子,AGI 十年也出不来
1. AI大神Andrej Karpathy在2小时采访中直言"智能体都在装样子,强化学习很糟糕",认为AGI仍需十年时间,现有Agent存在诸多认知缺陷;
2. Karpathy强调强化学习通过"吸管吸取监督"方式噪声极大,人类并不真正使用强化学习,预训练是"糟糕的进化",LLM被预训练文档记忆所困扰;
3. 他预计AGI将融入约2%GDP增长而非爆炸式增长,认为AI本质是计算的延伸和自动化进程的延续,教育是让人类在AI时代保持价值的关键。
暂无评论内容