AI 每日速递 20251106

生成式AI

一、AI太空竞赛?谷歌Project Suncatcher也要将TPU送上天

1. 谷歌宣布Project Suncatcher计划,将于2027年初与Plant公司发射两颗原型卫星,搭载Trillium代TPU上天,利用太阳能驱动AI计算;

2. 该计划构想由太阳能卫星组成的紧凑型星座,通过自由空间光通信链路相连,太空太阳能效率比地球高8倍且几乎可持续发电;

3. Trillium TPU已通过辐射测试,可承受5年任务周期总电离剂量,预计到2030年代中期卫星发射至近地轨道成本可降至每千克200美元。

https://mp.weixin.qq.com/s/VmzJkIKT-X_3VMLnMg1CLg

二、Anthropic Agent开发新范式,让Token消耗暴降98.7%?

1. Anthropic发布"代码执行"新范式,建立在MCP之上,让模型编写代码调用工具而非直接调用,将Token消耗从15万降至2000,效率提升98.7%;

2. 新范式采用按需加载工具定义、数据本地流转设计,解决了工具定义过载和中间结果消耗两大Agent效率瓶颈;

3. 该方案带来渐进式披露、上下文高效、强大控制流、隐私保护和状态持久化五大核心优势,Cloudflare也独立发现类似模式。

https://mp.weixin.qq.com/s/XHuQghz8bHXqxes_0dS3FQ

三、Open-Sora Plan公司发Uniworld V2,擅长中文和细节控制

1. 兔展智能&北大推出UniWorld-V2图像编辑模型,在GEdit-Bench和ImgEdit基准测试中取得SOTA,综合表现超越OpenAI的GPT-Image-1;

2. 该模型基于首创的UniWorld-R1强化学习框架,采用多模态大语言模型作为免训练奖励模型,实现精准中文字体渲染和精细化空间可控;

3. UniWorld-R1框架具有极强通用性,应用于Qwen-Image-Edit和FLUX-Kontext等基础模型时同样带来显著性能提升。

https://mp.weixin.qq.com/s/MnnqP4KKdcqLIb6116HZaw

四、QQ浏览器更新,多了一扇「AI+」小窗,14种能力全集成

1. QQ浏览器电脑端v19.8.0版本推出"AI+"小窗功能,以无感悬浮小窗形式集成14种AI工具,从网页总结到订阅下载均可在小窗内完成;

2. 新版本升级极简框架,合并菜单与个人中心,地址栏右侧还原搜索框支持常驻或隐藏,提供更多自定义操作选项;

3. 基于精准意图识别,"AI+"小窗能主动推荐可使用的AI功能,包括智能标签整理、AI翻译、订阅助理等多种生产力工具。

https://mp.weixin.qq.com/s/M_45BWw2OnMNU5YJvZpqOw

五、谷歌把十多年世界建模经验和Gemini推理,装进了Earth AI

1. 谷歌重磅升级Earth AI,发布遥感、人口动力学和环境三大基础模型,并推出Gemini驱动的地理空间推理智能体;

2. 遥感基础模型在文本图像检索任务提升超16%,零样本检测精度达基准线两倍,人口动力学模型覆盖17个国家提供按月更新的人类活动嵌入;

3. 地理空间推理智能体在问答基准测试中准确率达0.82,显著优于Gemini基线,已为20亿人提供洪水预警服务。

https://mp.weixin.qq.com/s/8gc1rRCGrS7LAjZp8xRVhw

前沿科技

六、小鹏展示了全新一代IRON 人形机器人,最拟人的具身智能

1. 小鹏发布第二代VLA大模型和全新IRON人形机器人,VLA模型实现视觉到车辆控制指令的端到端映射,接管里程提升13倍;

2. IRON机器人拥有82个自由度和22个手部自由度,搭载3颗图灵AI芯片总算力达2250TOPS,为当前人形机器人最高水平;

3. 小鹏计划2026年推出三款Robotaxi车型启动试运营,总算力3000TOPS,同时推出面向消费者的L4智驾版本。

https://mp.weixin.qq.com/s/mYOpgFcigMnhA9pSeOeT8g

七、Generalist 推出了一类新型的「通用」具身基础模型 GEN-0

1. AI机器人公司Generalist推出具身基础模型GEN-0,参数量达10B+,在27万小时真实世界操作数据上训练,数据量超现有最大机器人数据集数个数量级;

2. GEN-0首创"和谐推理"训练方法,在异步连续时间的感知和行动token流之间建立和谐相互作用,实现跨机体部署能力;

3. 研究发现7B参数出现"相变"现象,更小模型表现出"固化",更大模型持续改进,并展现强大Scaling Law,证明具身智能可预测扩展。

https://mp.weixin.qq.com/s/kEdFdgePK5ZFVhL1-d7adg

八、银河通用联合多高校,推出跨本体全域环视的导航基座大模型

1. 银河通用联合北大、阿德莱德大学等推出全球首个跨本体全域环视导航基座大模型NavFoM,统一Vision-and-Language Navigation等不同导航任务;

2. 该模型训练数据包含800万条跨任务跨本体导航数据和400万条开放问答数据,通过TVI Tokens和BATS策略实现时空理解和实时响应;

3. 基于NavFoM,银河通用发布TrackVLA++、UrbanVLA和MM-Nav三个应用模型,构建从室内到城市的完整具身智能导航体系。

https://mp.weixin.qq.com/s/Jf_fRtcae4zL3pX791WSpg

报告观点

九、ElevenLabs 创业方法论:拆成小团队,半年没 PMF 原地解散

1. ElevenLabs现有350人分为20个产品小队,每个5-10人完全自治,6个月内必须完成PMF,成功继续否则解散;

2. 公司砍掉Slack访问权强制注意力集中,让团队专注自己的6个月任务,避免信息过载导致的注意力分散;

3. 提成规则明确落后于公司战略,禁止向竞品出售技术写入政策,销售行为符合长期利益可取消交易但业绩照算。

https://mp.weixin.qq.com/s/TznTC5AjWYk-ShLmaoZ9Jg

© 版权声明
THE END
喜欢就支持一下吧
点赞9 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容