AI 每日速递 20251030

生成式AI

一、英伟达GTC深夜爆拉市值,Vera Rubin芯片首露面

1. 英伟达在GTC华盛顿大会上首次展示Vera Rubin超级芯片,搭载88核Vera CPU和两颗Rubin GPU,预计2026年第三或第四季度量产;

2. 黄仁勋发布会后英伟达股价上涨4.98%,市值增加2300多亿美元达到4.89万亿美元,成为首家市值冲刺5万亿美元的公司;

3. 大会重点包括量子互连技术NVQLink、与美国能源部合作建造7台新超级计算机、宣布与Uber合作部署约10万辆自动驾驶汽车等。

https://mp.weixin.qq.com/s/iMoJ2fuVG23PINixFRSO9w

二、Soul AI Lab开源播客语音合成模型SoulX-Podcast

1. Soul App AI团队正式开源播客语音合成模型SoulX-Podcast,支持中英川粤等多语种方言,能稳定输出超60分钟多轮语音对话;

2. 该模型支持零样本克隆的多轮对话能力,可实现跨方言音色克隆,仅用普通话参考语音即可生成带方言特征的自然语音;

3. 模型基于Qwen3-1.7B作为基座,采用LLM + Flow Matching语音生成范式,在播客场景下语音可懂度与音色相似度均取得最佳结果。

https://mp.weixin.qq.com/s/bbn1c-e9IUI9mr4h9GL3qw

三、Adobe Firefly Image 5更新,400万像素、AI图层编辑

1. Adobe在MAX大会推出Firefly图像模型5,擅长生成照片级逼真细节,可原生生成4MP分辨率图像且无需升级;

2. Adobe CC 2026全家桶正式发布Windows版本,包括Photoshop 2026 27.0、Illustrator 2026 30.0等多款软件全面更新;

3. 新版本支持仅通过输入提示即可编辑图像,能根据需要进行精确修改同时保持其他像素不变,且具有商业安全性。

https://mp.weixin.qq.com/s/hgg30DE3MFr3dCZSyUi2kA

四、混元推出国内首个交互式AI播客,听众可以"举手"提问

1. 腾讯混元推出国内首个交互式AI播客,用户可在收听过程中随时打断主持人和嘉宾发言,通过语音或打字方式提问;

2. 基于大模型意图识别、长上下文理解和多轮对话能力,系统能结合上下文及背景信息准确给出答案,改变传统播客单向收听模式;

3. 混元AI播客现已支持默认模式、深度探索、思辨讨论三种模式,提供8种不同音色,支持单人和双人播客形式。

https://mp.weixin.qq.com/s/RKjyNAN-qJoiC5W2rSVnFw

五、PayPal宣布已与OpenAI达成合作,嵌入其数字钱包

1. PayPal宣布与OpenAI签署合作协议,其数字钱包将嵌入ChatGPT,让用户能直接在聊天机器人中完成购物支付;

2. 从明年起PayPal生态的消费者与商户都可接入ChatGPT,用户可在平台上购买商品,商户商品库存也能上架销售;

3. 受此消息推动PayPal盘前一度大涨超15%,同时公司上调全年业绩预期并宣布成立27年来首次发放股息。

https://mp.weixin.qq.com/s/pagG97f9KUYw8zqnLR7m0A

六、Windsurf等美国公司们,接入Made in China大模型

1. 美国AI编程产品Windsurf被网友发现其神秘新模型来自中国智谱GLM,Cerebras也上架GLM-4.6推理服务;

2. 多家美国AI公司选择部署中国大模型的核心原因是性价比,OpenAI和Anthropic模型虽好但太贵,而中国模型性能够打且价格实惠;

3. Together AI、Vercel等美国平台已部署GLM-4.6等国产模型,中国大模型的Made in China含金量持续上升。

https://mp.weixin.qq.com/s/Ky8YUjD8cjkROmgnE3aWmQ

前沿科技

七、1X Technologies公司推出的NEO家用机器人,开卖

1. 全球首款家务人形机器人NEO正式开售,早鸟价20000美元或月租500美元,2026年发货,获OpenAI投资;

2. NEO身高168厘米重30公斤,内置Redwood AI系统可自动完成吸尘、洗碗归位、喂宠物等家务,续航4小时最大负载68公斤;

3. 华尔街日报记者体验发现目前所有动作由远程专家通过VR操控,1X承诺到2026年NEO将能自主完成家庭中大部分事务。

https://mp.weixin.qq.com/s/Ny1BVhnW7O1c0rD0d6jZNA

八、LeRobot v0.4.0 正式发布,全面提升机器人学习能力

1. Hugging Face发布LeRobot v0.4.0,引入可扩展的Datasets v3.0支持OXE量级超大规模数据集,新增数据集编辑工具;

2. 新版本集成PI0.5、GR00T N1.5等前沿VLA模型,新增对LIBERO与Meta-World仿真环境支持,简化多GPU训练;

3. 推出全新插件系统简化硬件集成,仅需pip install即可连接任意机器人设备,同步上线Hugging Face机器人学习课程。

https://mp.weixin.qq.com/s/s19OHTRUXyKN9zs_CpS0ng

报告观点

九、AGI权威新定义?图灵奖得主提出,GPT-5仅达57%

1. 图灵奖得主Yoshua Bengio等提出AGI新定义为"在认知多样性与熟练度上媲美或超越受过良好教育的成年人的AI";

2. 基于卡特尔-霍恩-卡罗尔理论构建框架,将通用智能分解为通用知识、读写能力、数学能力等10个核心认知领域进行评估;

3. 评估结果显示GPT-4的AGI得分仅为27%,GPT-5的得分也只有57%,表明当前AI缺乏许多对类人通用智能至关重要的核心认知能力。

https://mp.weixin.qq.com/s/Yh9TAzLgwao5MxtN9SGuhQ

十、OpenAI公开路线图,1.4万亿投资、GPT-6、IPO进程

1. OpenAI完成重组转为公共利益公司,非营利董事会OpenAI基金会持有26%股权价值约1300亿美元,微软成为第一大股东持股约27%;

2. 奥特曼透露公司预计到2029年现金消耗将超1150亿美元,未来将承担约1.4万亿美元财务责任构建30吉瓦基础设施,IPO是最可能方向;

3. 首席科学家帕乔基宣布目标在2026年9月前实现能实质性加速研究的AI科研助手,2028年3月前实现全自动化AI研究员。

https://mp.weixin.qq.com/s/3ZXoJBoEsAs_XQuuYiI2FQ

© 版权声明
THE END
喜欢就支持一下吧
点赞12 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容