生成式AI
一、Nano Banana Pro的一张AI合影,肉眼难辨,刷爆全网
1. 谷歌Nano Banana Pro出世仅48小时即在LMArena榜单双榜第一,其AI生成的硅谷CEO合影刷爆全网,逼真到肉眼无法分辨;
2. 该模型基于Gemini 3 Pro,在文字-图像测试中领先第一代84分,在图像编辑中高出41分,可通过坐标生成特定地点历史事件;
3. 谷歌全栈优势凸显,从DeepMind研究人员搭建模型到自研TPU训练,再到集成到搜索、YouTube等应用直接触达用户。
https://mp.weixin.qq.com/s/PrhBNGvIzWJCqxMNP9j39A
二、NotebookLM震撼上线”一键生成幻灯片”功能,这次不一样
1. Google AI笔记神器NotebookLM正式推出”一键生成幻灯片”功能,用户只需上传资料即可在几分钟内生成逻辑清晰的演示文稿;
2. 提供详细版和演讲版两种核心模式,支持通过提示语精准控制幻灯片风格、受众和重点,输出多种语言满足跨国汇报需求;
3. 支持在线演示、PDF下载和链接共享多种管理方式,可广泛应用于学生复习、职场汇报和教师培训等多个场景。
https://mp.weixin.qq.com/s/A2DOsQLxGMtXU9h-rwJWlQ
三、Meta再推WorldGen,一句话,「盖」出50×50米一座城
1. Meta发布WorldGen系统,通过一段文本提示即可生成50×50米可导航、可交互的完整3D世界,不同区域以可通行方式连接;
2. 系统基于程序化推理、扩散模型3D生成和面向对象场景分解,输出几何一致、视觉丰富且渲染高效的3D世界;
3. 与基于Gaussian Splatting的Marble相比,WorldGen采用网格输出,原生支持物理模拟、碰撞检测和导航,可无缝接入Unity和Unreal引擎。
https://mp.weixin.qq.com/s/UBSyyp1jUOC8DbaOkuXoDQ
四、Karpathy组建大模型「议会」,GPT-5.1等化身最强智囊团
1. 前OpenAI联合创始人Karpathy用氛围编程做了新项目LLM议会,让GPT-5.1、Gemini 3 Pro、Claude Sonnet 4.5和Grok-4组成智囊团;
2. 问题会分发给所有模型,各模型能看到彼此匿名回答并进行审阅排名,最后由”主席模型”生成最终回答;
3. 项目已开源但Karpathy不会继续提供任何支持,这种多模型集成可能成为一种新型基准测试方式,还有大片未被探索的设计空间。
https://mp.weixin.qq.com/s/QAg3fK57Z4ZumuzG9Bykqw
五、腾讯混元全新视频模型HunyuanVideo 1.5,「元宝」率先上线
1. 腾讯混元开源HunyuanVideo 1.5视频生成模型,参数8.3B支持生成5-10秒高清视频,可在14G显存消费级显卡上流畅运行;
2. 模型支持中英文文生视频与图生视频,具备强指令遵循能力,可精准实现运镜、流畅运动、写实人物等多种指令;
3. 通过创新SSTA稀疏注意力机制和多阶段渐进式训练策略,可原生生成480p和720p视频,通过超分模型提升至1080p电影级画质。
https://mp.weixin.qq.com/s/ck2ZThdaQqbfPmI5MGtKnA
六、华为发布Flex:ai,能将资源利用率提升30%的AI容器技术
1. 华为正式发布Flex:ai AI容器技术,能将智算资源利用率提升30%,无生态限制支持英伟达GPU和华为昇腾NPU等算力卡;
2. 核心能力包括算力资源切分(一卡变N卡)、多级智能调度(负载算力精准匹配)和跨节点算力聚合(通算智算融合);
3. 对标英伟达7亿美元收购的Run:ai,在虚拟化和智能调度方面有独特优势,发布后将在魔擎社区开源供产学研共同探索。
https://mp.weixin.qq.com/s/_5a3vha4uY4rcI2o05bUpA
七、Thinking Machines Lab又融资,刷脸刷出3500亿独角兽
1. OpenAI前CTO Mira Murati创立的Thinking Machines Lab要筹集40-50亿美元,估值或达500亿美元(约3500亿人民币);
2. 公司此前已筹集20亿美元估值100亿美元,目前仅推出微调开源模型的API工具Tinker,几乎是0产品状态;
3. Murati凭借在OpenAI担任CTO的背景和产品管理经验获资本青睐,新公司聚焦”企业定制模型”和”行业落地”更务实方向。
https://mp.weixin.qq.com/s/JQRHhG-TPs-6IEBNEXzbqg
前沿科技
八、OpenAI与众高校:用AI协助科学研究,GPT-5案例进展
1. OpenAI与范德堡大学等多所高校及国家实验室合作论文显示,GPT-5帮助研究人员综合已知结果、加速艰难计算甚至生成新证明;
2. 生物学案例中GPT-5在几分钟内从未发表图表识别出可能机制,数学领域贡献了关于奇数打破模式的新想法帮助完成证明;
3. 算法与优化案例中GPT-5发现机器人路径规划方法可能失败的新例子,改进了优化中的经典结果,但专家监督仍至关重要。
https://mp.weixin.qq.com/s/pZcScIs4WzLfwK_q8aU8Cw
报告观点
九、6万亿美元对话?马斯克:钱没意义了,黄教主沉默了10秒
1. 马斯克与黄仁勋在美国-沙特投资论坛对谈,马斯克直言AI发展到一定阶段货币将不再具有实际意义,让黄仁勋沉默10秒;
2. 马斯克称人形机器人将成为有史以来规模最大的行业,特斯拉将率先突破,AI与机器人才能真正实现消除贫困目标;
3. 双方官宣合作,xAI将与沙特企业Humain合作建500兆瓦数据中心,英伟达将与AWS合作构建目标1000兆瓦规模数据中心。
https://mp.weixin.qq.com/s/2kOQxAYVD4sFe5JypXfH9w
十、微软CEO最新万字访谈:AI时代,范式正确不代表就能赢
1. 当前AI浪潮与90年代互联网泡沫不同,不是基础设施过剩而是算力供不应求的产能危机,瓶颈在于电力、涡轮机和增强型外壳供应;
2. 企业AI的核心在于构建自己的”AI工厂”和数据层,未来企业护城河将是把隐性知识转化为私有模型权重,这种”公司主权”将以LoRA权重形式存在;
3. 90年代微软虽看准互联网方向但押错交互式电视路径被开放网络超越,AI时代同样值得深思:即使范式正确,具体架构选择和商业模式仍决定成败。












暂无评论内容