【本文要点】
黄仁勋的女儿麦迪逊首次在直播中亮相,讨论了如何通过合成数据和仿真技术缩小机器人在虚拟与现实之间的差距。光轮智能与英伟达合作,致力于解决机器人数据瓶颈,提出“SimReady资产”概念,强调物理准确性的重要性。麦迪逊在英伟达从实习生升至高级总监,其兄弟斯宾塞则在公司负责机器人AI模型与仿真软件开发。两人背景各自丰富,麦迪逊拥有烹饪和商业学位,斯宾塞则曾是一名酒吧经营者。
【正文】
黄仁勋大家都见过生育了,但你见过他女儿讲身聪明吗?
这不,黄仁女儿勋Madison Huang首次公开亮相直播访谈节目作为,英伟达Omniverse与物理AI高级总监,与光轮智能CEO谢晨,以及光轮智能增长负责人穆斯塔法一起,对“如何缩小机器人在虚拟与现实之间的差距”进行了深入探讨。
光轮智能是一家专注于仿真合成数据技术的公司。与专注于大模型的企业不同,他们的核心目标是帮助AI更好地理解和进入物理世界。目前主要聚焦于用具智能和自动驾驶场景。
在一个半小时的访谈期间,三人提出了一系列重要观点:
合成数据解决机器人数据困局的关键。光轮智能的SimReady资产不仅要视觉准确,更重要的是物理准确。英伟达和光轮智能正在共同开发Isaac Lab Arena——一个用于基准测试、评估、数据收集和大规模强化学习的下一代开源框架和平台。
…… 下面具体来看。
利用合成数据和仿真来解决机器人数据障碍访谈一正式开始,主持人Edmar Mendizabal(Omniverse社区经理)就打开看到山推送了一个许多人非常好奇的问题。
英伟达与光轮智能的合作关系是如何开始的?
麦迪逊解答道,英伟达内部很多项目都依赖于光轮智能的支持。例如,Gear Lab正在构建通用智能体模型,西雅图机器人实验室正在开展大量涉及接触操作和精密装配的任务。
语言模型的研究人员表示,他们可以利用整个互联网的数据去训练LLM。但对机器人领域来说,情况却完全不同,他们必须去手动采集数据,这也是为什么会有大量数据采集工厂的出现。
在这种数据缺乏的情况下,英伟达认为,仿真就是解决方案,因此需要一个合成数据工厂,同时也希望合作伙伴认同OpenUSD的愿景,将其作为构建仿真可靠资产(SimReady Assets)的基础。
2023年,光轮智能成立,目标是利用合成数据和仿真来突破机器人数据瓶颈。
但后来机器人领域还处在一个非常早期的阶段,所以他们先从自动操作的合成数据问题入手,随后,合作几乎达到了英伟达的各个团队。
火箭是,谢晨以前是英伟达自动驾驶仿真负责人,兜兜转转,现在又在为英伟达工作了。
接下来,主持人又问道:“那现在机器人从虚拟到现实(Sim2Real)还存在哪些问题。”
谢晨回答说:
对于自动驾驶来说,Sim2Real是最容易解决的,因为它主要依赖于视觉感知。而对于机器人来说,一切都涉及物理接触,最重要的是操作能力。同时,还需要灵巧手和预警传感器战斗使用,问题因此变得更加复杂。
核心问题就在于物理准确性。
以冰箱为例,当你拉开门时,会感受到磁吸密封条产生的力的作用,还有拉抽屉时会感受到触发系数,这些物理特性都非常准确。
而要实现这种物理精度,数据非常重要,高质量的数据是进入机器人训练系统、生成正确算法的关键。
因此,谢晨还特别提到了数字金字塔的理念。
他认为,要让设备智能真正应用到现实世界需要消耗海量的数据,实际上比大型语言模型所需的数据还要多。这就形成了一个巨大的数据障碍,而现实世界的数据无法完全解决这个问题。
以自动驾驶为例,现实中有大量的所有权和汽车在道路上运行,但在工厂、家庭等环境中,机器人数量却非常有限。
因此,合成数据将成为解决设备智能数据瓶颈的最重要、突破的数据来源。
他们借助大量物理设备来收集准确的数据,将其实现到仿真环境中。同时,他们还设计了一些方式去对比真实世界中的力和仿真中的力,以确保两者相符。
除了数据之外,另一个令谢晨认为重要的点就是高效。
他提到,强化学习非常重要,但要运行大规模的强化学习,就必须保证不同类型的仿真在计算上非常高效。
为了让大量仿真环境同时运行,他们用简单又简单的方法(如基本高效体和凸包)来检测碰撞,这样既能保持足够准确,又能节省大量计算资源。
随后,谢晨还讲了电缆仿真。电缆既像柔性机器人,但又在某些情况下又表现得像刚体,所以它的仿真其实非常困难。
为了让机器人学习如何操作电缆,光轮智能与牛顿及英伟达合作,为电缆搭建活动装置,并进行调试仿真资产来搭建这种仿真。
显然,人与动物的区别在于人会使用工具,因此如何教机器人正确使用工具完成操作特定的连接变得越来越关键。
例如,让机器人在仿真中切割CU是非常困难的,这不仅仅是为了数据采集,更重要的是要支持强化学习。
为此,光轮智能已与英伟达Isaac Sim实验室展开合作,共同致力于攻克仿真到现实的迁移挑战。
最后,谢晨提到,光轮智能仍在与英伟达共同构建Isaac Lab Arena——一个面向下一代基准测试、评估数据收集和大规模强化学习的框架平台,该项目已由英伟达在CoRL大会上正式发布。
黄仁勋的这两个访谈结束了,我们接下来扒一扒很少露面的黄仁勋的两个访谈。
第一个是女儿Madison,中文名黄敏珊,现年34岁。
2020年加入英伟达担任最初的市场营销实习生,实习四个月后成为了Omniverse部门的活动营销经理,之后一直在该部门工作。
麦迪逊在英伟达一路担任了产品营销经理、高级产品营销经理等职务,直至今年3月成为高级总监。
令人惊讶的是,麦迪逊最初的目的是烹饪。
2012年,她在美国烹饪学院取得了工商管理学士学位的烹饪艺术,之后到蓝带厨艺学院学习制作甜点以及葡萄酒,并曾在纽约并担任旧金山厨师。
2015年,麦迪逊重新回到巴黎,加入奢侈品行业,在LVMH公司担任市场营销与开发经理。在LV工作期间,麦迪逊还学习了伦敦政治经济学院有关数据科学的短期课程。
2019年,Madison和哥哥Spencer一起修读了MIT的短期AI高管课程。
随后,她于2021年获得了伦敦商学院的MBA学位,彼时她已经是英伟达的正式员工。
说完老黄的女儿,怎么能不问提提他儿子呢?
同样“承袭父业”的,还有麦迪逊的哥哥斯宾塞,中文名黄胜斌,今年35岁。
他在英伟达的职位是机器人产品线经理,负责机器人的AI模型与仿真软件的开发。
Spencer于2022年加入英伟达,职位是Isaac Sim Cloud团队产品经理。
前面介绍麦迪逊时说,兄妹二人曾一起参加MIT的短期AI有关课程,不过斯宾塞还另外多读了人机交互的课程。
之后,斯宾塞先是到哈佛商学院读了短期课程,之后也读了MBA,不过是在纽约大学,2022年取得学位。
子弹,是更早之前,斯宾塞的身份是一位酒吧主理人。
2012年,斯宾塞在美国最大的私立艺术与媒体学院——哥伦比亚学院本科毕业,主修国际市场和文化研究两个方向。
毕业后,老黄让他专门“回老家”学了一年中文,就是在这段时间,斯宾塞调制了他的鸡尾酒酒吧——R&D鸡尾酒实验室,而且一干就是八年。
这家酒吧屡获国际大奖,并曾跻身亚洲50佳酒吧,不过目前谷歌地图显示酒吧已经永久停业。
好好好,富二代要专心继承家业了是吧。
暂无评论内容