Covariant成立于2017年,目标简单:帮助机器人更好地学会抓取物品。这是那些希望建立自动化仓库的人们的一大需求,而这个需求比表面上看起来要复杂得多。我们遇到的大多数商品在某个时候都经过了仓库,其尺寸、形状、质地和颜色的范围广得难以置信。
这家位于旧金山湾区的公司已经开发出一套基于AI的系统,可以训练网络机器人在执行过程中不断提高抓取能力。在今年ProMat展会现场的一次演示中,观众看到了一个连接的机械臂能多么迅速地识别、抓取和放置各种不同的物品。
联合创始人兼首席执行官Peter Chen在上周的展会上接受了TechCrunch的采访,讨论了机器人学习、构建基础模型以及与ChatGPT相关的话题。
TechCrunch:作为一家创业公司,尽可能使用现成的硬件是有道理的。
PC:是的。Covariant起步时与众不同。我们从纯软件和纯AI开始。公司的第一批员工都是AI研究员。我们没有机械工程师,也没有从事机器人方面的人员。这使我们能够比其他人更深入地研究AI。如果你看看ProMat展会上的其他机器人公司,他们可能使用的是一些现成的模型或开源模型——这些都是学术界用过的。
比如ROS。
是的。ROS或者开源计算机视觉库,它们都很好。但我们所做的与这些根本不同。我们关注学术AI模型提供的内容,发现它们还不够完善。学术AI是在实验室环境中构建的。它们无法经受真实世界的考验,尤其是许多客户、数百万种技能、数百万种需要由同一AI处理的不同类型物品带来的考验。
许多研究人员采用了很多不同的学习方法。你们的方法有什么不同之处?
Covariant的创始团队中有很多人来自OpenAI,比如四位联合创始人中的三位。如果你看看过去三四年OpenAI在语言领域所做的事情,基本上就是采用基础模型方法处理语言。在最近的ChatGPT之前,已经有很多自然语言处理AI。搜索、翻译、情感检测、垃圾邮件检测——市场上有很多自然语言AI。在GPT之前的方法是针对每个用例,使用更小的数据子集来训练特定的AI。现在看看结果,GPT基本上颠覆了翻译领域,而且它甚至并没有针对翻译进行训练。基础模型方法的核心思想是,不是使用针对某个特定情况的少量数据或训练一个针对某个特定环境的模型,而是在更多数据上训练一个大型基础通用模型,使AI更具通用性。
你们主要关注抓取和放置,但是你们是不是也在为未来的应用奠定基础?
当然。抓取能力或抓取和放置能力肯定是我们首先赋予机器人的通用能力。但是,如果你深入了解,会发现有很多3D理解或物体理解的知识。许多认知原语可以推广到未来的机器人应用。话虽如此,抓取或拾取领域如此广泛,我们还可以在这个领域工作一段时间。
你们首先关注抓取和放置,是因为对此有明确的需求。
需求明确,而且现有技术无法满足这种需求。有趣的是,如果你十年前来参加这个展会,你也能找到抓取机器人。只是它们不起作用。这个行业在很长一段时间里一直在与这个问题作斗争。人们说这个问题在没有AI的情况下无法解决,所以人们尝试了小众AI和现成的AI,但它们都不起作用。
你们的系统正在汇入一个中央数据库,每次抓取都在告诉机器如何在未来进行抓取。
是的。有趣的是,我们接触到的几乎每一样物品都在某个时候经过了仓库。仓库几乎是物理世界中所有物品的中心交汇点。从构建仓库AI开始,为离开仓库的AI打下了很好的基础。假设你从田地里摘了一个苹果,带到了农业工厂——它以前见过苹果。它以前见过草莓。
那是一对一的。我在一个配送中心摘一个苹果,所以我可以在田地里摘一个苹果。更抽象地说,这些学习成果如何应用到生活的其他方面?
如果我们从Covariant的具体情况退一步,思考技术趋势的走向,我们正在目睹AI、软件和机电一体化领域的有趣融合。传统上,这三个领域彼此有些独立。机电一体化是你在这个展会上会发现的东西。它关注的是可重复运动。如果你和销售人员交谈,他们会告诉你关于可靠性,以及这台机器如何能够反复执行相同的操作。
过去15到20年,我们从硅谷看到的令人惊叹的进步是在软件方面。人们已经攻克了如何构建复杂且具有高度智能的软件的难题。我们现在使用的所有这些应用程序,实际上就是人们在利用软件的能力。现在,我们正处于AI的前沿,目睹着所有令人惊叹的进步。当你问我仓库之外还有什么时,我认为未来的方向是这三个趋势的融合,以在世界上构建高度自主的物理机器。你需要所有这些技术的融合。
你提到了ChatGPT闯入翻译软件领域并令人措手不及。这在技术领域是常有的事。你担心GPT会闯入并实际上破坏Covariant正在做的工作吗?
这对很多人来说是个好问题,但我认为我们在这方面具有不公平的优势,因为我们开始时就基本上持有与OpenAI相同的信念,即构建基础模型。通用AI比建立小众AI更好。这就是我们过去五年一直在做的事情。我想说我们处于非常有利的地位,我们非常高兴OpenAI证明了这种理念非常有效。我们非常兴奋能够将这种理念应用到机器人领域。
原文:
此处内容需要权限查看