当您想到基础模型及其可以完成的任务时,您很可能会想到文本和图像创建。 然而,Numbers Station 正在将这些模型引向一个截然不同的方向。 这家初创公司今天宣布了 1750 万美元的 A 轮融资,正在使用这些模型来构建公司所谓的“智能数据堆栈自动化平台”。 这轮融资由 Madrona 领投,Norwest Venture Partners、Factory 和包括 Cloudera 联合创始人 Jeff Hammerbacher 在内的一些天使投资人跟投。
Numbers Station 由斯坦福大学博士 Chris Aberger(首席执行官)、Ines Chami(首席科学家)和 Sen Wu 以及斯坦福大学副教授 Chris Ré 共同创立,旨在从数据转换开始,将 GPT 式基础模型的强大功能引入企业用例 并记录匹配。 为此,该公司使用这些基础模型,例如将自然语言查询转换为 SQL 命令。
“我们都获得了人工智能和数据系统混合方面的博士学位,”当我问及公司的起源时,Aberger 告诉我。 “我们当时看到,大多数人工智能人才真正专注于——找不到更好的词——更性感的人工智能应用程序。 您在新闻中看到的所有内容:营销内容生成、图像生成,无论是什么。 […] 但大多数 AI 人才并没有专注于这些肮脏的数据管道、数据处理、数据整理、数据准备操作。 这不像生成图像来说明我们将重新格式化您数据库中的日期那样性感,但这仍然是一个巨大的企业问题和企业需求。”
Aberger 还指出,当团队研究许多企业内部以数据为中心的不同团队如何协同工作时,许多不同的能力被锁定在不同的团队中,同时这些团队将大量时间花在日常数据转换工作上 需要启用更复杂的用例。 他相信 Numbers Station——以及为其提供支持的基础模型——将能够使这些功能的访问民主化。
“在高层次上,我们的使命是加速这些团队和数据分析师团队,这样他们就可以花更多的时间提供见解,而花更少的时间在这些平凡的数据操作上,”Aberger 解释道。
实际上,这意味着该服务目前提供三种不同的功能。 第一个是 SQL 转换,它允许用户用自然语言指定他们需要的内容,然后 Numbers Station 生成 SQL 查询。 另一个是该公司所谓的“AI 转型”,即由 AI 驱动的智能数据转型原型的能力。 最后,Numbers Station 还提供记录匹配功能,例如,允许用户将其 CRM 和销售系统中的记录合并到一个数据库中。
正如 Numbers Station 联合创始人兼首席科学家 Ines Chami 告诉我的那样,该团队并不是简单地采用基础模型并将其应用于所有这些用例。 “针对组织对模型进行个性化和调整非常重要,”她说。 “我们的想法是生成特定于组织的答案,因此我们使用微调技术和反馈。” 她指出,该公司开始为用户提供通用的预训练模型,但随后,随着用户向模型提供反馈,它会为这些用户生成更小的、特定于组织的模型。 “为了使 [模型] 适应组织知识,这在很大程度上是人在循环中。 因此,在所有方面,我们都注意到超越通用模型非常重要。 这是一个很好的开始,但很快,您需要对模型进行微调和专业化,”她解释说,并指出公司始终将每个客户的数据保持在孤立状态。
Aberger 还强调,在他看来,来自 OpenAI 之类的基础模型将变得商品化。 “真正重要的是,你在这些模型之上的哪些地方应用了 AI 专业知识,使它们在特定组织和特定组织的任务中表现得非常好,”他说。
毫无疑问,Numbers Station 将前三个功能视为其进入企业数据堆栈的入口点。 这里更大的愿景是构建一个数据智能平台,该平台不仅可以帮助企业转换数据,还可以对其进行分析。 但要做到这一点,它首先需要帮助企业清理他们的记录。
“我们相信基础模型,特别是 Numbers Station 团队如何应用它们,提供了真正‘零到一’的机会来解决处理混乱数据的巨大挑战,”将加入 Numbers Station 的 Madrona 常务董事 Tim Porter 说 木板。 “更令人兴奋的是,数据准备只是团队雄心勃勃的愿景的第一步。 例如,将这些智能转换立即连接到自动化工作流中是 Numbers Station 方法的另一个关键优势。 我们很高兴能够支持这个世界级的客户驱动团队,因为他们构建了我们相信所有企业都将视为其现代数据堆栈中的关键元素的平台。”