生成型人工智能——可以写作文、创作艺术品和音乐等的AI——继续吸引投资者的过度关注。据一份来源称,2023年第一季度,生成型AI初创公司筹集了17亿美元资金,该季度还有106.8亿美元的交易已经宣布但尚未完成。
竞争激烈,包括像OpenAI和Anthropic这样的现有公司。但尽管如此,风投公司并未回避未经测试的参与者和新兴公司。
举例来说,一家正在开发开源生成型AI的初创公司Together,今天宣布它筹集了2000万美元——这在种子轮融资中属于较大的一方——由Lux Capital领投,Factory、SV Angel、First Round Capital、Long Journey Ventures、Robot Ventures、Definition Capital、Susa Ventures、Cadenza Ventures和SCB 10x参与。包括PayPal的联合创始人Scott Banister和Cloudera的创始员工Jeff Hammerbacher在内的一些高调天使投资者也参与其中。
“Together正在引领AI的‘Linux时刻’,通过提供一个覆盖计算和最优秀的基础模型的开放生态系统,”Lux Capital的Brandon Reeves通过邮件告诉TechCrunch。“Together团队致力于创建一个充满活力的开放生态系统,让任何人,从个人到企业,都可以参与。”
Together于2022年6月启动,是Vipul Ved Prakash、Ce Zhang、Chris Re和Percy Liang的创意产物。Prakash之前创办了社交媒体搜索平台Topsy,该平台于2013年被苹果公司收购,他后来成为苹果的高级主管。Zhang是苏黎世联邦理工学院的计算机科学副教授,目前正在休假,并领导“去中心化”AI的研究。至于Re,他联合创办了各种初创公司,包括SambaNova,该公司为AI构建硬件和集成系统。而Liang是斯坦福大学的计算机科学教授,他指导该校的基础模型研究中心(CRFM)。
通过Together,Prakash、Zhang、Re和Liang正在寻求创建开源生成型AI模型和服务,用他们的话说,这些模型和服务“帮助组织将AI融入他们的生产应用程序”。为此,Together正在构建一个云平台,用于运行、训练和微调开源模型,联合创始人声称,该平台将提供比主导供应商(如Google Cloud、AWS、Azure)“大大降低”的可扩展计算能力。
Prakash在一次邮件采访中告诉TechCrunch:“我们认为生成模型对社会来说是一项重要的技术,开放和去中心化的替代方案对于实现AI和社会的最佳结果至关重要。在企业界定义他们的生成AI策略时,他们在寻求隐私、透明度、定制化和部署的便利。当前的云服务,使用闭源模型和数据,不能满足他们的需求。”
他的观点有一定道理——至少现有的公司正在感受压力。本月早些时候泄露的一份Google内部备忘录暗示,搜索巨头——以及其竞争对手——无法在长期内与开源AI项目竞争。同时,据报道,OpenAI正在准备公开发布其首个开源文本生成AI模型,这在开源替代品日益增多的情况下。
Together的首个项目之一,RedPajama,旨在培养一系列开源生成模型,包括类似OpenAI的ChatGPT的“聊天”模型。RedPajama是Together与多个团体(包括MILA Québec AI Institute、CRFM和ETH的数据科学实验室DS3Lab)的共同作品,它首先发布了一个数据集,使组织能够预训练可以许可使用的模型。
迄今为止,Together的其他努力包括GPT-JT,这是一个开源文本生成模型GPT-J-6B(由研究团队EleutherAI发布)的分支,以及OpenChatKit,这是一个试图成为ChatGPT等价物的尝试。
Prakash说:“如今,训练、微调或产品化开源生成模型极具挑战性。当前的解决方案要求你在AI方面有深厚的专业知识,同时还能管理大规模的基础设施。Together平台从一开始就能处理这两个挑战,提供一个易于使用且易于获取的解决方案。”
然而,Together的无缝性还有待观察——该平台尚未在GA上推出。并且,有人可能会争辩说,它的努力在更广泛的AI景观中有些重复。来自社区团体和大型实验室的开源模型数量几乎每天都在增长。尽管并非所有模型都被许可用于商业使用,但是有几个,如Databricks的Dolly 2.0,是被许可的。
在AI硬件基础设施方面,除了大型公共云供应商外,像CoreWeave这样的初创公司声称提供的计算能力强大且价格低于市场价。甚至还有尝试构建社区驱动的、免费的AI文本生成模型运行服务的公司。(Together打算追随这些社区团体的脚步,构建一个名为Together Decentralized Cloud的平台,该平台将整合来自互联网上的志愿者的硬件资源,包括GPU。)
那么,Together能带来什么呢?Prakash认为是更大的透明度、控制力和隐私保护。这是一个销售策略,与初创公司Stability AI的销售策略相似,该公司将计算能力和资本引导向开源研究,同时商业化——并在各种成品上提供服务。
他说:“受监管的企业将是开源的大客户,因为在开放数据集上预训练的开源模型使组织能够全面检查、理解并将模型定制到他们自己的应用中。我们认为,只有全球社区共同努力,才能克服AI面临的挑战。所以我们把建设和管理一个能够为人类生产最好的AI系统的自我维持、开放的生态系统作为我们的使命。”
这无疑是一个崇高的目标。对于Together来说,现在还是初期阶段,公司并未透露目前是否有任何客户——更不用说收入了。但该公司正在积极向前推进,计划在今年年底前将团队规模从24人增加到大约40人,并花费剩余的种子资金用于研发、基础设施和产品开发。
Prakash说:“基于开源生成模型的Together解决方案,是在理解大型组织的需求并满足这些需求的基础上构建的,为企业提供他们的生成AI策略的核心平台。Together正在看到企业对更大透明度、控制力和隐私保护的强烈兴趣。”