OpenAI今天宣布,其最新的文本生成模型GPT-4已通过其API普遍可用。从今天下午开始,所有现有的OpenAI API开发者“有成功付款的历史”的人都可以访问GPT-4。该公司计划在本月底前向新的开发者开放访问权限,然后开始提高可用性限制,“取决于计算可用性”。
“自3月以来,数百万的开发者已经请求访问GPT-4 API,利用GPT-4的创新产品的范围每天都在增长,”OpenAI在一篇博客文章中写道。“我们设想一个未来,聊天模型可以支持任何用例。”
GPT-4可以生成文本(包括代码)并接受图像和文本输入——这是对其前身GPT-3.5的改进,后者只接受文本——并在各种专业和学术基准上表现得“像人类一样”。像OpenAI的前几个GPT模型一样,GPT-4使用公开可用的数据进行训练,包括来自公共网页的数据,以及OpenAI获得许可的数据。
图像理解能力尚未对所有OpenAI客户开放。OpenAI正在与一个合作伙伴Be My Eyes开始测试。但它还没有指出何时会向更广泛的客户群开放。
值得注意的是,就像今天的最好的生成AI模型一样,GPT-4并不完美。它会“产生幻觉”事实并犯下推理错误,有时甚至是自信地。它并不从经验中学习,在解决难题时失败,比如在生成的代码中引入安全漏洞。
在未来,OpenAI表示,它将允许开发者对GPT-4和GPT-3.5 Turbo进行微调,后者是其其他最近但能力较弱的文本生成模型之一(也是驱动ChatGPT的原始模型之一),使用他们自己的数据,就像OpenAI的其他文本生成模型一样,这种能力应该在今年晚些时候到来,根据OpenAI的说法。
自从3月份公开GPT-4以来,生成AI竞争变得更加激烈。最近,Anthropic将其旗舰文本生成AI模型Claude(仍在预览中)的上下文窗口从9,000个令牌扩大到100,000个令牌。(上下文窗口指的是模型在生成额外文本之前考虑的文本,而令牌代表原始文本——例如,“fantastic”会被分割成“fan”,“tas”和“tic”。)
GPT-4曾经在上下文窗口方面持有最高记录,最高端为32,000个令牌。一般来说,上下文窗口小的模型往往会“忘记”甚至是最近的对话内容,导致它们偏离主题。
在今天的相关公告中,OpenAI表示,它正在使其DALL-E 2和Whisper API普遍可用——DALL-E 2是OpenAI的图像生成模型,“Whisper”指的是公司的语音转文本模型。该公司还表示,计划废弃通过其API可用的旧模型,以“优化[其]计算能力”。(在过去的几个月里,由于ChatGPT的爆炸性流行,OpenAI在满足其生成模型的需求方面一直在努力。)从2024年1月4日开始,某些较旧的OpenAI模型——特别是GPT-3及其衍生产品——将不再可用,并将被新的“基础GPT-3”模型替代,人们可以推测这些模型更具计算效率。使用旧模型的开发者将需要在1月4日之前手动升级他们的集成,那些希望在1月4日之后继续使用微调旧模型的人将需要在新的基础GPT-3模型上微调替代品。
“我们将为之前微调模型的用户提供支持,使这个过渡尽可能顺利,”OpenAI写道。“在接下来的几周里,我们将联系最近使用过这些旧模型的开发者,并在新的完成模型准备好进行早期测试后提供更多信息。”