这是独立创业者的时代。由于人工智能领域和开发人员友好的框架等最新发展,构建端到端的AI驱动应用变得前所未有地容易。曾经是由经验丰富的数据科学家主导的复杂领域现在已经民主化,变得像调用API一样简单(而且随着时间的推移将变得更好、更容易)。然而,在这个领域的所有噪音、炒作和不断的进展中,很难知道应该关注哪些方面以及使用哪种技术堆栈。

OpenAI API 这一点可能比您想象的更不明显。在所有的AI服务中,哪一个是最好的?什么因素决定了最好?对我来说,最好是指质量、可靠性、安全性、性能和价格。

在过去的几年里,我研究了众多的AI服务,包括OpenAI、AI21、Anthropic、Bloom、GPT-J等等。最近,开源模型的数量大幅增加,其中一些据说在性能上超越了更高级的模型,比如Falcon、Alpaca、Vicuna和Llama。然而,这些模型目前需要具备“LLM/ML运维”经验,以及投资于自己的托管和监控。作为独立创业者,有必要决定将业务的哪些部分放在重点关注的位置。

这些模型的结论和研究值得单独的文章来探讨。然而,简而言之,与竞争对手相比,OpenAI的GPT模型在性能和可靠性方面要远优于其他模型。尽管OpenAI的定价较高,但您可以使用chatgpt-3.5-turbo仅需0.002美元每750个字的价格构建强大的AI工具。当您进行计算时,这种价格之低廉令人难以置信。

此外,OpenAI还提供了一个简单易用的微调API。我利用微调创建了一个用于生成针对SEO和营销进行优化的内容的模型。

Replicate 在构建博客作者的编辑器时,利用图像生成非常重要。尽管Dalle是一个明显的API,但我对其缺少维度选项(例如1024×768)感到沮丧,这对博客来说是最佳的,而且Dalle的价格相当昂贵。此外,Dalle只在您的图片上保留一小时,因此您还需要与AWS S3等托管服务集成,以长期保留生成的图片。最后,我决心找到一个更类似于Midjourney质量的替代方案。这就是我发现Replicate的时候。

Replicate使部署和托管机器学习模型变得非常容易,并且可以用几行代码运行模型,无需理解机器学习的工作原理。在Replicate上托管的一个具体强大且病毒性的模型是基于Midjourney的图像训练的,显示出了一些非常令人印象深刻的结果!此外,该模型允许您定义多个宽度和高度以及输出的数量。尽管价格相对便宜,比Dalle便宜得多,而且是“按需付费”,根据推理计算时间付费。

Langchain LangChain是一个用大型语言模型(LLM)提供动力的应用程序开发框架。它是一个开源库,为开发人员提供了使用LLM(如OpenAI或其他类似模型)构建应用程序的工具。LangChain简化了这些应用程序的创建,并连接到您想要使用的AI模型。

毫无疑问,Langchain对所有开发人员来说都是必不可少的,是开发人员AI框架的明确领导者。Langchain不仅拥有最多的贡献者和支持者社区,而且是由开发人员为开发人员构建的。在线上有很多示例和代码片段,展示了“如何用10行代码构建一个chatpdf”的方法。而且真的,用Langchain构建LLM链和应用程序是非常容易的。

Langchain提供了构建AI代理的各种解决方案。它甚至支持最新的自主代理解决方案,如BabyAGI和AutoGPT。Langchain的一个非常强大和受欢迎的功能是称为ReAct,它旨在利用LLM进行推理和执行操作,例如仅在需要时提供工具。要了解有关ReAct及如何与Langchain一起使用的更多信息,请参见这里。

Pinecone 矢量数据库目前是最热门的数据库。在过去一年里,它们获得了超过10亿美元的投资,因此了解为什么几乎任何AI应用都应该集成矢量数据库(例如Pinecone)是至关重要的。

矢量数据库是专门设计用来存储和管理以向量表示的高维数据的数据库。这些数据库在处理复杂数据方面非常高效,并允许根据特定标准快速搜索相似项目。这在与GPT等LLM一起工作时尤为重要,因为它们能够克服令牌限制的问题。

然而,重要的是不要被“如果没有令牌限制会怎么样?”的想法所迷惑。在与AI模型和服务一起工作时,您按推理付费,换句话说,您根据发送给模型的令牌数量支付请求。每次请求发送超过10万个字会既慢又昂贵。矢量数据库有助于轻松检索与用户上下文和文本相似性相关的数据,从而优化了数据的相关性和成本。

此外,由于矢量数据库的性质,它们可以作为AI代理的长期内存,通过检索与对话上下文相关的相关“记忆”来提供支持。

选择正确的数据库取决于许多考虑因素。要考虑的主要选择包括Pinecone、Chroma、Milvus、Weaviate、Vespa和Elastic Search。有些是开源的,而其他一些则不是;有些提供可定制性,而其他一些则以简单性为目标。

我选择了Pinecone,因为它简单易用的托管服务可以为我减轻大部分负担。此外,Pinecone拥有非常庞大的社区、资金充足、可扩展性强,已经存在了足够长的时间(自2019年以来)。

FastAPI FastAPI是用于在Python中构建RESTful API的现代Web框架。它首次发布于2018年,并因其易用性、速度和稳健性而迅速赢得了开发人员的欢迎。与FastAPI类似的一个良好替代品是Flask,如本示例所示。

使用Python语言构建后端系统是一个巨大的优势。由于AI开发的指数增长,Python社区已经大规模增长,许多关键的开源项目都是专门为Python构建的。这些独特的开源项目包括应用程序和基础设施框架、LLM和矢量数据库等。与之不同,一些其他流行的框架,如Node.js,在构建与AI相关的工具方面拖后腿,其开源社区较小。随着AI的快速发展,保持领先地位对业务至关重要。

ReactJS 关于AI不再是技术创业公司的壕沟的讨论很多,因为它已经变得如此强大且易于集成。但我真的相信,构建面向特定垂直领域的优秀产品,以优化用户体验,会在竞争激烈的市场上创造出显著的优势。这就是为什么UX/UI仍然是王道,甚至在构建AI应用程序时比以往任何时候都更加重要。

您可能已经听说过Streamlit或Gradio,它们是用于构建数据驱动Web界面应用程序的Python框架。关于这些框架,通常存在于在后端代码之上轻松构建运行一些AI功能的Web应用程序的噪音。然而,这些框架通常只能构建出很棒的演示,但无法扩展。无论是React还是它的更高级框架,如Next.js和Vue.js,在全栈开发方面都无人能敌。通过利用React社区,您可以构建出非常强大的用户体验,这对于优化AI以满足用户需求至关重要。

Slate 正如我已经提到的,Cowriter是一个丰富的文本编辑器,因此我不得不找到构建编辑器的最佳React框架。这可能是所有研究中最长的一个,因为没有明确的获胜者。研究包括亲自尝试并错误地使用多个框架,直到找到最合适的一个。每个编辑器都会针对不同的业务目标进行优化。我研究了Draft.js、Editor.js、Slate.js、Plate.js、Quill等等。

例如,如果您想要在项目后面有一个大型组织的支持,并且有相当广泛的采用,那么Facebook的Draft.js可能是最佳选择。然而,诸如嵌套和协作编辑等功能可能难以实现。另外,Editor.js提供了一系列开箱即用的功能,如果您想要快速入门,这是一个很好的选择。如果您追求的是终极控制和支持,并且也希望实现协作的可能性,那么Slate.js就是最佳选择,但请准备好额外的工作来进行设置。最后,Plate.js是在Slate.js之上构建的,并提供了许多插件,用于实现强大的功能,但如果您希望创建可定制的AI体验,那么可能不是最佳选择。

最终,Slate.js对我来说是最好的选择,因为它有一个伟大的社区,并且可以完全自定义以构建强大的编辑器。对于AI驱动的编辑器,重要的是要创建一些体验,例如自动化写作、丰富的动画手势、选择工具箱、Markdown支持、DOM操作、添加图像等等。

Netlify Netlify是一个云计算平台,可以自动化部署Web项目。它使开发人员更轻松、高效地构建、部署和管理现代网站和Web应用程序。Netlify还提供其他功能,如持续集成和部署(CI/CD)、用于动态内容的无服务器函数、表单处理等等。

总的来说,Netlify简化了Web开发和托管的过程,使其对开发人员和企业更加可访问和高效。

最近,我一直在探索不同的部署选项,令我惊喜的是发现与Netlify合作如何轻松高效。不仅如此,与我以前使用的其他选项(如直接在AWS上部署)相比,性能没有受到任何影响。最棒的部分是什么?对于单一项目来说,它完全免费!

Stripe Stripe是一个在线支付处理平台,允许在互联网上接受支付。它提供一套API和软件工具,使企业能够安全地接受和管理在线支付。Stripe还提供其他功能,如可定制的结账页面、欺诈检测、订阅计费等等。

我正在寻找最快的市场时间与支付集成,并发现Stripe令人惊讶的最新功能Checkout。Checkout是一个预构建的托管支付页面,可以在几分钟内无需代码配置。我能够在不到一天的工作时间内从无收益到出色的支付结账流程。

在技术堆栈中还有许多其他要考虑的框架,例如HuggingFace、Supabase、LLamaIndex等等。一切都取决于产品、垂直领域、上市时间、资源和规模。对我来说,选择一个可以让我成功作为独立开发人员的技术堆栈非常重要,主要集中在构建出色的产品和支持客户,而不必担心基础架构、规模、性能、非战略性资产等方面的问题。拥有更多资源和资金,您可以更有创造性地选择最适合您的技术堆栈。

如果您有任何问题,或者想知道哪种技术堆栈对您来说最好,请随时在下面留下评论

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注