ChatGLM-6B简介:
ChatGLM-6B 是一个开源的、支持中英双语的对话语言模型,基于 General Language Model (GLM) 架构,具有 62 亿参数。结合模型量化技术,用户可以在消费级的显卡上进行本地部署(INT4 量化级别下最低只需 6GB 显存)。 ChatGLM-6B 使用了和 ChatGPT 相似的技术,针对中文问答和对话进行了优化。经过约 1T 标识符的中英双语训练,辅以监督微调、反馈自助、人类反馈强化学习等技术的加持,62 亿参数的 ChatGLM-6B 已经能生成相当符合人类偏好的回答,更多信息请参考我们的博客。
为了方便下游开发者针对自己的应用场景定制模型,我们同时实现了基于 P-Tuning v2 的高效参数微调方法 (使用指南) ,INT4 量化级别下最低只需 7GB 显存即可启动微调。
不过,由于 ChatGLM-6B 的规模较小,目前已知其具有相当多的局限性,如事实性/数学逻辑错误,可能生成有害/有偏见内容,较弱的上下文能力,自我认知混乱,以及对英文指示生成与中文指示完全矛盾的内容。请大家在使用前了解这些问题,以免产生误解。更大的基于 1300 亿参数 GLM-130B 的 ChatGLM 正在内测开发中。
下面??是一些基于 ChatGLM-6B 开发的优秀项目,或相关的有用链接和简单介绍:
欢迎将基于ChatGLM-6B开发的优秀项目、教程、应用、体验,通过下方评论反馈给我们,我们将每周更新一次本文档,也会将本文档内容同步到官方 Github PROJECT 中。
1、对 ChatGLM 进行加速或者重新实现的开源项目
-
SwissArmyTransformer: 一个Transformer统一编程框架,ChatGLM-6B已经在SAT中进行实现并可以进行P-tuning微调。
-
ChatGLM-MNN: 一个基于 MNN 的 ChatGLM-6B C++ 推理实现,支持根据显存大小自动分配计算任务给 GPU 和 CPU。
-
JittorLLMs:最低3G显存或者没有显卡都可运行 ChatGLM-6B FP16, 支持Linux、windows、Mac部署。
2、基于或使用了 ChatGLM-6B 的开源项目
-
chatgpt_academic: 支持ChatGLM-6B的学术写作与编程工具箱,具有模块化和多线程调用LLM的特点,可并行调用多种LLM。
-
闻达:大型语言模型调用平台,基于 ChatGLM-6B 实现了类 ChatPDF 功能。
-
glm-bot:将ChatGLM接入Koishi可在各大聊天平台上调用ChatGLM。
-
Chinese-LangChain:中文langchain项目,基于ChatGLM-6b+langchain实现本地化知识库检索与智能答案生成,增加web search功能、知识库选择功能和支持知识增量更新。
-
bibliothecarius:快速构建服务以集成您的本地数据和AI模型,支持ChatGLM等本地化模型接入。
-
langchain-ChatGLM:基于本地知识的 ChatGLM 应用,基于LangChain。
-
ChatGLM-web:基于FastAPI和Vue3搭建的ChatGLM演示网站(支持chatglm流式输出、前端调整模型参数、上下文选择、保存图片、知识库问答等功能)。
-
ChatGLM-6B-Engineering:基于 ChatGLM-6B 后期调教,网络爬虫及 Stable Diffusion 实现的网络搜索及图片生成。
3、对 ChatGLM-6B 进行微调的开源项目
-
InstructGLM:基于ChatGLM-6B进行指令学习,汇总开源中英文指令数据,基于Lora进行指令数据微调,开放了Alpaca、Belle微调后的Lora权重,修复web_demo重复问题。
-
ChatGLM-Finetuning:基于ChatGLM-6B模型,进行下游具体任务微调,涉及Freeze、Lora、P-tuning等,并进行实验效果对比。
-
ChatGLM-Tuning: 基于 LoRA 对 ChatGLM-6B 进行微调。类似的项目还包括 Humanable ChatGLM/GPT Fine-tuning | ChatGLM 微调。
-
Med-ChatGLM:基于中文医学知识的ChatGLM模型微调。
4、针对 ChatGLM-6B 的教程/文档
5、B站视频教程
B站视频教程:
3. 【ChatGLM-6B+StableDiffusion+网络搜索】本地部署可绘图,网上寻找信息的AI,https://www.bilibili.com/video/BV1gX4y1B7PV
5. chatglm-类Chat-GPT本地部署,整合包下载即用,企业·个人·行业知识库检索,保姆级搭建讲解,清华chatglm6b模型,https://www.bilibili.com/video/BV1hs4y1A7kz
7. 秋葉aaaki ChatGLM-6B 清华开源模型一键包,https://www.bilibili.com/video/BV1E24y1u7Go
原文链接:
隐藏内容
此处内容需要权限查看
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。