+8613426109659

webmaster@21cto.com

登录注册

盘点 ChatGPT 与 Bard 的 8 个开源替代品

场长

人工智能 0 4670 2023-04-10 11:05:16

导读：这里为您找到被广泛使用的开源框架怀模型，用于创建ChatGPT聊天机器人、集成 LLM 或启动您的新 AI 软件产品。

以下为各位介绍 8 种开源ChatGPT开源替代品。

LLaMALLaMA 项目包含一组基础语言模型，其大小从 70 亿到 650 亿个参数不等。

这些模型在数百万个 Token 上进行训练，并且专门在公开可用的数据集上进行训练。因此，LLaMA-13B 优于 GPT-3 (175B)，LLaMA-65B 的性能与 Chinchilla-70B 和 PaLM-540B 等优质模型相似。

图片来源：LLaMA （https://arxiv.org/abs/2302.13971）

相关资源：

GitHub: https://github.com/facebookresearch/llama

演示地址：https://huggingface.co/spaces/project-baize/baize-lora-7B

2. Alpaca

Stanford Alpaca（https://crfm.stanford.edu/2023/03/13/alpaca.html）声称它可以与 ChatGPT 竞争，任何人都可以以用不到 600 美元的价格复制并使用它。

Alpaca 7B 是根据 LLaMA 7B 模型在 52K 指令中进行微调。

训练图谱：https://crfm.stanford.edu/2023/03/13/alpaca.html

相关资源：

相关博客：https://crfm.stanford.edu/2023/03/13/alpaca.html

GitHub: https://github.com/tatsu-lab/stanford_alpaca

Demo：https://huggingface.co/spaces/tloen/alpaca-lora

3.Vicuna

Vicuna（https://vicuna.lmsys.org/）是根据 LLaMA 模型对从ShareGPT（https://sharegpt.com/）收集的用户共享对话数据进行微调。

Vicuna-13B 模型已达到 OpenAI ChatGPT 和 Google Bard 90%以上的质量。即使在 90% 的情况下，它的表现也优于 LLaMA 和 Stanford Alpaca 模型。目前训练 Vicuna 的费用约为 300 美元。训练和服务代码，以及在线演示都是公开的，可用于非商业用途。

图片来自Vicuna（https://vicuna.lmsys.org/）

相关资源参考：

Vicuna：开源聊天机器人，以能够 90%以上达到 ChatGPT 质量，也给 GPT-4 留下深刻象（https://vicuna.lmsys.org/）
GitHub: lm-sys/FastChat（https://github.com/lm-sys/FastChat#fine-tuning）
演示：FastChat (lmsys.org)（https://chat.lmsys.org/）

4. OpenChatKit

OpenChatKit：开源 OpenChatKit 是一个用于创建聊天机器人的完整工具包。它提供了用于训练属于你自己的指令调整的大型语言模型、微调模型、用于更新机器人响应的可扩展检索系统，以及用于过滤问题的机器人审核指令。

图片来自TOGETHER

正如我们所见，GPT-NeoXT-Chat-Base-20B 模型在问答、提取和分类任务上的表现优于基本模式 GPT-NoeX。

相关资源：

GitHub：https://github.com/togethercomputer/OpenChatKit
参考文章：OpenChatKit：开源 ChatGPT 替代方案

5. GPT4ALL

GPT4ALL（https://github.com/nomic-ai/gpt4all）是一个社区驱动的开源项目，它在大量精选辅助交互语料库上进行训练，包括代码、故事与相关描述。

此团队也是非常勤奋，他们提供了数据集、模型权重、数据管理过程和训练代码，以全力促进开源。此外，他们还发布了可以在笔记本上运行的模型量化版本。

开发者甚至可以使用 Python 客户端来运行模型推理。

来源：GPT4ALL（https://github.com/nomic-ai/gpt4all）

相关资源：

技术报告：
https://s3.amazonaws.com/static.nomic.ai/gpt4all/2023_GPT4All_Technical_Report.pdf
GitHub: https://github.com/nomic-ai/gpt4all
演示：https://huggingface.co/spaces/rishiraj/GPT4All（非官方）
模型：https://huggingface.co/nomic-ai/gpt4all-lora

6.Raven RWKV

Raven RWKV 7B（https://huggingface.co/spaces/BlinkDL/Raven-RWKV-7B）是一款开源聊天机器人，由RWKV（https://github.com/BlinkDL/RWKV-LM）语言模型提供支持，可产生与 ChatGPT 类似的问答结果。

该模型使用的 RNN 可以在质量和缩放方面匹敌ChatGPT，同时速度更快并节省 VRAM。

Raven 在 Stanford Alpaca、code-alpaca 以及更多数据集上进行了微调。

图片来源：Raven RWKV 7B

相关资源：

GitHub：https://github.com/BlinkDL/ChatRWKV

演示：BlinkDL/rwkv-4-raven

七、OPT

OP‍T（https://arxiv.org/abs/2205.01068）：Open Pre-trained Transformer Language Models 的效果目前尚不如 ChatGPT 好，但它在零样本和少样本学习以及刻板偏见分析方面表现出了卓越的能力。

可以将它与 Alpa、Colossal-AI、CTranslate2 和 FasterTransformer 集成，可以获得更好的结果。

注意：它之所以上榜是因为它的受欢迎程度，因为它在文本生成类别中的每月下载量为 624,710 次。

图源：https://arxiv.org/abs/2205.01068

相关资源：

研究论文OPT：开放预训练的 Transformer 语言模型 (arxiv.org)

GitHub: https://github.com/facebookresearch/metaseq

演示：https://huggingface.co/spaces/tomg-group-umd/lm-watermarking

https://huggingface.co/facebook/opt-1.3b

8.Flan -T5-XXL

Flan-T5-XXL在一组表述为指令的数据集上微调，称之为T5 模型。该指令微调显着提高了各种模型类（例如 PaLM、T5 和 U-PaLM）的性能。Flan-T5-XXL 模型针对 1000 多项额外任务进行了微调，它涵盖了多种语言。

图片来源：Flan-T5-XXL

相关资源：

GitHub: https://github.com/google-research/t5x

演示：https://huggingface.co/spaces/olivierdehaene/chat-llm-streaming

总结

本文中为各位总结了一些流行的类ChatGPT开源选项。

可以看到，开源聊天机器人和模型正在越来越好。预计在今年接下来的几个月里，我们也许会看到一个在性能上可以完全超越 ChatGPT 的新模型。

如果你有更好的建议，欢迎在评论部分告诉我们。如果本文对你有，不要忘记给点赞和加星标～

作者：万能的大雄

本篇文章为 @ 场长创作并授权 21CTO 发布，未经许可，请勿转载。

内容授权事宜请您联系 webmaster@21cto.com或关注 21CTO 公众号。

该文观点仅代表作者本人，21CTO 平台仅提供信息存储空间服务。

评论

场长

标准用户

最新文章

英国军情第六处处长：我们将像精通俄语一样精通Python

英国军情第六处处长：我们将像精...

PHP 8.5 与 PHP 8.3 和 Node.js 的实际性能基准测试

PHP 8.5 与 PHP 8.3 和 Node.js...

WSL 2.7.0 发布，在 Windows 上运行 Linux 二进制程序的子系统

WSL 2.7.0 发布，在 Windows 上...

印度发布一款自主研发的双核 1GHz RISC-V 处理器

印度发布一款自主研发的双核 1GH...

日本科学家本田崇人发布“Sui”编程语言，宣称能让大语言模型 100% 准确编码

日本科学家本田崇人发布“Sui”编...

2026年的软件开发会有什么新发展？

2026年的软件开发会有什么新发展...

微信团队就 “微信群崩了” 致歉

微信团队就 “微信群崩了” 致歉

AI 的矛盾：促进软件开发，也在阻碍软件开发

AI 的矛盾：促进软件开发，也在...

RMS：别把 ChatGPT 当 “智能”，它只是个 “胡说八道生成器”

RMS：别把 ChatGPT 当 “智能”，...

Laravel framework 12.42.0 发布

Laravel framework 12.42.0 发布