OpenChatKit：开源 ChatGPT 替代方案

17611538698

webmaster@21cto.com

登录注册

OpenChatKit：开源 ChatGPT 替代方案

场长

人工智能 0 2097 2023-03-18 12:39:03

导读：OpenChatKit 是ChatGPT的开源版本，它能够微调模型、维持对话的上下文、获取及时响应，帮助我们更容易地构建自己的聊天机器人应用。

简介

话说，开源和闭源的战争已经持续了一段时间。

在 OpenAI 推出GPT-3后，但是随后变为闭源模型，不再开源。随后，一个称为 EleutherAI 的组织推出了一个名为 GPT-Neo 的开源替代方案，并提供了两者对比结果。

同样，当DALL·E 2发布时，Stability AI 发布了 DALL·E 2 的开源版本，名为Stable Diffusion。

我们都知道ChatGPT，以及很多人都非常渴望获得此模型的开源版本，希望能安全地构建具有更多控制权的应用程序。

目前，ChatGPT 为开发者提供了 API 访问与微调功能，但我们还要使用它的服务和机器来执行各样的任务。

2023 年 3 月 10 日，Together Computer 发布了名为OpenChatKit的 ChatGPT 开源版本。这种开源替代方案允许开发者更好地控制聊天机器人的行为，可根据自己的特定需求进行定制。

此外，更为广泛的用户能够更容易地访问，尤其是那些可能没有资源访问专有模型的用户与社区。

什么是 OpenChatKit

OpenChatKit，由前OpenAI研究员共同打造。它为开发者提供了一整套强大的开源工具，用来创建通用或专用的聊天机器人应用程序。它是其模型的第一个版本，社区开发人员已经发布了一套工具和流程，以及在社区用户的贡献帮助下改进模型。

OpenChatKit的归属单位叫做 Together。

这是一家去年7月才成立的创业公司，专门为AI行业做去中心化的云端服务。CEO是Vipul Ved Prakash，他曾在苹果做了5年高级总监，大家看他的发型比较整齐。

CTO是Zhang Ce，似乎是华人。目前他担任苏黎世联邦理工学院电脑专业的助理教授。

据Twitter上的Itamar Golan称，OpenChatKit的作者包含多位前OpenAI研究员。

Together Computer 在 Apache-2.0 许可证下发布 OpenChatKit 0.15，其中包含源代码、模型权重以及训练数据集。

它可以用简单的语言解释机器学习的概念，也可以回答测试者提出的第二个小问题。资讯提取也难不倒它，以上是将一大段计划型文字转换用表格表示。

开发者还可以在 Hugging Face: OpenChatKit上尝试基于模型的演示。它类似于 ChatGPT，可在其中编写提示，模型以答案、代码块、表格或文字响应。

OpenChatKit 附带基础机器人与构建模块，用于从基础创建定制的聊天机器人应用程序。

由以下 4 个组件组成：

指令调整的大型语言模型，针对 EleutherAI 的 GPT-NeoX-20B 的聊天进行了微调。
有关微调模型在特定任务上实现高精度的说明。
一个可扩展的检索系统，用于使用维基百科、新闻提要或体育比分中的知识更新机器人响应。
从 GPT-JT-6B 进行微调，以便审核和过滤出机器人响应的问题。

指令调整的大型语言模型

OpenChatKit 的基础是一个名为 GPT-NeoXT-Chat-Base-20B 的大型语言模型。

它基于 EleutherAI 的 GPT-NeoX 模型，并且是在 4300 万条高质量对话指令上进行的微调。开发团队特别专注于调整多项任务，例如多轮对话、问答、分类、提取与摘要等。

OpenChatKit 开箱即用的模型为开发者提供了强大的基础，它在 HELM 基准测试中的得分要高于其基础模型 GPT-NeoX。

GPT-NeoXT-Chat-Base-20B 模型在问答、提取和分类任务上表现的相当不错，有开发者称赞它的强大是可圈可点。

模型局限性

这是模型的第一个版本，人们会看到不少错误或不适当的答案。总结模型目前有一些缺陷的几个领域：

基于知识：聊天机器人可能会给出与事实不符的结果。ChatGPT 也有同样的问题。该团队正在开发一个检索系统，该系统将更新有错误的信息。
基于编码：该模型没有在足够大的源代码语料库上进行训练，无法编写准确的代码。
上下文切换：如果在对话中开始谈论内容，聊天机器人不会自动切换话题，不能继续为用户提供与之前话题相关的答案。
重复：聊天机器人有时会重复响应或卡住，需要刷新页面重置它。
创意答案：与 ChatGPT 不同，聊天机器人不会生成文章或创意故事。它仅限于简短的响应。

小结

对于开发者，OpenChatKit 是一个非常好的开始。在社区帮助下，开发者们很快就能看到表现更优秀的聊天机器人版本。

但是如果想让 OpenChatKit 像 ChatGPT 一样强大，同样能够提供惊为天人的答案，开发者可能会感到失望。

它目前处于初期阶段，并且是在一个不是太多样化的数据集上训练的。

在本文中，我们共同了解了有关 ChatGPT 开源版本的内容，它对开发人员和 AI数据科学社区来说是个好消息。

此外人们还可进一步探索它的工作原理，并可深入研究工具包的四个组件，它们可以帮助创建一个完全可定制的聊天机器人，配备最新的新闻更新与内容审核等功能。

因为相当于ChatGPT的开源，就受到了开发者的欢迎。这不，GitHub它刚刚上线，就已经获得了2000多个星星。

有网友感叹 “事情进展得也太快了吧”，作者回应：“请绑好安全带，享受‘飙车’吧。”

参考资源：

以下为试用演示并阅读有关模型的详细信息，可以获取有关模型微调和其它工具之内容。

https://huggingface.co/spaces/togethercomputer/OpenChatKit

https://huggingface.co/togethercomputer/GPT-NeoXT-Chat-Base-

https://github.com/togethercomputer/OpenChaT

https://www.together.xyz/blog/openchatkit

作者：Abid Ali Awan ( @1abidaliawan ) 。一位数据科学家。喜欢构建机器学习模型。他专注于内容创作，撰写有关机器学习和数据科学相关的技术博客。Abid 个人拥有技术管理硕士学位和电信工程学士学位。他的愿景是使用图形神经网络为患有精神疾病的人们构建人工智能产品。

本文为 @ 场长创作并授权 21CTO 发布，未经许可，请勿转载。

内容授权事宜请您联系 webmaster@21cto.com或关注 21CTO 公众号。

该文观点仅代表作者本人，21CTO 平台仅提供信息存储空间服务。

评论

场长

标准用户

最新文章

GitHub 的编码Agent可通过新的面板从平台上的任何位置启动

GitHub 的编码Agent可通过新的面...

08月22日

最近参与了大量Agent开发，于是想说……

最近参与了大量Agent开发，于是...

08月22日

请停止编写测试，使用AIGC实现完全自动化

请停止编写测试，使用AIGC实现完...

08月22日

PHP 中的惰性求值：使用生成器节省实际内存

PHP 中的惰性求值：使用生成器节...

08月19日

Perplexit出价 345 亿美元收购 Chrome

Perplexit出价 345 亿美元收购 C...

08月13日

当编程正在成为一种提示语

当编程正在成为一种提示语

08月17日

特朗普政府称考虑入股英特尔，公司股价飙升超7%

特朗普政府称考虑入股英特尔，公...

08月16日

Android 16 QPR2 Beta 发布

Android 16 QPR2 Beta 发布

08月22日

与Linus 个性冲突：Linux 失去一项重要功能

与Linus 个性冲突：Linux 失去一...

08月17日

GitHub 首席执行官警告开发者：要么拥抱人工智能，要么离开

GitHub 首席执行官警告开发者：...

08月11日

突发，GitHub 首席执行官离职！

突发，GitHub 首席执行官离职！

08月13日

Python 仍在保持增长

Python 仍在保持增长

08月21日

PHP 小组添加管道运算符，正考虑泛型支持

PHP 小组添加管道运算符，正考虑...

08月08日

上半年中国软件业利润总额保持两位数增长

上半年中国软件业利润总额保持两...

08月02日

创建精美文档之十大工具

创建精美文档之十大工具

08月11日

BitHuman 推出用于创建 AI 头像的 SDK

BitHuman 推出用于创建 AI 头像...

08月14日