导读:OpenChatKit 是ChatGPT的开源版本,它能够微调模型、维持对话的上下文、获取及时响应,帮助我们更容易地构建自己的聊天机器人应用。
这是一家去年7月才成立的创业公司,专门为AI行业做去中心化的云端服务。CEO是Vipul Ved Prakash,他曾在苹果做了5年高级总监,大家看他的发型比较整齐。
CTO是Zhang Ce,似乎是华人。目前他担任苏黎世联邦理工学院电脑专业的助理教授。
据Twitter上的Itamar Golan称,OpenChatKit的作者包含多位前OpenAI研究员。
Together Computer 在 Apache-2.0 许可证下发布 OpenChatKit 0.15,其中包含源代码、模型权重以及训练数据集。
它可以用简单的语言解释机器学习的概念,也可以回答测试者提出的第二个小问题。资讯提取也难不倒它,以上是将一大段计划型文字转换用表格表示。
OpenChatKit 附带基础机器人与构建模块,用于从基础创建定制的聊天机器人应用程序。
由以下 4 个组件组成:
指令调整的大型语言模型,针对 EleutherAI 的 GPT-NeoX-20B 的聊天进行了微调。
有关微调模型在特定任务上实现高精度的说明。
一个可扩展的检索系统,用于使用维基百科、新闻提要或体育比分中的知识更新机器人响应。
从 GPT-JT-6B 进行微调,以便审核和过滤出机器人响应的问题。
指令调整的大型语言模型
OpenChatKit 的基础是一个名为 GPT-NeoXT-Chat-Base-20B 的大型语言模型。
它基于 EleutherAI 的 GPT-NeoX 模型,并且是在 4300 万条高质量对话指令上进行的微调。开发团队特别专注于调整多项任务,例如多轮对话、问答、分类、提取与摘要等。
OpenChatKit 开箱即用的模型为开发者提供了强大的基础,它在 HELM 基准测试中的得分要高于其基础模型 GPT-NeoX。
GPT-NeoXT-Chat-Base-20B 模型在问答、提取和分类任务上表现的相当不错,有开发者称赞它的强大是可圈可点。
基于编码:该模型没有在足够大的源代码语料库上进行训练,无法编写准确的代码。
上下文切换:如果在对话中开始谈论内容,聊天机器人不会自动切换话题,不能继续为用户提供与之前话题相关的答案。
重复:聊天机器人有时会重复响应或卡住,需要刷新页面重置它。
创意答案:与 ChatGPT 不同,聊天机器人不会生成文章或创意故事。它仅限于简短的响应。
有网友感叹 “事情进展得也太快了吧”,作者回应:“请绑好安全带,享受‘飙车’吧。”
https://huggingface.co/spaces/togethercomputer/OpenChatKit
https://huggingface.co/togethercomputer/GPT-NeoXT-Chat-Base-
https://github.com/togethercomputer/OpenChaT
https://www.together.xyz/blog/openchatkit
作者:Abid Ali Awan ( @1abidaliawan ) 。一位数据科学家。喜欢构建机器学习模型。他专注于内容创作,撰写有关机器学习和数据科学相关的技术博客。Abid 个人拥有技术管理硕士学位和电信工程学士学位。他的愿景是使用图形神经网络为患有精神疾病的人们构建人工智能产品。