17611538698
webmaster@21cto.com

JetBrains 开源代码完成语言模型:Mellum

资讯 0 87 22小时前
图片
JetBrains 宣布其代码完成 LLM Mellum 现已作为开源模型在Hugging Face上提供。

据这家公司称,Mellum 是一种“焦点模型”,这意味着它是专门为特定任务而构建的,而不是要试图精通所有功能。

JetBrains 高级产品经理安东·谢门金(Anton Semenkin)和 JetBrains 人工智能倡导者米歇尔·弗罗斯特(Michelle Frost)在一篇文章中如下写道:

  “它的设计初衷就是为了出色地完成一件事:代码补全。”

地址传送门:https://huggingface.co/JetBrains/Mellum-4b-base

图片

Mellum 模型的运行成本比一般的大型模型要低,这使得没有资源运行大型模型的团队更加容易地使用它们。 

“可以把它想象成T型技能人。这指的是一个人对许多主题都有广泛的理解(水平顶栏或知识广度),但在某个特定领域拥有深厚的专业知识(垂直杆或深度)。Mellum模型遵循同样的理念:它们并非为处理所有事情而构建。相反,它们专注于并擅长一项任务,而深度正是这项任务真正创造价值的关键,”该模型的作者这样写道。 

Mellum 目前支持几种流行编程语言的代码完成:Java、Kotlin、Python、Go、PHP、C、C++、C#、JavaScript、TypeScript、CSS、HTML、Rust、Ruby。

JetBrains 计划将 Mellum 发展成为一个包含不同焦点模型的系列,非常适合其他特定的编码任务,例如差异预测。 

Mellum 的当前版本最适合探索 AI 在软件开发中的作用的 AI/ML 研究人员,或作为学习如何构建、微调和调整特定领域语言模型的基础的 AI/ML 工程师或教育工作者。 

Mellum 模型亦并非即插即用的解决方案。

通过在 Hugging Face 上发布,它为研发人员、教育工作者和高级团队提供了探索专用模型底层工作原理的机会。

作者:行动中的大雄

参考:

https://blog.jetbrains.com/ai/2025/04/mellum-goes-open-source-a-purpose-built-llm-for-developers-now-on-hugging-face/

评论