17611538698
info@21cto.com

GPT 和 Claude 组队干活了!微软 Critique 让两大 AI 互相 “挑错”

动态 0 10 22小时前
图片

导读:微软发布基于GPT和Claude协同的Microsoft 365 Copilot。

2026 年 3 月 30 日,微软正式为 Microsoft 365 Copilot 的研究助理(Researcher)功能,推出两项全新多模型协作机制 ——Critique(批判)Council(理事会)。

其首次实现 GPT 与 Claude 两大顶级模型深度协同、双向互审的商业化落地,直击 AI “幻觉” 痛点,重构企业级深度研究的 AI 协作范式。

图片

一、Critique:一写一审,构建 AI 内容 “双保险”


Critique 是本次更新的核心功能,采用 “生成 - 审核” 接力协同架构,精准匹配两大模型能力长板,形成 “初稿 + 评审” 的闭环质检:

  • GPT 主生成

  • 依托 GPT 在文本创作、结构化输出、快速信息整合上的优势,负责研究梳理、撰写报告初稿,搭建逻辑框架、完成内容铺陈与初步数据引用。

  • Claude 严审核

  • 发挥 Claude 在长上下文理解、事实核查、逻辑严谨性、合规校验上的强项,对 GPT 初稿做全维度评审 —— 核验数据来源真实性、引用完整性、结论一致性、事实无冲突,输出结构化纠错与优化建议。

  • 双向互审演进

  • 当前为 “GPT 生成、Claude 审核”,微软已明确未来将开放双向模式,由 Claude 先出稿、GPT 做审核,实现对称协作,覆盖更多写作与校验场景。

  • 图片


二、Council:多模型并行,打造 “AI 辩论场”


与 Critique 互补,微软同步推出 Council(理事会)机制,采用并行对比架构,让多模型独立研究、交叉验证:

  • GPT 与 Claude 针对同一课题独立展开研究,各自生成报告;

  • 由独立 “裁判模型” 评估两份产出,提炼共识点、分歧点,总结每个模型的独特贡献;

  • 帮助用户捕捉单一模型遗漏的见解,提升研究深度与决策全面性。

三、核心价值:从根源抑制 AI 幻觉,提升研究质量


这套多模型协作系统,为解决 AI “一本正经胡说八道” 的幻觉问题提供了结构性方案:

  • 数据验证

  • DRACO(深度研究准确性、完整性、客观性)基准测试显示,双模型协作效果显著优于单一模型。

  • 效率与质量双升

  • 微软 365 Copilot 企业副总裁 Nicole Herskowitz 表示,该模式能有效限制 AI 幻觉,同时大幅提升企业研究与内容生产的生产力。

  • 开放生态

  • 此次更新是微软深化与 Anthropic 合作的重要一步,此前 Claude 已入驻 Azure 云平台,365 Copilot 用户可直接在两大模型间切换,适配不同任务需求。

四、应用场景与开放范围


Critique 与 Council 已经嵌入 365 Copilot Researcher 智能代理,面向微软 Frontier 企业计划开放,主要服务于企业级深度研究、报告撰写、市场分析、技术文档审核等场景,为专业人士提供更可靠、更严谨的 AI 辅助工具。

作者:场长

参考:

https://techcommunity.microsoft.com/blog/microsoft365copilotblog/introducing-multi-model-intelligence-in-researcher/4506011

评论

我要赞赏作者

请扫描二维码,使用微信支付哦。

分享到微信