GPT 和 Claude 组队干活了！微软 Critique 让两大 AI 互相 “挑错”

导读：微软发布基于GPT和Claude协同的Microsoft 365 Copilot。

2026 年 3 月 30 日，微软正式为 Microsoft 365 Copilot 的研究助理（Researcher）功能，推出两项全新多模型协作机制 ——Critique（批判）与Council（理事会）。

其首次实现 GPT 与 Claude 两大顶级模型深度协同、双向互审的商业化落地，直击 AI “幻觉” 痛点，重构企业级深度研究的 AI 协作范式。

Critique 是本次更新的核心功能，采用 “生成 - 审核” 接力协同架构，精准匹配两大模型能力长板，形成 “初稿 + 评审” 的闭环质检：

GPT 主生成
依托 GPT 在文本创作、结构化输出、快速信息整合上的优势，负责研究梳理、撰写报告初稿，搭建逻辑框架、完成内容铺陈与初步数据引用。
Claude 严审核
发挥 Claude 在长上下文理解、事实核查、逻辑严谨性、合规校验上的强项，对 GPT 初稿做全维度评审 —— 核验数据来源真实性、引用完整性、结论一致性、事实无冲突，输出结构化纠错与优化建议。
双向互审演进
当前为 “GPT 生成、Claude 审核”，微软已明确未来将开放双向模式，由 Claude 先出稿、GPT 做审核，实现对称协作，覆盖更多写作与校验场景。

与 Critique 互补，微软同步推出 Council（理事会）机制，采用并行对比架构，让多模型独立研究、交叉验证：

这套多模型协作系统，为解决 AI “一本正经胡说八道” 的幻觉问题提供了结构性方案：

数据验证
DRACO（深度研究准确性、完整性、客观性）基准测试显示，双模型协作效果显著优于单一模型。
效率与质量双升
微软 365 Copilot 企业副总裁 Nicole Herskowitz 表示，该模式能有效限制 AI 幻觉，同时大幅提升企业研究与内容生产的生产力。
开放生态
此次更新是微软深化与 Anthropic 合作的重要一步，此前 Claude 已入驻 Azure 云平台，365 Copilot 用户可直接在两大模型间切换，适配不同任务需求。