Anthropic报告称，Claude现在负责处理95%的内部分析查询

导读：Anthropic内部95%业务分析交给给Claude，秘诀并不在更强的大模型。

Anthropic近期发布新报告称，Claude系统目前处理了约95%的内部分析请求，这使员工能够独立查询业务数据，而无需依赖数据团队。

该公司还进一步认为，这一成果更多地归功于数据治理、语义定义与运营规范，而非大模型技术的进步。

该报告详细指出道，人工智能分析的可靠性取决于底层数据平台的质量，因此数据建模、测试、元数据管理和质量检查对于确保准确性至关重要。

Chang Chen、Clement Peng、Justin Leder、Johanne Jiao和Josh Cherry 共同撰写了以下报告：

在 Anthropic，95% 的业务分析查询都通过 Claude 实现自动化，总体准确率约为 95%。通过将这些通常繁琐重复的工作交给 Claude，我们的数据科学团队可以专注于更具战略意义的工作，例如因果建模、预测与机器学习。

Anthropic 指出说，人工智能分析更多地依赖于一套受监管的、规范的、标准明确的数据集、集中式的数据工件以及维护良好的元数据，而非模型本身。

这些因素可以减少歧义，防止指标漂移，并帮助人工智能系统找到正确的数据和定义。

作者在报告中称，Claude 在不具备相关技能的情况下，仅正确回答了21%的分析问题。在将分析工作流程和业务背景编码为技能后，总体准确率提升至95%以上，在某些领域甚至接近99%。

Anthropic 的方法旨在解决一个常见的分析难题：自助式访问可能导致数据集重叠和指标定义冲突，而范围狭窄的报告环境往往无法支持长尾业务问题，并导致仪表盘泛滥。数据科学和数据工程团队的五名成员写道：

如果说数据基础是数据仓库本身，那么数据源就是代理用来浏览数据的参考界面。这一层减少了概念与实体之间的歧义，并将利益相关者问题中的“每周活跃用户”转化为数据模型中一个具体的、受控的实体。

分析设置由四层构成：数据基础（受管模型、指标和元数据）、知识层（语义定义、血缘关系和业务背景）、编码可重复分析工作流的技能，以及验证输出正确性和一致性的验证系统。

该公司这样总结道，成功的AI分析取决于三个原则：维护单一的指标数据源、确保用户能够轻松找到正确的数据，以及持续检测过时的定义。数据界的反应不一，一些人强调开放性，而另一些人则认为分析结果应该具有确定性和幂等性。Untitled Data Company的所有者兼BI/数据架构师Francesco Mucio写道：