17611538698
info@21cto.com

GitHub COO 谈GitHub可用性:AI 驱动开发使流量暴增,基础设施从 10 倍扩容至 30 倍

图片

导读:GitHub团队在面临众多人工智能助手压力等流量之下,人们正在从架构、功能以及效率上做行动,为性能提升开始集体冲刺。

GitHub 的首席运营凯尔·戴格尔((Kyle Daigle)近期发表了一篇博文,其主题的主要内容为提升GitHub平台可用性。

他如此坦承说道,自从2025年12月以来,人工智能的驱动开发让GitHub流量产生了前所未有的倍增,这给平台基础设施增加了巨大压力,还导致近期发生了两起重大的停机故障事件。

在文中,他向我们披露了一组数据,非常令人侧目:GitHub 目前每月新增超过 2000 万个仓库,每周产生的代码提交(Commits)为 14 亿次,另外每周 GitHub Actions(自动化工作流)每周达 21亿次

与 2023 年相比,其运营负载已从原先的 10 倍增长扩大到了 30 倍。这种爆炸式增长的背后,是 AI 编程助手(如 GitHub Copilot)的引入,同时大幅降低了开发门槛,这让众多开发者涌入该平台进行代码协作。

GitHub 平台增长数据

是什么让提交数量激增

从数字上看,会让人觉得“是不是哪里搞错了”,增长得也太过迅猛了,但与现场的直观感受相比,两者是吻合的。随着使用AI助手进行编码变得司空见惯,一名工程师一天能编写的代码量和提交的频率都大幅增加。以前通常会“将大功能模块整合后一次性提交”,而现在,通过细小的迭代周期多次提交的风格正逐渐成为常态。

此外,AI代理自主操作存储库的情况也在增加。不在是由人编写,而是由代理创建分支、生成代码、执行测试并提交拉取请求——如果这样的工作流程普及开来,那么提交的提交次数不再与人的数量成正比也是理所当然的。

GitHub Actions的迅猛增长所揭示的

与提交次数一同值得关注的是GitHub Actions的数据。每周21亿次的执行次数,已达到了不能单纯用“使用CI/CD的人增加了”来解释的水平。

其背景是扩大用于自动验证AI生成代码的流水线。在代码由AI大量生成的世界中,对用于验证、测试和部署的自动化基础设施的需求也会相应增加。GitHub Actions正发挥着这一作用。

许多国内企业CI/CD的引入率本身较低,能够“充分利用GitHub Actions”的企业并不多。但在海外,AI编码→自动测试→自动部署的循环已成为基础设施。这一差距将直接影响未来的软件工程生产力。

GitHub应对性能的挑战

用户、代码与请求的流量激增开始高度影响 GitHub基础设施的性能。

戴格尔还向我们详细介绍了近期两起发生的停机故障。第一起发生在 2025 年 4 月 23 日,一个代码合并队列(Merge Queue)的漏洞导致系统对队列中的 Pull Request 进行了重复处理,进而引发了级联故障,造成大量用户的合并操作失败。第二起则发生在 4 月 27 日,GitHub 的 Elasticsearch 集群在峰值负载下不堪重负,导致代码搜索、问题追踪等核心功能出现性能下降甚至不可用的情况。

面对这些挑战,GitHub 从短期修复和长期架构重构两个维度同时重构。短期措施包括将 Webhooks 服务从 MySQL 数据库中剥离出来,以减轻数据库的压力;重新设计会话缓存机制,以提升用户认证系统的稳定性。

在长期规划方面,GitHub 制定了略显激进的行动路线图:

  • 第一,将核心服务进行隔离,避免单点故障扩散到整个平台
  • 其次,逐步将部分关键服务从 Ruby 迁移至 Go 语言,以获得更好的性能和并发处理能力
  • 最后,GitHub 计划推进多云架构部署,增强基础设施的弹性和容灾能力。

笔者见解

通过本文,我们看到任何一个有用户的平台,都在一定时期遇到性能和可用的瓶颈,这再正常不过,我们应该允许GitHub花时间对性能和架构调整优化。

GitHub作为开发者平台一直稳步成长,现在的使用数据量堪称全球第一,而这些成果一部分仍为免费,值得开发者们的肯定。

作者:场长

参考:

https://github.blog/news-insights/company-news/an-update-on-github-availability/

评论

我要赞赏作者

请扫描二维码,使用微信支付哦。

分享到微信