导读:GitHub团队在面临众多人工智能助手压力等流量之下,人们正在从架构、功能以及效率上做行动,为性能提升开始集体冲刺。
GitHub 的首席运营凯尔·戴格尔((Kyle Daigle)近期发表了一篇博文,其主题的主要内容为提升GitHub平台可用性。
他如此坦承说道,自从2025年12月以来,人工智能的驱动开发让GitHub流量产生了前所未有的倍增,这给平台基础设施增加了巨大压力,还导致近期发生了两起重大的停机故障事件。
在文中,他向我们披露了一组数据,非常令人侧目:GitHub 目前每月新增超过 2000 万个仓库,每周产生的代码提交(Commits)为 14 亿次,另外每周 GitHub Actions(自动化工作流)每周达 21亿次。
与 2023 年相比,其运营负载已从原先的 10 倍增长扩大到了 30 倍。这种爆炸式增长的背后,是 AI 编程助手(如 GitHub Copilot)的引入,同时大幅降低了开发门槛,这让众多开发者涌入该平台进行代码协作。
是什么让提交数量激增
从数字上看,会让人觉得“是不是哪里搞错了”,增长得也太过迅猛了,但与现场的直观感受相比,两者是吻合的。随着使用AI助手进行编码变得司空见惯,一名工程师一天能编写的代码量和提交的频率都大幅增加。以前通常会“将大功能模块整合后一次性提交”,而现在,通过细小的迭代周期多次提交的风格正逐渐成为常态。
此外,AI代理自主操作存储库的情况也在增加。不在是由人编写,而是由代理创建分支、生成代码、执行测试并提交拉取请求——如果这样的工作流程普及开来,那么提交的提交次数不再与人的数量成正比也是理所当然的。
GitHub Actions的迅猛增长所揭示的
与提交次数一同值得关注的是GitHub Actions的数据。每周21亿次的执行次数,已达到了不能单纯用“使用CI/CD的人增加了”来解释的水平。
其背景是扩大用于自动验证AI生成代码的流水线。在代码由AI大量生成的世界中,对用于验证、测试和部署的自动化基础设施的需求也会相应增加。GitHub Actions正发挥着这一作用。
许多国内企业CI/CD的引入率本身较低,能够“充分利用GitHub Actions”的企业并不多。但在海外,AI编码→自动测试→自动部署的循环已成为基础设施。这一差距将直接影响未来的软件工程生产力。
GitHub应对性能的挑战
用户、代码与请求的流量激增开始高度影响 GitHub基础设施的性能。
戴格尔还向我们详细介绍了近期两起发生的停机故障。第一起发生在 2025 年 4 月 23 日,一个代码合并队列(Merge Queue)的漏洞导致系统对队列中的 Pull Request 进行了重复处理,进而引发了级联故障,造成大量用户的合并操作失败。第二起则发生在 4 月 27 日,GitHub 的 Elasticsearch 集群在峰值负载下不堪重负,导致代码搜索、问题追踪等核心功能出现性能下降甚至不可用的情况。
面对这些挑战,GitHub 从短期修复和长期架构重构两个维度同时重构。短期措施包括将 Webhooks 服务从 MySQL 数据库中剥离出来,以减轻数据库的压力;重新设计会话缓存机制,以提升用户认证系统的稳定性。
在长期规划方面,GitHub 制定了略显激进的行动路线图:
笔者见解
通过本文,我们看到任何一个有用户的平台,都在一定时期遇到性能和可用的瓶颈,这再正常不过,我们应该允许GitHub花时间对性能和架构调整优化。
GitHub作为开发者平台一直稳步成长,现在的使用数据量堪称全球第一,而这些成果一部分仍为免费,值得开发者们的肯定。
作者:场长
参考:
https://github.blog/news-insights/company-news/an-update-on-github-availability/
本篇文章为 @ 万能的大雄 创作并授权 21CTO 发布,未经许可,请勿转载。
内容授权事宜请您联系 webmaster@21cto.com或关注 21CTO 微信公众号。
该文观点仅代表作者本人,21CTO 平台仅提供信息存储空间服务。
请扫描二维码,使用微信支付哦。