OpenAI发布GPT5；AWS 引入自动推理检查；谷歌将 Gemini CLI 添加到 GitHub Actions

17611538698

webmaster@21cto.com

登录注册

OpenAI发布GPT5；AWS 引入自动推理检查；谷歌将 Gemini CLI 添加到 GitHub Actions

场长

动态 0 1487 2025-08-10 09:59:17

OpenAI发布GPT5

8月8号，OpenAI向其所有ChatGPT用户和开发者发布其新的旗舰大模型GPT-5.

OpenAI首席执行官Sam Altman 这样表示道，GPT-5较之前的模型有了显著的飞跃。他将其比作“我永远不想再回到过去的事物”，就像第一款配备Retina显示屏的 iPhone 一样。

OpenAI表示，GPT-5更智能、更快速，而且不太可能给出不准确的答案“。

GPT-3有点像在和一名高中生交谈，”Altman在新闻发布会上说道。“你可以问它一个问题。也许你会得到一个正确的答案，也许你会得到一些稀奇古怪的答案。GPT-4感觉就像在和一名大学生交谈。GPT-5是第一次真正让你感觉像是在和一位博士级别的专家交谈。”

ChatGPT目前每周用户量已接近7亿，但OpenAI已经有一段时间没有推出业界领先的前沿模型了。现在，该公司认为GPT-5将使其重回榜首。“这是世界上最好的编码模型，"Altman说道。“这将是世界上最好的写作模型，也是世界上最好的医疗保健模型，以及许多其他领域的最佳模型。

关于GPT-5，你首先会注意到的是，它在ChatGPT中只呈现为一个模型而不是一个常规模型和一个独立的推理模型。在后台，GPT-5使用了一个由OpenAI开发的路由器，它可以自动切换到推理版本，以应对更复杂的查询，或者在你让它“认真思考”的时候。

编码方面，GPT-5 在复杂的前端生成和大型代码库的调试方面取得了显著的提升。该公司表示，早期测试人员表示，它在间距、排版和留白方面做出了更好的设计选择。

Sam Altman 在一次直播中表示：“我们认为你会比以往任何 AI 都更喜欢使用 GPT-5。它很实用。它很智能。它速度很快。它很直观。”

Truth Social推出由Perplexity提供的AI搜索功能

AI初创公司Perplexity为美国总统特朗普的社交媒体平台Truth Social提供了全新的AI驱动搜索引擎。

这一名为"Truth Search AI"的搜索引擎已在Truth Social网页版上线，iOS和Android应用程序的公开Beta测试计划在"不久的将来"推出。

特朗普媒体公司在新闻稿中表示，Perplexity的技术能够提供"直接、准确的上下文答案和透明引用"，这将帮助Truth Social"指数级增加"用户可获取的信息量。不过，该社交媒体平台保留对AI搜索引擎信息来源的控制权。

Truth Social使用的是Perplexity Sonar API，该API承诺能够查询网络获取当前和经过验证的信息——即使这些信息是从屏蔽Perplexity爬虫的网站上抓取的——并支持结构化输出，让用户能够自定义搜索引擎响应的格式。

Perplexity发言人Jesse Dwyer告诉TechCrunch，Sonar API的准确性取决于Truth Social限制的信息来源。"我们对此没有可见性或控制权，"Dwyer表示，"这就像你在自己公司内部使用API，或者学术研究人员想用它搜索自己的数据一样。"

TechCrunch已联系特朗普媒体公司，希望了解更多关于Truth Search AI是否能访问整个网络、是否会优先考虑某些信息来源，以及AI是否会被指导对总统和现任政府给出正面回应、对民主党给出负面回应等问题。

为了评估搜索机器人会引用哪些信息来源，Axios向其提出了一系列问题，如"2021年1月6日发生了什么？"和"唐纳德·特朗普为什么被弹劾？"据Axios报道，在所有回应中，FoxNews.com要么是最常见的信息来源，要么是唯一列出的信息来源。其他来源包括FoxBusiness.com、《华盛顿时报》或《大纪元时报》。

相比之下，Perplexity的公共搜索引擎返回了更广泛的信息来源，包括维基百科、Reddit、YouTube、NPR和Politico。

特朗普媒体公司首席执行官、前加州国会议员德文·努内斯在声明中表示，Truth Social计划"根据用户反馈完善和扩展搜索功能，同时对平台实施广泛的额外增强功能"。

Perplexity首席商务官德米特里·舍维连科在声明中也指出，Perplexity的AI通过"透明引用提供答案，让任何人都能深入挖掘"。

开源机器学习框架 PyTorch 2.8 正式发布，提升量化 LLM 推理性能

PyTorch 2.8 正式发布，其在 Intel CPU 上大幅提升量化 LLM 推理性能，并实验性支持 Intel GPU 分布式后端。此外还引入了稳定的 libtorch ABI、实验性 wheel 变体机制、SYCL 与 XPU 优化、ROCm 与 CUTLASS 后端增强，以及更多控制流算子支持。

PyTorch 2.8 强调在原生 PyTorch 框架下实现高性能的量化大语言模型推理（支持 A16W8、DA8W8、A16W4 等模式）。据称其性能可达或超越 vLLM 等热门 LLM 服务框架在单 x86_64 CPU 离线模式下的表现。

此外，Intel 工程师还引入了 FP8 QCONV、FP8 QLINEAR，以及更广泛使用 AMX 微内核等优化，大幅提升性能。例如，在第 6 代 Intel Xeon 平台上，以 M＝8、K 和 32 核心为条件下运行 Llama-3.1-8B 模型时，端到端延迟最高可缩短 20% 以上。

Anthropic 发布 Claude Opus 4.1

Anthropic本次最新更新提高了模型的研究和数据分析能力，在 SWE-bench Verified 上达到了 74.5%（而 Opus 4 上为 72.5%）。

付费 Claude 用户可以使用 Claude Code、Anthropic 的 API、Amazon Bedrock 和 Google Cloud 的 Vertex AI 来使用它。

该公司还计划在未来几周内对其所有模型进行更大的改进。

AWS 引入自动推理检查以减少 AI 幻觉

自动推理检查是 Amazon Bedrock Guardrails 的一部分，用于验证 AI 生成内容是否符合领域知识。据 AWS 称，此功能可提供 99% 的验证准确率。

它首先在 AWS re:Invent 上作为预览版推出，并且随着此通用版本发布，添加了几个新功能，包括在单个构建中支持大型文档、简化策略验证、自动场景生成、增强策略反馈和可自定义的验证设置。

谷歌将 Gemini CLI 添加到 GitHub Actions

这款新产品旨在充当日常编码任务的代理。它发布时包含三个工作流程：智能问题分类、拉取请求审核，以及在任何问题或拉取请求中提及 @gemini-cli 以委派任务的功能。

它当前处于测试阶段，谷歌正在为 Google AI Studio 提供免费配额。Vertex AI 以及 Gemini Code Assist 的标准版和企业版也支持它。

OpenAI 宣布两个开放权重推理模型

OpenAI 正在通过推出 gpt-oss-120b 和 gpt-oss-20b 加入开放权重模型游戏。

Gpt-oss-120b 针对生产、高推理用例进行了优化，而 Gpt-oss-20b 则针对较低延迟或本地用例而设计。

该公司表示，这些开放模型在性能和功能方面与其封闭模型相当，但成本却低得多。例如，在 80 GB GPU 上运行的 gpt-oss-120b 在核心推理基准测试中实现了与 o4-mini 相当的性能；而在 16 GB 内存的边缘设备上运行的 gpt-oss-20b 在多个常见基准测试中与 o3-mini 相当。

谷歌 DeepMind 推出 Genie 3

Genie 3是一个用于生成真实世界环境的前沿模型。它可以模拟现实世界的物理属性，例如水、光照和环境行为。

例如，用户还可以使用提示来改变生成的世界，添加新的物体和角色或改变天气条件。

DeepMind 表示说，这项研究特别重要，因为它可以让人工智能代理在各种模拟环境中接受训练。

编辑：手扶拖拉斯基

本篇文章为 @ 场长创作并授权 21CTO 发布，未经许可，请勿转载。

内容授权事宜请您联系 webmaster@21cto.com或关注 21CTO 微信公众号。

该文观点仅代表作者本人，21CTO 平台仅提供信息存储空间服务。

场长

标准用户

OpenAI发布GPT5；AWS 引入自动推理检查；谷歌将 Gemini CLI 添加到 GitHub Actions

Anthropic 发布 Claude Opus 4.1

AWS 引入自动推理检查以减少 AI 幻觉

谷歌将 Gemini CLI 添加到 GitHub Actions

OpenAI 宣布两个开放权重推理模型

谷歌 DeepMind 推出 Genie 3

评论

场长

最新文章

xAI 更名 SpaceXAI，马斯克瞄准...

刚刚，微软、谷歌和 Cloudflare...

TIOBE 指数 2026 年 7 月排行榜...

SpaceXAI计划于周三发布搭载Curs...

我回到了Zig

“谁拥有UNIX？”一桩尘封已久的诉...

程序员的下一代，谁来培养？

Apple 将 Safari 变成 AI Agent...

让你的代码永存于世，GitHub 上...

马克·扎克伯格：Meta的AI代理发...

我要赞赏作者

分享到微信