17611538698
webmaster@21cto.com

OpenAI发布GPT5;AWS 引入自动推理检查;谷歌将 Gemini CLI 添加到 GitHub Actions

资讯 0 13 12小时前
图片

OpenAI发布GPT5

8月8号,OpenAI向其所有ChatGPT用户和开发者发布其新的旗舰大模型GPT-5.

OpenAI首席执行官Sam Altman 这样表示道,GPT-5较之前的模型有了显著的飞跃。他将其比作“我永远不想再回到过去的事物”,就像第一款配备Retina显示屏的 iPhone 一样。

OpenAI表示,GPT-5更智能、更快速,而且不太可能给出不准确的答案“。

GPT-3有点像在和一名高中生交谈,”Altman在新闻发布会上说道。“你可以问它一个问题。也许你会得到一个正确的答案,也许你会得到一些稀奇古怪的答案。GPT-4感觉就像在和一名大学生交谈。GPT-5是第一次真正让你感觉像是在和一位博士级别的专家交谈。”

ChatGPT目前每周用户量已接近7亿,但OpenAI已经有一段时间没有推出业界领先的前沿模型了。现在,该公司认为GPT-5将使其重回榜首。“这是世界上最好的编码模型,"Altman说道。“这将是世界上最好的写作模型,也是世界上最好的医疗保健模型,以及许多其他领域的最佳模型。

图片

关于GPT-5,你首先会注意到的是,它在ChatGPT中只呈现为一个模型而不是一个常规模型和一个独立的推理模型。在后台,GPT-5使用了一个由OpenAI开发的路由器,它可以自动切换到推理版本,以应对更复杂的查询,或者在你让它“认真思考”的时候。

编码方面,GPT-5 在复杂的前端生成和大型代码库的调试方面取得了显著的提升。该公司表示,早期测试人员表示,它在间距、排版和留白方面做出了更好的设计选择。 

Sam Altman 在一次直播中表示:“我们认为你会比以往任何 AI 都更喜欢使用 GPT-5。它很实用。它很智能。它速度很快。它很直观。”

Truth Social推出由Perplexity提供的AI搜索功能

图片

AI初创公司Perplexity为美国总统特朗普的社交媒体平台Truth Social提供了全新的AI驱动搜索引擎。

这一名为"Truth Search AI"的搜索引擎已在Truth Social网页版上线,iOS和Android应用程序的公开Beta测试计划在"不久的将来"推出。

特朗普媒体公司在新闻稿中表示,Perplexity的技术能够提供"直接、准确的上下文答案和透明引用",这将帮助Truth Social"指数级增加"用户可获取的信息量。不过,该社交媒体平台保留对AI搜索引擎信息来源的控制权。

Truth Social使用的是Perplexity Sonar API,该API承诺能够查询网络获取当前和经过验证的信息——即使这些信息是从屏蔽Perplexity爬虫的网站上抓取的——并支持结构化输出,让用户能够自定义搜索引擎响应的格式。

Perplexity发言人Jesse Dwyer告诉TechCrunch,Sonar API的准确性取决于Truth Social限制的信息来源。"我们对此没有可见性或控制权,"Dwyer表示,"这就像你在自己公司内部使用API,或者学术研究人员想用它搜索自己的数据一样。"

TechCrunch已联系特朗普媒体公司,希望了解更多关于Truth Search AI是否能访问整个网络、是否会优先考虑某些信息来源,以及AI是否会被指导对总统和现任政府给出正面回应、对民主党给出负面回应等问题。

为了评估搜索机器人会引用哪些信息来源,Axios向其提出了一系列问题,如"2021年1月6日发生了什么?"和"唐纳德·特朗普为什么被弹劾?"据Axios报道,在所有回应中,FoxNews.com要么是最常见的信息来源,要么是唯一列出的信息来源。其他来源包括FoxBusiness.com、《华盛顿时报》或《大纪元时报》。

相比之下,Perplexity的公共搜索引擎返回了更广泛的信息来源,包括维基百科、Reddit、YouTube、NPR和Politico。

特朗普媒体公司首席执行官、前加州国会议员德文·努内斯在声明中表示,Truth Social计划"根据用户反馈完善和扩展搜索功能,同时对平台实施广泛的额外增强功能"。

Perplexity首席商务官德米特里·舍维连科在声明中也指出,Perplexity的AI通过"透明引用提供答案,让任何人都能深入挖掘"。

开源机器学习框架 PyTorch 2.8 正式发布,提升量化 LLM 推理性能

图片

PyTorch 2.8 正式发布,其在 Intel CPU 上大幅提升量化 LLM 推理性能,并实验性支持 Intel GPU 分布式后端。 此外还引入了稳定的 libtorch ABI、实验性 wheel 变体机制、SYCL 与 XPU 优化、ROCm 与 CUTLASS 后端增强,以及更多控制流算子支持。

PyTorch 2.8 强调在原生 PyTorch 框架下实现高性能的量化大语言模型推理(支持 A16W8、DA8W8、A16W4 等模式)。据称其性能可达或超越 vLLM 等热门 LLM 服务框架在单 x86_64 CPU 离线模式下的表现。

此外,Intel 工程师还引入了 FP8 QCONV、FP8 QLINEAR,以及更广泛使用 AMX 微内核等优化,大幅提升性能。例如,在第 6 代 Intel Xeon 平台上,以 M=8、K 和 32 核心为条件下运行 Llama-3.1-8B 模型时,端到端延迟最高可缩短 20% 以上。

Anthropic 发布 Claude Opus 4.1


图片

Anthropic本次最新更新提高了模型的研究和数据分析能力,在 SWE-bench Verified 上达到了 74.5%(而 Opus 4 上为 72.5%)。 

付费 Claude 用户可以使用 Claude Code、Anthropic 的 API、Amazon Bedrock 和 Google Cloud 的 Vertex AI 来使用它。 

该公司还计划在未来几周内对其所有模型进行更大的改进。 

AWS 引入自动推理检查以减少 AI 幻觉


图片

自动推理检查是 Amazon Bedrock Guardrails 的一部分,用于验证 AI 生成内容是否符合领域知识。据 AWS 称,此功能可提供 99% 的验证准确率。

它首先在 AWS re:Invent 上作为预览版推出,并且随着此通用版本发布,添加了几个新功能,包括在单个构建中支持大型文档、简化策略验证、自动场景生成、增强策略反馈和可自定义的验证设置。 

谷歌将 Gemini CLI 添加到 GitHub Actions


图片

这款新产品旨在充当日常编码任务的代理。它发布时包含三个工作流程:智能问题分类、拉取请求审核,以及在任何问题或拉取请求中提及 @gemini-cli 以委派任务的功能。 

它当前处于测试阶段,谷歌正在为 Google AI Studio 提供免费配额。Vertex AI 以及 Gemini Code Assist 的标准版和企业版也支持它。 

OpenAI 宣布两个开放权重推理模型


OpenAI 正在通过推出 gpt-oss-120b 和 gpt-oss-20b 加入开放权重模型游戏。

Gpt-oss-120b 针对生产、高推理用例进行了优化,而 Gpt-oss-20b 则针对较低延迟或本地用例而设计。 

该公司表示,这些开放模型在性能和功能方面与其封闭模型相当,但成本却低得多。例如,在 80 GB GPU 上运行的 gpt-oss-120b 在核心推理基准测试中实现了与 o4-mini 相当的性能;而在 16 GB 内存的边缘设备上运行的 gpt-oss-20b 在多个常见基准测试中与 o3-mini 相当。 

谷歌 DeepMind 推出 Genie 3


图片

Genie 3是一个用于生成真实世界环境的前沿模型。它可以模拟现实世界的物理属性,例如水、光照和环境行为。 

例如,用户还可以使用提示来改变生成的世界,添加新的物体和角色或改变天气条件。 

DeepMind 表示说,这项研究特别重要,因为它可以让人工智能代理在各种模拟环境中接受训练。 

编辑:手扶拖拉斯基

评论