OpenAI发布GPT5
8月8号,OpenAI向其所有ChatGPT用户和开发者发布其新的旗舰大模型GPT-5.
OpenAI首席执行官Sam Altman 这样表示道,GPT-5较之前的模型有了显著的飞跃。他将其比作“我永远不想再回到过去的事物”,就像第一款配备Retina显示屏的 iPhone 一样。
OpenAI表示,GPT-5更智能、更快速,而且不太可能给出不准确的答案“。
GPT-3有点像在和一名高中生交谈,”Altman在新闻发布会上说道。“你可以问它一个问题。也许你会得到一个正确的答案,也许你会得到一些稀奇古怪的答案。GPT-4感觉就像在和一名大学生交谈。GPT-5是第一次真正让你感觉像是在和一位博士级别的专家交谈。”
ChatGPT目前每周用户量已接近7亿,但OpenAI已经有一段时间没有推出业界领先的前沿模型了。现在,该公司认为GPT-5将使其重回榜首。“这是世界上最好的编码模型,"Altman说道。“这将是世界上最好的写作模型,也是世界上最好的医疗保健模型,以及许多其他领域的最佳模型。
关于GPT-5,你首先会注意到的是,它在ChatGPT中只呈现为一个模型而不是一个常规模型和一个独立的推理模型。在后台,GPT-5使用了一个由OpenAI开发的路由器,它可以自动切换到推理版本,以应对更复杂的查询,或者在你让它“认真思考”的时候。
编码方面,GPT-5 在复杂的前端生成和大型代码库的调试方面取得了显著的提升。该公司表示,早期测试人员表示,它在间距、排版和留白方面做出了更好的设计选择。
Sam Altman 在一次直播中表示:“我们认为你会比以往任何 AI 都更喜欢使用 GPT-5。它很实用。它很智能。它速度很快。它很直观。”
Truth Social推出由Perplexity提供的AI搜索功能
AI初创公司Perplexity为美国总统特朗普的社交媒体平台Truth Social提供了全新的AI驱动搜索引擎。
这一名为"Truth Search AI"的搜索引擎已在Truth Social网页版上线,iOS和Android应用程序的公开Beta测试计划在"不久的将来"推出。
特朗普媒体公司在新闻稿中表示,Perplexity的技术能够提供"直接、准确的上下文答案和透明引用",这将帮助Truth Social"指数级增加"用户可获取的信息量。不过,该社交媒体平台保留对AI搜索引擎信息来源的控制权。
Truth Social使用的是Perplexity Sonar API,该API承诺能够查询网络获取当前和经过验证的信息——即使这些信息是从屏蔽Perplexity爬虫的网站上抓取的——并支持结构化输出,让用户能够自定义搜索引擎响应的格式。
Perplexity发言人Jesse Dwyer告诉TechCrunch,Sonar API的准确性取决于Truth Social限制的信息来源。"我们对此没有可见性或控制权,"Dwyer表示,"这就像你在自己公司内部使用API,或者学术研究人员想用它搜索自己的数据一样。"
TechCrunch已联系特朗普媒体公司,希望了解更多关于Truth Search AI是否能访问整个网络、是否会优先考虑某些信息来源,以及AI是否会被指导对总统和现任政府给出正面回应、对民主党给出负面回应等问题。
为了评估搜索机器人会引用哪些信息来源,Axios向其提出了一系列问题,如"2021年1月6日发生了什么?"和"唐纳德·特朗普为什么被弹劾?"据Axios报道,在所有回应中,FoxNews.com要么是最常见的信息来源,要么是唯一列出的信息来源。其他来源包括FoxBusiness.com、《华盛顿时报》或《大纪元时报》。
相比之下,Perplexity的公共搜索引擎返回了更广泛的信息来源,包括维基百科、Reddit、YouTube、NPR和Politico。
特朗普媒体公司首席执行官、前加州国会议员德文·努内斯在声明中表示,Truth Social计划"根据用户反馈完善和扩展搜索功能,同时对平台实施广泛的额外增强功能"。
Perplexity首席商务官德米特里·舍维连科在声明中也指出,Perplexity的AI通过"透明引用提供答案,让任何人都能深入挖掘"。
开源机器学习框架 PyTorch 2.8 正式发布,提升量化 LLM 推理性能
PyTorch 2.8 正式发布,其在 Intel CPU 上大幅提升量化 LLM 推理性能,并实验性支持 Intel GPU 分布式后端。 此外还引入了稳定的 libtorch ABI、实验性 wheel 变体机制、SYCL 与 XPU 优化、ROCm 与 CUTLASS 后端增强,以及更多控制流算子支持。
PyTorch 2.8 强调在原生 PyTorch 框架下实现高性能的量化大语言模型推理(支持 A16W8、DA8W8、A16W4 等模式)。据称其性能可达或超越 vLLM 等热门 LLM 服务框架在单 x86_64 CPU 离线模式下的表现。
此外,Intel 工程师还引入了 FP8 QCONV、FP8 QLINEAR,以及更广泛使用 AMX 微内核等优化,大幅提升性能。例如,在第 6 代 Intel Xeon 平台上,以 M=8、K 和 32 核心为条件下运行 Llama-3.1-8B 模型时,端到端延迟最高可缩短 20% 以上。
Anthropic本次最新更新提高了模型的研究和数据分析能力,在 SWE-bench Verified 上达到了 74.5%(而 Opus 4 上为 72.5%)。
付费 Claude 用户可以使用 Claude Code、Anthropic 的 API、Amazon Bedrock 和 Google Cloud 的 Vertex AI 来使用它。
该公司还计划在未来几周内对其所有模型进行更大的改进。
自动推理检查是 Amazon Bedrock Guardrails 的一部分,用于验证 AI 生成内容是否符合领域知识。据 AWS 称,此功能可提供 99% 的验证准确率。
它首先在 AWS re:Invent 上作为预览版推出,并且随着此通用版本发布,添加了几个新功能,包括在单个构建中支持大型文档、简化策略验证、自动场景生成、增强策略反馈和可自定义的验证设置。
这款新产品旨在充当日常编码任务的代理。它发布时包含三个工作流程:智能问题分类、拉取请求审核,以及在任何问题或拉取请求中提及 @gemini-cli 以委派任务的功能。
它当前处于测试阶段,谷歌正在为 Google AI Studio 提供免费配额。Vertex AI 以及 Gemini Code Assist 的标准版和企业版也支持它。
OpenAI 正在通过推出 gpt-oss-120b 和 gpt-oss-20b 加入开放权重模型游戏。
Gpt-oss-120b 针对生产、高推理用例进行了优化,而 Gpt-oss-20b 则针对较低延迟或本地用例而设计。
该公司表示,这些开放模型在性能和功能方面与其封闭模型相当,但成本却低得多。例如,在 80 GB GPU 上运行的 gpt-oss-120b 在核心推理基准测试中实现了与 o4-mini 相当的性能;而在 16 GB 内存的边缘设备上运行的 gpt-oss-20b 在多个常见基准测试中与 o3-mini 相当。
Genie 3是一个用于生成真实世界环境的前沿模型。它可以模拟现实世界的物理属性,例如水、光照和环境行为。
例如,用户还可以使用提示来改变生成的世界,添加新的物体和角色或改变天气条件。
DeepMind 表示说,这项研究特别重要,因为它可以让人工智能代理在各种模拟环境中接受训练。
编辑:手扶拖拉斯基
本文为 @ 场长 创作并授权 21CTO 发布,未经许可,请勿转载。
内容授权事宜请您联系 webmaster@21cto.com或关注 21CTO 公众号。
该文观点仅代表作者本人,21CTO 平台仅提供信息存储空间服务。