全球数字财富领导者

AI领域迎来重大突破!GPT-5震撼发布,性能全面升级、多领域“屠榜”,告别“幻觉”?

2025-08-08 08:27:59
金融界
金融界
关注
0
0
获赞
粉丝
喜欢 0 0收藏举报
— 分享 —
摘要:北京时间8月8日凌晨,OpenAI正式发布了备受瞩目的新一代人工智能模型GPT-5。这场长达1个多小时的线上发布会规格之高、细节之多,引发了全球科技界的广泛关注。GPT-5的发布,不仅标志着AI技术的一次巨大飞跃,更被视为构建“超级智能”的重要一步。性能全面升级,多领

北京时间8月8日凌晨,OpenAI正式发布了备受瞩目的新一代人工智能模型GPT-5。这场长达1个多小时的线上发布会规格之高、细节之多,引发了全球科技界的广泛关注。GPT-5的发布,不仅标志着AI技术的一次巨大飞跃,更被视为构建“超级智能”的重要一步。

性能全面升级,多领域“屠榜”

GPT-5在多个领域的表现都迎来了全面提升。在文本生成、Web开发和视觉感知能力领域,GPT-5均排名第一;在硬提示、编码、数学、创造力、长查询等方面也毫无悬念地拔得头筹。在代号为“峰会”的测试中,GPT-5保持着截至目前最高的Arena分数,堪称实至名归的“屠榜”者。

OpenAI首席执行官Sam Altman对GPT-5的评价极高,他比喻说,如果说GPT-4像中学生,GPT-5就像大学生,而GPT-5则是第一次让他真正感觉像在与一位博士级别的专家交谈。他甚至断言,GPT-5是世界上编码能力最强、写作能力最强以及在医疗保健领域最强的模型。

告别“幻觉”,AI更可靠

“AI幻觉”一直是困扰大型语言模型的难题,但GPT-5在这方面取得了显著进步。与GPT-4o相比,GPT-5在联网搜索时回答出现事实错误的概率降低了45%;在独立思考时,回答出错的概率更是比OpenAI o3降低了80%。

此外,GPT-5还引入了四种全新的“人格”模式,包括犬儒、机器人、倾听者和学霸,用户可以根据自己的喜好设定ChatGPT与自己互动和回答问题的方式。

编码能力逆天,“软件按需生成”时代来临

GPT-5的编码能力堪称逆天。在多个编码基准测试中,GPT-5的表现均优于其他任何模型。在人类最终测试中取得42%的成绩,在SWE基准测试中更是达到了75%的成绩。

在发布会上,OpenAI的后期训练负责人Yann Dubois现场演示了GPT-5的强大编码能力,要求它生成一个用于学习法语并带有互动游戏的网站。GPT-5在短短几秒钟内就编写了数百行代码,并直接展示了网站的前端界面。

此外,GPT-5还展示了一款仅靠一段提示词就创作的3D游戏,其画面精致,物理效果也十分逼真。

更安全、更“诚实”

OpenAI对GPT-5进行了超过五千小时的测试,以确保其安全性。GPT-5在更可靠地处理多步骤任务方面表现更好,不会像以前那样“自信地撒谎”。对于一些可能涉及安全风险的问题,GPT-5会采用“安全补全”机制,在保持安全约束的前提下,给出尽可能有帮助的答案。

全面开放,多版本满足不同需求

GPT-5向所有用户开放,包括普通用户、Plus会员和Pro会员。普通用户可以免费体验GPT-5,但用量有限;Plus会员可获得更多使用量;Pro会员则可以访问具备更强推理能力的GPT-5 Pro版本。GPT-5系列还包括GPT-5-mini、GPT-5-nano等版本,以满足不同用户的需求。

在定价方面,标准版GPT-5每百万输入Token 1.25美元,每百万输出Token 10美元,mini版和Nano版的定价则相对较低。

集成架构,智能调度子模型

GPT-5采用了内嵌式三位一体集成架构,由处理常规问题的GPT-5-main模型、解决复杂任务的GPT-5-thinking深度思考模型、实时决策的路由机制以及额度使用完后启动的mini版本组成。路由机制会根据对话类型、复杂程度、工具需求以及用户的明确意图,快速决定使用哪个模型,自动匹配最适合的模型,用户无需手动切换。

敬告读者:本文为转载发布,不代表本网站赞同其观点和对其真实性负责。FX168财经仅提供信息发布平台,文章或有细微删改。
go