全球数字财富领导者
财富汇
|
美股投研
|
客户端
|
旧版
|
北美站
|
FX168 全球视野 中文财经
首页
资讯
速递
行情
日历
数据
社区
视频
直播
点评旗舰店
商品
SFFE2030
外汇开户
登录 / 注册
搜 索
综合
行情
速递
日历
话题
168人气号
文章
OpenAI正式发布GPT-5
go
lg
...
,这是公司首次让免费用户接触到人工智能
推理模型
(此前,这类更先进的模型仅对付费用户开放)。 “这只是我为践行使命而感到兴奋的方式之一,确保这些技术真正惠及大众,” 特利在谈及这一决定时说,他提到了 OpenAI 长期以来的使命 —— 让尽可能多的人接触到先进的人工智能。 外界对 GPT-5 的期待极高,它是自 2022 年 ChatGPT 让 OpenAI 声名鹊起以来,该公司最受期待的产品发布之一。据该公司称,从那以后,ChatGPT 已成长为全球最受欢迎的消费级产品之一,每周用户超过 7 亿 —— 接近全球人口的 10%。 许多人将 GPT-5 视为人工智能整体发展的风向标,硅谷对该模型的反响可能会对大型科技公司、华尔街以及监管科技的政策制定者产生深远影响。这些利益相关方正密切关注 GPT-5 是否能像其前代产品 GPT-4 那样,在人工智能能力上实现重大飞跃,打破人们对软件功能的固有预期。 GPT-5 略胜竞争对手一筹 OpenAI 称,GPT-5 在多个领域达到了最先进水平,在关键基准测试中略优于 Anthropic、谷歌 DeepMind 和埃隆・马斯克的 xAI 等公司的顶尖人工智能模型。不过,在其他一些领域,GPT-5 的表现略逊于前沿人工智能模型。 该公司表示,GPT-5 在编程领域展现出前沿水平;奥特曼称,该模型尤其擅长按需生成完整的软件应用,也就是人们所说的 “氛围编程”。 在 SWE-bench Verified(一项基于 GitHub 真实编程任务的测试)中,GPT-5 首次尝试的得分达到 74.9%。这意味着 GPT-5 略优于 Anthropic 最新的 Claude Opus 4.1 模型(得分 74.5%)和谷歌 DeepMind 的 Gemini 2.5 Pro 模型(得分 59.6%)。 在 “人类终极考试”(一项衡量人工智能模型在数学、人文和自然科学领域表现的高难度测试)中,具备扩展推理能力的 GPT-5 版本(GPT-5 Pro)在使用工具的情况下得分 42%。这略低于 xAI 的 Grok 4 Heavy 模型,后者在该测试中得分 44.4%。 在 GPQA Diamond(一项针对博士级科学问题的测试)中,GPT-5 Pro 首次尝试得分 89.4%,超过 Claude Opus 4.1(得分 80.9%)和 Grok 4 Heavy(得分 88.9%)。 OpenAI 表示,GPT-5 在回答健康相关问题方面表现更出色。在衡量人工智能模型健康领域回应准确性的测试 “HealthBench Hard Hallucinations” 中,OpenAI 称 GPT-5(启用思考功能时)的幻觉率仅为 1.6%。这远低于该公司此前的 GPT-4o 和 o3 模型,后两者的得分分别为 12.9% 和 15.8%。 尽管人工智能聊天机器人并非医疗专业人员,但数百万用户正借助它们获取健康建议。针对这一现象,该公司表示,GPT-5 会更主动地提示潜在的健康问题,并帮助用户解读医疗检查结果。 此外,OpenAI 称,在创意设计、写作等更难衡量的主观领域,GPT-5 也优于其他人工智能模型。特利表示,在创意任务中,GPT-5 的回应更自然,且展现出 “更好的品味”。 “这款模型的‘氛围’真的很棒,” 特利说。 GPT-5 也比 OpenAI 之前的模型更准确,该公司称,与 o 系列模型相比,GPT-5 的幻觉现象(即人工智能模型编造信息的倾向)大幅减少。此前,在 OpenAI 最新的人工智能
推理模型
(如 o3)中,幻觉问题似乎愈发严重,而该公司此前表示尚未完全弄清楚原因。 在对 ChatGPT 提示词的回应中,OpenAI 发现 GPT-5(启用思考功能时)产生幻觉并给出错误信息的概率为 4.8%。这较 o3 和 GPT-4o 有显著降低,后两者在测试中的幻觉率分别为 22% 和 20.6%。 在衡量人工智能模型完成模拟在线任务的代理能力基准测试 Tau-bench 中,GPT-5 的表现好坏参半。在测试人工智能浏览航空公司网站能力的部分,GPT-5 得分 63.5%,略低于 o3 模型的 64.8%。在测试人工智能浏览零售网站能力的另一部分,GPT-5 得分 81.1%,低于 Claude Opus 4.1 模型的 82.4%。 OpenAI 还表示,GPT-5 比其之前的模型更安全。尽管人工智能
推理模型
偶尔会表现出针对人类的谋划倾向,或为了达成自身目标而说谎,但 OpenAI 发现 GPT-5 的欺骗率低于其他模型。 OpenAI 安全研究负责人亚历克斯・比图尔表示,降低欺骗性不仅提高了 GPT-5 的安全性,还改善了用户体验,打造出一个 “在用户可信赖的层面上更透明、更诚实” 的模型。 比图尔还指出,GPT-5 能更好地区分试图滥用 ChatGPT 的恶意用户和提出无害请求的用户。这使得 GPT-5 能够拒绝更多不安全的问题,同时减少对寻求无害信息用户的拒绝次数。 为消费者和开发者打造的升级功能 随着 GPT-5 的发布,ChatGPT 迎来了多项用户体验升级。用户现在可以在 ChatGPT 的设置中选择四种新的人格:愤世嫉俗型、机器人型、倾听者型和书呆子型。该公司表示,这些人格将自动调整 ChatGPT 的回应方式,无需用户专门要求模型以特定方式回应。 每月支付 20 美元的 ChatGPT Plus 订阅用户比免费用户拥有更高的 GPT-5 使用限额。而每月支付 200 美元的 Pro 订阅用户可无限制使用 GPT-5,并能访问增强版的 GPT-5 Pro—— 该版本使用额外的计算资源生成更优质的答案。采用 OpenAI Team、Edu 和企业版计划的机构将在下周获得 GPT-5 作为默认模型。 对于开发者,GPT-5 将以三种规格通过 OpenAI 的 API 开放 ——gpt-5、gpt-5-mini 和 gpt-5-nano,它们在任务 “推理” 上花费的时间长短不同。开发者现在还可以通过 OpenAI API 控制回应的详细程度,决定人工智能模型的回应篇幅长短。 GPT-5 基础模型对开发者的收费为:每百万输入令牌 1.25 美元(约合 75 万个单词,比整套《指环王》系列的字数还多),每百万输出令牌 10 美元。 GPT-5 的发布之前,OpenAI 度过了忙碌的一周。该公司发布了开源权重
推理模型
gpt-oss,开发者和企业可免费下载,且运行成本极低。这款开源模型的能力几乎与 OpenAI 之前的顶级模型 o3 和 o4-mini 相当,但 GPT-5 在编程等部分领域树立了新的前沿性能标准。 不过,在多个领域,GPT-5 似乎与其他前沿人工智能模型大致相当。当然,基准测试只能反映人工智能模型的部分表现,开发者将如何在现实世界中使用 GPT-5,以及该模型是否真的超越竞争对手,仍有待观察。
lg
...
金融界
08-08 07:58
全球大模型迭代加速,机构研判港股科技龙头有望重新跑赢市场,港股通科技ETF南方(159269)溢价交易备受资金关注
go
lg
...
得分刷新行业记录;OpenAI发布开源
推理模型
gpt-oss,200亿参数版本可在移动端本地部署且性能表现良好。模型厂商近期的快速更新迭代的影响包括:科技巨头在前沿模型领域的军备竞赛、推理&scaling law&多模态等带来的算力持续爆炸式增长、推理能力提升带来复杂应用场景解锁可能等。 国泰海通证券表示,尽管6月下旬以来港股相对偏震荡,港股科技相较于创新药等阶段性跑输。但港股科技、消费类资产与当前AI应用、新消费等产业趋势相关度更高,且基本面更优,相较A股而言仍具有稀缺性。因此,港股科技、消费、红利等稀缺性资产在宏观偏弱环境下仍具备较强吸引力。预计下半年港股互联网巨头或将加大AI基础设施领域的资本投入,大模型迭代与AI应用落地进度有望提速。随着本轮AI浪潮的产业周期向上趋势进一步确认,有望推动相关的港股科技龙头重新跑赢市场。 港股通科技ETF南方(159269)紧密跟踪中证港股通科技指数,中证港股通科技指数从港股通范围内选取50只市值较大、研发投入较高且营收增速较好的科技龙头上市公司证券作为指数样本,以反映港股通内科技龙头上市公司证券的整体表现。指数前十大权重股分别为腾讯控股、阿里巴巴-W、小米集团-W、比亚迪股份、美团-W、中芯国际、快手-W、信达生物、理想汽车-W、小鹏汽车-W。 相关产品:港股通科技ETF南方(159269) 以上内容与数据,与有连云立场无关,不构成投资建议。据此操作,风险自担。
lg
...
有连云
08-07 14:48
GPT-5发布在即!海外AI大模型接踵而至,算力需求猛增!云计算ETF汇添富(159273)盘中翻红,溢价持续高企!
go
lg
...
得分刷新行业记录;OpenAI发布开源
推理模型
GPT-oss,200亿参数版本可在移动端本地部署且性能表现良好。 中信证券认为,模型厂商近期的快速更新迭代的影响包括:科技巨头在前沿模型领域的军备竞赛、推理&scaling law&多模态等带来的算力持续爆炸式增长、推理能力提升带来复杂应用场景解锁可能等。美股科技领域,建议继续围绕基础设施、AI应用等环节,重点布局AI计算芯片、HBM、AI网络设备、IDC、基础&应用软件、互联网服务等领域。 (来源:中信证券20250806《前瞻研究全球AI人工智能产业重大事项点评》) 展望2025下半年,中信证券认为AI核心技术(模型、算力)的创新将会持续加速,叠加应用场景广泛探索及生态建设提速,AI产业链有望迎来新一轮投资机遇。 1)算力趋势:系统级算力成下一代AI发展重要趋势。技术层面,下一代模型尺寸进一步提升、Mamba等新型模型架构、推理解决高并发与低延时等问题,对算力基础设施提出新要求,通过网络扩展及片间互连搭建起的系统级算力硬件成重要趋势。需求端,各大厂商资本开支维持高位、海外芯片恢复销售等因素,推动需求高增并兑现。 2)模型方向:多模态、长逻辑成为下一代模型主要发力方向。下一代模型或将拥有更大的模型规模,带动其在专业学科知识、基础推理、视觉识别等方面性能提升,推动多模态、长逻辑能力再提升。上半年以来,DeepSeek、Kimi K2、Grok 4等模型进展不断,近期以Kimi K2、Grok-4为代表,其分别作为基座模型、逻辑模型以提升工具使用能力为主要方向,长流程专业工作潜力支持Agent落地高价值场景。预计下一代大模型(如GPT-5)将在逻辑推理、原生多模态、记忆系统等关键能力继续突破,打开更多应用机会。 3)应用展望:Agent是最为广泛的应用方式,多模态进一步打开空间。预计未来Agent将具备更强工具使用能力,完成长流程复杂任务带动价值提升,独立行动实现“单点辅助”到“流程替代”的价值提升,应用范围有望进一步扩展;原生多模态+多模态推理将提升数理领域、图文结合、规划分析等领域能力,带动多模态应用全面提速。建议关注企业管理、办公/编辑工具、教育/医疗/法律、科研/仿真等领域AI落地机遇。 (来源:中信证券20250805《计算机下半年投资展望》) AI驱动,云算未来!“算力ETF”哪里找?认准A+H算力龙头全覆盖的云计算ETF汇添富(159273)!一指横跨沪港深,全面布局AI算力驱动下的云计算历史性机遇,“既要”捕捉港股科技龙头的AI发展红利,“又要”踏准芯片浪潮下的CPO爆发契机!云计算ETF汇添富(159273)标的指数涵盖硬件设备、云计算服务、IT服务、应用软件、数据中心运营、平台软件等领域,软:硬件比例6:4,指数港股权重超26%,独有权重更是高达31%! 风险提示:基金有风险,投资需谨慎。特此提示投资者关注二级市场交易价格溢价风险,若盲目投资溢价率过高产品,可能遭受重大损失。本资料仅为宣传材料,不作为任何法律文件。投资有风险,基金管理人承诺以诚实信用、勤勉尽职的原则管理和运用基金资产,但不保证基金一定盈利,也不保证最低收益。投资人购买基金时应详细阅读《基金合同》《招募说明书》《基金产品资料概要》等法律文件,了解基金的具体情况。基金管理人的其他基金业绩和其投资人员取得的过往业绩并不预示其未来表现。本基金由汇添富基金管理股份有限公司发行与管理,代销机构不承担产品的投资、兑付和风险管理责任。上述基金均属于中等风险等级(R3)产品,适合经客户风险承受等级测评后结果为平衡型(C3)及以上的投资者,客户-产品风险等级匹配规则详见汇添富官网。本基金投资范围包括港股,会面临因投资环境、投资标的、市场制度以及交易规则等差异带来的特有风险。 以上内容与数据,与有连云立场无关,不构成投资建议。据此操作,风险自担。
lg
...
有连云
08-07 11:48
亚马逊AWS首度引入OpenAI模型,旨在提振AI竞争力
go
lg
...
er平台中。两者分别代表轻量级与高性能
推理模型
,面向企业级AI应用部署。 这些模型的上线意味着AWS客户可在自身的云环境中直接调用OpenAI的先进技术,无需依赖微软Azure,从而降低迁移与集成成本。 满足客户对多元AI工具的需求 AWS产品总监Atul Deo指出,客户需要多种AI模型进行对比和使用,以便找到最适合自身业务需求的工具。 他表示:“我们希望给客户提供选择与灵活性。OpenAI成为我们开放权重模型提供商,标志着我们推进AI普及愿景的关键一步。” 随着模型集成,AWS客户将可以在统一的操作平台上访问包括OpenAI、Anthropic和Amazon自研模型在内的多厂商大型语言模型(LLM),大幅提升开发效率。 财报承压背景下的技术合作突破 值得关注的是,亚马逊此次合作背景是其近期公布的财报表现低于市场预期。AWS第二季度销售增长逊色,第三季度盈利预期也令人失望,引发市场对其云业务增长的担忧。 此前,微软Azure因可独家转售OpenAI技术,在AI基础设施竞争中处于领先。此次合作旨在强化AWS作为“AI超市”的战略定位,提升市场信心。 以下是相关企业在AI模型集成方面的对比: 云服务商 集成AI模型 合作对象 独家优势 亚马逊AWS gpt-oss-120b、Claude等 OpenAI、Anthropic 模型多样化,平台融合 微软Azure GPT-4、ChatGPT企业版 OpenAI(战略投资) 独家商业转售权 Google Cloud Gemini系列 Google DeepMind 自产自用、搜索整合 权威点评与总结 从AWS此次接入OpenAI开放权重模型来看,亚马逊正在迅速调整其云战略,力图缩小与Azure之间在AI生态上的差距。此次举措不仅拓展了客户可选模型范围,也为AWS注入新的增长动能。 面对云计算红海竞争,AWS“AI超市”策略有望重塑其产品差异化优势。而通过兼容Anthropic、OpenAI等第三方模型,AWS在技术中立性与灵活性上具备一定优势。 最终,这一合作不仅提升了OpenAI模型的可达性,也为AWS带来了挽回市场份额的希望。 AWS的这一动作,表明亚马逊不愿在AI基础设施竞赛中落后。未来数月,我们将看到更多多模型平台战略落地。 —— Bernstein Research,2025年8月6日 OpenAI模型开放权重在AWS上运行,为客户带来更多可控性,也可能促进模型精调等个性化开发。 —— Forrester AI分析团队,2025年8月6日 这对AWS是好消息,对微软是信号。AI战场不再是单边合作,而是全生态博弈。 —— Wedbush证券首席分析师,2025年8月6日 常见问题解答 Q1:这是AWS首次提供OpenAI模型吗? A1:是的,这是亚马逊首次将OpenAI模型引入其云计算平台,打破了微软的独家地位。 Q2:哪些平台可以使用这些模型? A2:模型将部署在AWS的Bedrock和SageMaker平台上,适合不同类型的AI开发需求。 Q3:这是否会影响微软Azure对OpenAI的独家优势? A3:部分影响。虽然Azure仍拥有独家商业部署权,但开放权重模型在AWS可用将削弱其技术壁垒。 Q4:AWS为何选择此时合作? A4:亚马逊云业务增长放缓,急需通过AI战略提振信心,开放合作是应对市场压力的策略之一。 Q5:企业客户将获得哪些优势? A5:客户可使用多个主流AI模型进行对比与微调,提升AI开发效率和业务适配性。 来源:今日美股网
lg
...
今日美股网
08-07 00:12
超微电脑展望不及预期,盘后暴跌16%,高估值泡沫要破了?
go
lg
...
人工智能相关领域所有事物的期望,尤其是
推理模型
引发的AI算力需求激增,已经吸引了投资者注意力。任何程度的疲软都会带来深深的失望,这意味着股价可能持续暴跌。” 原文链接
lg
...
TradingKey
08-06 13:08
降息预期+AI超预期,港股科技大热!恒生科技ETF基金(513260)融资余额创上市新高,港股通科技30ETF(520980)连续第16日吸金!
go
lg
...
型向更强、更高效、更可靠方向发展,呈现
推理模型
深化、智能体模型爆发的格局。美国在探索更强大模型上保持全球领先,中国企业则在算力受限下实现高效性全球领先。2025年是应用加速落地之年,OpenAI已达百亿美金ARR,Claude月收入环比增速超20%。受互联网大厂推动AI与业务结合、Agent推出、主权AI需求及多模态渗透等因素影响,AI算力消耗从训练转向推理,带来显著增量,国内算力自主可控趋势凸显。B端应用渗透率慢于C端,落地顺序由容错率与复杂度决定,从高容错、单一任务场景到低容错、高复杂度场景尚需时间。但本轮AI渗透较互联网时代大幅提速,B端落地进程或超预期。 (来源:中信建投证券20250724《AI新纪元:砥砺开疆・智火燎原》) 海外方面,全球AI设计龙头上市引资本热潮。其上市的亮眼表现表明,协作设计SaaS已进入高增长通道。该公司于2025年7月31日上市,首日收盘大涨250%,截止8月1日收盘,公司市值达595亿美金,按照其近10亿美金的ARR算,PS将近60x。公司依托FigmaDesign、FigJam等产品构建全流程设计体系,结合多档订阅模式和高NDR(超130%)表现,2024年营收同比增长48%,持续领跑全球SaaS设计协作软件市场。按照衡量SaaS公司健康度的“Ruleof 40”(增长率+利润率)标准计算,该AI设计龙头的得分在63%左右,突显公司本身的强竞争力和AIGC带来的产业机会。 中信建投证券指出,根据Sensor Tower 2025年1月统计的全球AI应用收入结构中,摄影及美颜相机类、AI生图App占AI整体商业化42%,是目前最好的AI应用商业化赛道。 (来源:中信建投证券20250804《全球AI设计龙头上市引资本热潮,重视AI应用领域投资机会》) 看好AI产业链颠覆性投资机遇,认准全市场费率最低档的恒生科技ETF基金(513260),恒生科技作为港股代表性核心旗舰指数,软硬件兼备,综合覆盖科技各子板块(芯片电子、制造型硬科技等),更全面覆盖中国科技产业链,管理费仅为0.15%,较其他同类ETF显著更低,也是全市场唯一的管理费仅15BP的恒生科技ETF基金!恒生科技ETF基金(513260)还设有场外联接基金(A类:013127;C类:013128)方便7*24申赎。 一键布局港股科技,认准更“纯”科技属性的港股通科技30ETF(520980)!标的指数聚焦TMT行业,不含医药、家电、汽车,AI属性更纯!前十大成分股合计权重高达75%,龙头含量更高!港股通科技30ETF(520980)还支持T+0交易、不占用QDII额度,是投资港股科技赛道更为高效便捷的选择,一键轻松勾勒精华版的“科技版图”! 风险提示:基金有风险,投资需谨慎。特此提示投资者关注二级市场交易价格溢价风险,若盲目投资溢价率过高产品,可能遭受重大损失。投资人应当阅读《基金合同》《招募说明书》《产品资料概要》等法律文件,了解基金的风险收益特征,特别是特有风险,并根据自身投资目的、投资经验、资产状况等判断是否和自身风险承受能力相适应。基金管理人承诺以诚实信用、谨慎尽责的原则管理和运用基金资产,但不保证基金一定盈利或本金不受损失。上述基金均属于中等风险等级(R3)产品,适合经客户风险等级测评后结果为平衡型(C3)及以上的投资者。标的指数并不能完全代表整个股票市场。标的指数成份股的平均回报率与整个股票市场的平均回报率可能存在偏离。请投资者关注指数化投资的风险以及集中投资于单一指数成分股的持有风险,请关注部分指数成分股权重较大、集中度较高的风险,请关注指数化投资的风险、ETF运作风险、投资特定品种的特有风险等;以上产品投资于境外证券市场,基金净值会因为所投资证券市场波动等因素产生波动。本基金投资范围包括港股,会面临因投资环境、投资标的、市场制度以及交易规则等差异带来的特有风险。 以上内容与数据,与有连云立场无关,不构成投资建议。据此操作,风险自担。
lg
...
有连云
08-05 13:38
揭秘OpenAI的野心:让AI为你搞定一切
go
lg
...
团队被视为 OpenAI 打造 AI
推理模型
这一行业领先举措的关键力量,而 AI
推理模型
正是能像人类一样在电脑上完成任务的 AI 代理的核心技术。 “我们当时试图让模型在数学推理方面做得更好,因为那时它们在这方面还很薄弱,” 莱特曼在描述 MathGen 早期工作时对 TechCrunch 表示。 OpenAI 的模型如今远非完美 —— 该公司最新的 AI 系统仍会出现幻觉,其代理在处理复杂任务时也力不从心。 但它的最先进模型在数学推理方面已有显著进步。OpenAI 的一款模型最近在国际数学奥林匹克竞赛(一项面向全球最聪明高中生的数学竞赛)中斩获金牌。OpenAI 认为,这些推理能力将迁移到其他学科,最终为该公司一直梦寐以求的通用代理提供动力。 ChatGPT 的诞生纯属意外 —— 一次低调的研究预览意外走红,演变成消费级业务 —— 但 OpenAI 的代理是该公司多年来精心努力的成果。 “最终,你只需向电脑提出需求,它就会为你完成所有这些任务,”OpenAI 首席执行官山姆・奥特曼在 2023 年公司首届开发者大会上表示。“这些能力在 AI 领域通常被称为代理。其带来的好处将是巨大的。” 这些代理能否实现奥特曼的愿景仍有待观察,但 OpenAI 在 2024 年秋季推出首个 AI
推理模型
o1 时,震惊了世界。不到一年后,促成这一突破的 21 名基础研究员成为硅谷最炙手可热的人才。 马克・扎克伯格招募了 5 名参与 o1 研发的研究员,让他们加入 Meta 新成立的专注于超级智能的部门,并为部分人提供了超过 1 亿美元的薪酬方案。其中之一的赵胜佳最近被任命为 Meta 超级智能实验室的首席科学家。 强化学习的复兴 OpenAI
推理模型
和代理的崛起与一种名为强化学习(RL)的机器学习训练技术息息相关。强化学习在模拟环境中向 AI 模型反馈其选择是否正确。 强化学习已应用数十年。例如,2016 年,在 OpenAI 于 2015 年成立约一年后,谷歌(189.95,-2.91,-1.51%)DeepMind 使用强化学习创建的 AI 系统 AlphaGo 在围棋比赛中击败世界冠军,引发全球关注。 大约在那时,OpenAI 的首批员工之一安德烈・卡帕西开始思考如何利用强化学习创建一个能使用电脑的 AI 代理。但 OpenAI 花了数年时间才开发出必要的模型和训练技术。 到 2018 年,OpenAI 在 GPT 系列中率先推出首个大型语言模型,该模型在海量互联网数据和大型 GPU 集群上进行预训练。GPT 模型在文本处理方面表现出色,最终催生出 ChatGPT,但在基础数学方面却存在短板。 直到 2023 年,OpenAI 才取得突破,最初将其命名为 “Q*”,后又改称 “Strawberry”。这一突破通过结合大型语言模型、强化学习和一种名为测试时计算的技术实现。后者让模型在给出答案前,有额外的时间和计算能力来规划和解决问题,并验证每一步骤。 这使得 OpenAI 能够引入一种名为 “思维链”(CoT)的新方法,该方法提高了 AI 在处理未见过的数学问题时的表现。 “我能看到模型开始进行推理,” 埃尔・基什基说。“它会发现错误并回溯,还会‘感到沮丧’。这真的就像在阅读一个人的想法。” 尽管这些技术本身并非新颖,但 OpenAI 独特地将它们结合起来,创建了 Strawberry,这直接促成了 o1 的开发。OpenAI 很快意识到,AI
推理模型
的规划和事实核查能力可用于为 AI 代理提供动力。 “我们解决了一个我多年来一直冥思苦想的问题,” 莱特曼说。“这是我研究生涯中最激动人心的时刻之一。” 扩展推理能力 凭借 AI
推理模型
,OpenAI 确定了两个可用于改进 AI 模型的新方向:在 AI 模型的后期训练中使用更多计算能力,以及让 AI 模型在回答问题时有更多时间和处理能力。 “作为一家公司,OpenAI 不仅关注事物的现状,还非常关注它们的扩展方式,” 莱特曼说。 两位消息人士告诉 TechCrunch,在 2023 年 Strawberry 取得突破后不久,OpenAI 成立了一个由研究员丹尼尔・塞尔萨姆领导的 “代理” 团队,以在这一新范式上取得进一步进展。尽管该团队名为 “代理”,但 OpenAI 最初并未像我们如今所想的那样区分
推理模型
和代理。该公司只是想让 AI 系统能够完成复杂任务。 最终,塞尔萨姆领导的代理团队的工作成为开发 o1
推理模型
这一更大项目的一部分,该项目的负责人包括 OpenAI 联合创始人伊利亚・萨茨凯弗、首席研究官马克・陈和首席科学家雅各布・帕乔基。 OpenAI 必须投入宝贵的资源 —— 主要是人才和 GPU—— 来开发 o1。纵观 OpenAI 的历史,研究人员必须与公司领导层协商以获取资源,而展示突破性成果是确保获得资源的可靠方法。 “OpenAI 的核心特点之一是,研究方面的一切都是自下而上的,” 莱特曼说。“当我们展示(o1 的)证据时,公司表示‘这很有意义,让我们继续推进’。” 一些前员工表示,这家初创公司开发通用人工智能(AGI)的使命是在 AI
推理模型
方面取得突破的关键因素。通过专注于开发尽可能智能的 AI 模型,而非产品,OpenAI 能够将 o1 置于其他工作之上。而在竞争激烈的 AI 实验室中,对这类想法进行如此大规模的投资并非总能实现。 事实证明,尝试新训练方法的决定是有先见之明的。到 2024 年底,几家领先的 AI 实验室开始发现,通过传统预训练扩展创建的模型回报递减。如今,AI 领域的大部分动力来自
推理模型
的进步。 AI “推理” 意味着什么? 在很多方面,AI 研究的目标是用计算机重现人类智能。自 o1 推出以来,ChatGPT 的用户体验中充满了更像人类的功能,如 “思考” 和 “推理”。 当被问及 OpenAI 的模型是否真正在推理时,埃尔・基什基有所保留,称他从计算机科学的角度看待这个概念。 “我们正在教模型如何高效地消耗计算资源来获取答案。所以如果你从这个角度定义,是的,它正在推理,” 埃尔・基什基说。 莱特曼则更关注模型的结果,而不太在意其方式或与人类大脑的关系。 “如果模型正在做困难的事情,那么它正在做完成这件事所必需的任何近似推理,” 莱特曼说。“我们可以称之为推理,因为它看起来像这些推理轨迹,但这一切都只是为了打造对很多人来说真正强大且有用的 AI 工具的一种替代说法。” OpenAI 的研究人员指出,人们可能不同意他们对推理的命名或定义 —— 当然,批评者已经出现 —— 但他们认为,这不如其模型的能力重要。其他 AI 研究人员也倾向于认同这一点。 非营利组织 AI2 的 AI 研究员内森・兰伯特在一篇博文中将 AI 推理模式比作飞机。他说,两者都是受自然启发的人造系统 —— 分别受人类推理和鸟类飞行启发 —— 但它们通过完全不同的机制运作。这并不会降低它们的有用性,也不会削弱它们实现类似结果的能力。 来自 OpenAI、Anthropic 和谷歌 DeepMind 的一群 AI 研究人员在最近的一份立场文件中一致认为,如今人们对 AI
推理模型
的理解还不够深入,需要更多的研究。现在就断言这些模型内部到底在发生什么,可能还为时过早。 下一个前沿:用于主观任务的 AI 代理 如今市场上的 AI 代理在定义明确、可验证的领域(如编码)表现最佳。OpenAI 的 Codex 代理旨在帮助软件工程师分担简单的编码任务。与此同时,Anthropic 的模型在 Cursor 和 Claude Code 等 AI 编码工具中特别受欢迎 —— 这些是人们愿意付费使用的首批 AI 代理中的一部分。 然而,像 OpenAI 的 ChatGPT 代理和 Perplexity 的 Comet 这样的通用 AI 代理,在处理许多人们希望自动化的复杂、主观任务时却力不从心。我发现,当尝试使用这些工具进行网上购物或寻找长期停车位时,这些代理花费的时间比我预期的要长,而且还会犯一些愚蠢的错误。 当被问及代理在主观任务方面的局限性时,莱特曼说:“与机器学习中的许多问题一样,这是一个数据问题。我现在真正感到兴奋的一些研究是,想办法在可验证性较低的任务上进行训练。我们在如何做这些事情上有了一些线索。” 帮助创建国际数学奥林匹克模型和 o1 的 OpenAI 研究员诺姆・布朗告诉 TechCrunch,OpenAI 拥有新的通用强化学习技术,这些技术使他们能够教授 AI 模型那些不易验证的技能。他说,该公司正是通过这种方式构建了在国际数学奥林匹克竞赛中获得金牌的模型。 OpenAI 的国际数学奥林匹克模型是一个较新的 AI 系统,它能生成多个代理,这些代理随后同时探索多个想法,然后选择最佳答案。这类 AI 模型正变得越来越受欢迎;谷歌和 xAI 最近也发布了使用这种技术的最先进模型。 “我认为这些模型在数学方面的能力会越来越强,而且在其他推理领域也会变得更有能力,” 布朗说。“进步速度快得惊人。我没有理由认为它会放缓。” 这些技术可能有助于提高 OpenAI 模型的性能,而这些进步可能会在该公司即将推出的 GPT-5 模型中体现出来。OpenAI 希望通过推出 GPT-5 来巩固其对竞争对手的优势,理想情况下,为开发者和消费者提供最优秀的 AI 模型来驱动代理。 但该公司也希望使其产品更易于使用。埃尔・基什基表示,OpenAI 希望开发出能直观理解用户需求的 AI 代理,而无需用户选择特定设置。他说,OpenAI 的目标是构建这样的 AI 系统:知道何时调用特定工具,以及需要推理多长时间。 这些想法描绘出 ChatGPT 终极版本的图景:一个能在互联网上为你做任何事情,并理解你希望如何去做的代理。这与如今的 ChatGPT 有很大不同,但该公司的研究正朝着这个方向稳步前进。 虽然 OpenAI 无疑在几年前引领了 AI 行业,但如今该公司面临着一大批强劲的对手。问题不再仅仅是 OpenAI 能否实现其代理化的未来,而是该公司能否在谷歌、Anthropic、xAI 或 Meta 之前做到这一点?
lg
...
金融界
08-04 07:48
国常会通过《关于深入实施“人工智能+”行动的意见》,AI智能体应用加速落地
go
lg
...
和更可靠的方向发展。这一趋势不仅推动了
推理模型
的深化,也催生了智能体模型的快速发展。2025年被认为是Agent(智能体)元年,推理需求的激增将带动算力需求的爆发。当前AI应用的加速落地,尤其是在B端领域,较互联网时代有显著提升,预计将超出市场预期。中金公司表示,在科技与金融的“双轮驱动"下,我国人工智能正加快实现跨越式发展,成为新质生产力和经济转型升级的重要引擎。人工智能等前沿科技的发展,需要依托相应的科技金融体系,通过多层次资本市场形成“科技-产业-金融"的良性循环。
lg
...
金融界
08-01 08:37
从“世界工厂”到“全球创新者”,中国经济“酷因子”崛起?
go
lg
...
Seek推出性能强大、价格低廉的R-1
推理模型
,震惊全球,引发关于“AI竞赛”主导权的激烈争论。 紧接着在5月初,中美紧张关系升至新高,关税飙升至100%以上,几乎使双边贸易停摆,随后局势才得以缓和。 到了夏天,中国再次开始向美国出口关键稀土,英伟达也重启对中国的AI芯片销售,显示出全球两大经济体之间贸易关系正趋向缓和。 在这轮剧烈波动中,中国资本市场表现出色。MSCI中国指数截至7月25日年内上涨约25%,大幅领先MSCI全球指数的12%涨幅以及标普500指数的9%涨幅。 值得注意的是,这一强劲表现不仅受到传统商业周期的推动,更体现创新、协作和青年文化带来的吸引力,暗示中国下一轮增长周期可能与过去大不相同。 从模仿者到创新者 中国从“低成本模仿者”到“全球创新者”的转变,最直观的体现莫过于其在电动车领域的领先地位。中国电动车龙头比亚迪起初只是家电池制造商,甚至曾被埃隆·马斯克嘲笑产品不美观、技术薄弱。 但在国家政策支持和中国建设千万级充电网络的推动下,比亚迪经历十年发展,在全球销量上超越了特斯拉。2024年,全球每卖出五辆电动车就有一辆来自比亚迪,其市场份额已是特斯拉的两倍。如今比亚迪及其它中国品牌的车型不仅外观时尚,还配备了不少独特功能,媲美美国竞争对手。 除产品创新外,中国企业还在商业模式和销售策略上不断探索。 例如由阿里巴巴率先推出的“直播社交购物”模式,现已被亚马逊、Instagram、YouTube甚至沃尔玛(与TikTok合作)引入美国市场,用以吸引Z世代和千禧一代消费者。 另一个新秀是中国玩具公司泡泡玛特(Pop Mart)。它推出的“盲盒”销售策略通过随机隐藏毛绒玩偶“Labubu”的方式,让用户在开盒中获得惊喜。这种模式不仅在中国走红,也在国际市场掀起热潮。2024年,泡泡玛特海外市场销售额已占其总营收近40%,2025年上半年利润预计同比增长超过350%。 开源合作架构师 以往知识产权问题一直困扰中国的全球贸易关系,而如今其对开源协作的拥抱标志着重大转变。 中国目前是GitHub平台增长最快、第二大开源代码贡献国。华为、腾讯等中国科技巨头也成为Apache和Linux等开源基金会的重要企业赞助者,这些基金会掌握着如人工智能、云计算等基础技术的核心制定权。 DeepSeek推出的R-1模型正是这一战略的典范。它以MIT开源许可证发布,允许广泛的商业再利用(相比之下,谷歌的Apache 2.0和Meta的Llama则更为限制),全球开发者据此构建大量衍生模型。这种开放有助于建立开发者忠诚度、影响AI技术标准、并缓解地缘政治摩擦。 这一转变还得益于中国对科研实力的持续投入。根据《自然》杂志,2024年中国在高质量科研论文发表方面连续第二年居全球首位。即使在半导体设计与制造这一传统上由美国主导的领域,中国学者也在2024年贡献了全球被引用最多的一半论文。 结构性阻力仍存 尽管如此,中国经济面临的挑战依旧不容忽视。尽管政府出台多项刺激政策,包括扩大消费补贴和央行支持国企收购库存住房等举措,2025年截至目前,工业利润仍同比下降1.1%。电动车和外卖等行业的价格战愈发激烈,政府甚至出面调解被认为是“非理性”的竞争行为。 另一个结构性难题是青年失业率。2025年中国16-24岁非在校人口失业率仍高达14.5%,远高于全国劳动人口整体的5%。如果中国的未来增长要建立在“酷因子”之上,那么青年群体的职业前景必须足够稳定,以支撑他们独特的消费偏好和创业动力。 尽管面临这些挑战,创新与开放协作仍有可能重塑中国的全球形象。与以房地产、基建和产能投资为引擎的传统增长模式不同,这种由“文化魅力”驱动的经济增长可能更加分散和个性化,因而不那么周期性。 中国不再只是“世界工厂”,也正在成为文化创新的输出国。正如美国几十年来所展现的那样,“酷”的价值不容低估。
lg
...
风起
07-30 11:20
会员
AI新纪元!WAIC大会催化不断!科创100ETF汇添富(589980)大涨近2%,冲击七连涨!科创板接棒上涨?券商分析!
go
lg
...
型向更强、更高效、更可靠方向发展,呈现
推理模型
深化、智能体模型爆发的格局。 从大模型应用端来看,AI垂类大模型百花齐放,AI智能体成落地关键。 布局AI新纪元,可关注科创100ETF汇添富(589980) 【AI新纪元:
推理模型
深化、智能体模型爆发】 中信建投表示,自ChatGPT发布后,大模型向更强、更高效、更可靠方向发展,呈现
推理模型
深化、智能体模型爆发的格局。我国企业实现高效性全球领先。2025年是应用加速落地之年,OpenAI已达百亿美金ARR,Claude月收入环比增速超20%。受互联网大厂推动AI与业务结合、Agent推出、主权AI需求及多模态渗透等因素影响,AI算力消耗从训练转向推理,带来显著增量,国内算力自主可控趋势凸显。B端应用渗透率慢于C端,落地顺序由容错率与复杂度决定,从高容错、单一任务场景到低容错、高复杂度场景尚需时间。但本轮AI渗透较互联网时代大幅提速,B端落地进程或超预期。(来源于中信建投20250729《AI新纪元:砥砺开疆・智火燎原》) 【AI垂类大模型百花齐放,AI智能体成落地关键】 长江证券表示,国产AI垂类大模型百花齐放,AI智能体成落地关键。此次大会上,SmithRM 金融推理大模型、光明电力大模型、九天大模型、经纬大模型、宝联登工业大模型等垂类大模型展示了 AI 在垂类场景的应用。同时,多家国内大厂也展出了多款用户级 Agent 解决方案。国产大模型性能持续提升的同时,AI智能体的进步将进一步加速我国 AI 在具体场景的落地。(来源于长江证券20250728《WAIC 大会正式开幕,全面看好国产 AI 产业链》) 对于后市,中信建投表示,市场情绪高涨,有关部门表态“全力巩固市场回稳向好态势”继续力挺市场走牛,赚钱效应下融资买入,新基金发行指标上行,表明高涨的市场情绪下,增量资金有望加速流入。反内卷中继之后,产业催化与大行情氛围下,科技非银有望接力行情。继续看好以“新机智药”(新消费、机器人、人工智能、创新药)为代表的新赛道。(来源于中信建投20250728《A股站上新台阶,看好科技非银接力》) 在政策引导、科技创新、市场资金三大因素共同催化下,科技行情有望延续。布局科技黑马,掘金尖端科技,认准科创100ETF汇添富(589980),与“投早、投小、投长期、投硬科技”政策方向高度契合,把握AI、机器人、创新药等高精尖领域产业创新突破潜能! 风险提示:基金有风险,投资需谨慎。本材料仅为宣传材料,不作为任何法律文件。我国基金运作时间较短,不能反映股市发展的所有阶段。投资有风险,基金管理人承诺以诚实信用、勤勉尽责的原则管理和运用基金资产,但不保证本基金一定盈利,也不保证最低收益。基金管理人管理的其他基金的业绩不构成对本基金业绩表现的保证。投资人应当认真阅读《基金合同》、《招募说明书》和《产品资料概要》等基金法律文件,基金管理人提醒投资人基金投资的"买者自负”原则。本基金属于较高风险等级(R4)产品,适合经客户风险承受等级测评后结果为进取型(C4)及以上的投资者,客户-产品风险等级匹配规则详见汇添富官网。 以上内容与数据,与有连云立场无关,不构成投资建议。据此操作,风险自担。
lg
...
有连云
07-29 14:08
上一页
1
•••
4
5
6
7
8
•••
34
下一页
24小时热点
特朗普一句话挑清中美芯片战!非农缺席取而代之的是TA,美联储鹰姿刺激美元
lg
...
白宫爆发激烈争论!美媒曝“一场被取消的谈判”:特朗普临时叫停英伟达对华芯片计划
lg
...
【黄金收评】发生了什么!?金价巨震68美元 中国重磅消息一度引发金价暴跌
lg
...
【直击亚市】中国一则消息重挫黄金!强财报+中美缓和刺激人气,美国政府还在停摆
lg
...
特朗普刚刚重磅表态!特朗普:中国和其他国家不能拥有英伟达的顶级人工智能芯片
lg
...
最新话题
更多
#AI热潮:从芯片到资本的竞赛#
lg
...
16讨论
#SFFE2030--FX168“可持续发展金融企业”评选#
lg
...
36讨论
#VIP会员尊享#
lg
...
1989讨论
#比特日报#
lg
...
10讨论
#Web3项目情报站#
lg
...
6讨论