全球数字财富领导者
财富汇
|
美股投研
|
客户端
|
旧版
|
北美站
|
FX168 全球视野 中文财经
首页
资讯
速递
行情
日历
数据
社区
视频
直播
点评旗舰店
商品
SFFE2030
外汇开户
登录 / 注册
搜 索
综合
行情
速递
日历
话题
168人气号
文章
2月13日财经早餐:美国1月CPI强劲,对等关税迫在眉睫
go
lg
...
的GPT-4.5模型,未来几个月内推出
GPT-5
OpenAI行政总裁Sam Altman周三在社交平台X上发表帖文指,公司将于未来几周内发布名为GPT-4.5的新人工智能模型,代号为Orion。Orion将是公司推出的最后一款不使用额外运算能力来模仿人类推理方式的模型。 此外,奥特曼宣布,OpenAI将在未来几个月内推出名为
GPT-5
的模型,该模型将整合OpenAI的大量技术,包括o3,并应用于聊天机器人ChatGPT以及API平台。因此,OpenAI不再计划将o3作为独立模型发布。 英特尔(intel)大涨7.2%,或与台积电合资晶圆厂 英特尔(intel)大涨7.2%,过去三天累计上涨16%。美国副总统表示,政府将实施政策确保最先进的AI系统和芯片在美国制造。 另外,Baird的一则报告称,美国政府可能会参与一项涉及英特尔和台积电的计划。台积电将派遣工程师到英特尔的3纳米/2纳米晶圆厂,运用该公司的专业知识以确保晶圆厂和英特尔的后续制造项目变得可行,英特尔可能将晶圆厂分拆出来,使其成为英特尔与台积电共同持有的公司,由台积电负责经营,该实体从美国芯片法案中获得资金。 巴里克黄金(GOLD.US)Q4利润超预期 官宣10亿美元新回购计划 全球第二大金矿商巴里克黄金(GOLD.US)大涨超6%,因其公布了利润超预期的第四季度业绩,主要得益于金价上涨和产量增加。全年业绩方面,该公司净利润大幅增长至21.4亿美元,同比增长69%。调整后净利润增长51%至22.1亿美元,可归属EBITDA增长30%至51.9亿美元,创十年来新高。此外,该公司宣布了一项新的10亿美元股票回购计划,取代了自2024年2月14日起实施的原有回购计划。 杰富瑞:中芯国际AH股评级上调至买进 杰富瑞有限责任公司将中芯国际A股评级上调至买进,目标价127元人民币;将中芯国际H股评级上调至买进,目标价62港元;将中芯国际H股评级上调至买进,目标价62港元。 今日要闻前瞻 英国第四季度GDP年率初值 IEA公布月度原油市场报告 欧元区12月工业产出月率 美国至2月8日当周初请失业金人数 原文链接
lg
...
投资慧眼
02-13 09:24
OpenAI,认错!
go
lg
...
-mini等应用层面的新品,万众期待的
GPT-5
迟迟不见身影。 尤其在首席科学家llya和联合创始人Dario Amodei出走后,沉迷商业化的OpenAI似乎也不再那么致力于“尺度定律”、“大即不同”等基础层面的突破。 这些其实符合正常的商业逻辑。 世界上最好的生意是垄断,垄断的前提是关起门来建护城河。 从Windows到iOS再到被超车的DeepMind,互联网时代和智能手机时代最成功的科技巨头,一次又一次阐明了这个道理。 比如,Linux在技术上独一无二,但它出现的时候,Windows早已建好了护城河,所以商业价值根本无法与后者匹敌。 又比如,安卓比iOS出现得晚,尽管前者目前已经占据了全世界大部分的市场份额,但收益方面依然远远不及iOS。 理所当然地,绝大部分人认为AI时代也应该是如此。 作为AI时代的先行者,GPT自然而然被视为曾经的Windows和iOS,即将接管下一个时代。 正如两个前辈的处境,它一定会有强有力的开源竞争者,但垄断地位一旦形成,它的赚钱能力依然能冠绝一个时代。 至少在过去两年,世界上几乎所有AI团队都不是OpenAI的对手。 技术上的差距只是一方面。 更重要的是,作为全球最大的独角兽。2023年,OpenAI的年收入就已经达到16亿美元,主要来源于金融机构支持;2024年,仅仅凭借GPT的订阅费用和API接口,年收入就预计将达到34-37亿美元。 OpenAI已经在商业模式上建立了闭环。 从赚钱的角度看,这比短时间的技术突破更重要,同时能保证后续的技术突破方向依旧在这个闭环中,不会“跑偏”。 其实在很大程度上,依然是在效仿Windows和iOS已经验证成功过的路径。 不可否认奥特曼在商业上的天才,但随着时间的推移,有一个问题也越来越明显:AI浪潮才刚刚兴起,即便是目前最前沿的AI技术,其实依然处于非常原始的阶段。 换句话说,OpenAI虽然是先行者,但并不具备碾压性的优势。 在一场马拉松赛跑前期,作为一个仅仅领先了几米的抢跑者,最应该做的应该是保持现有的优势继续向前跑,而不是放慢脚步阻挡身后的竞争者。 除非,你的优势足够大,有足够的时间去做这些事。 否则你停下来的这一会,就等于是给后来者超车的机会。 首先追赶的是Meta发布的开源大模型Llama2,短短几个月通过Hugging Face下载的基于Llama的模型超过3000万次,开源AI社区上发布了超过7000个Llama衍生模型。 相当于以安卓为榜样,不去耗时耗力寻求改变技术上的先发优势,而是邀请全世界开发者给自己打工。 你吃肉、我喝汤,开源虽然赚得没闭源多,但胜在量大。 想想硬件销售以及生态合作伙安卓给谷歌赚了多少钱?广告收入、应用商店收入、服务和应用销售……只要掌握着整个生态系统的底座,怎么都能躺赚。 如果没有意外,GPT和Llama,可能就是AI时代的iOS和安卓。 至少从市场的反映来看,大部分投资者也是这么认为的。 但是,意外就是存在。 03 难以复刻 DeepSeek横空出世,以超低的算力成本震惊世界。 现在大部分人的争论点,依然集中在DeepSeek的成功,是否来源于抄袭。 但其实OpenAI自己和华尔街的大佬们根本不关心这个。 OpenAI确实完成了最困难的0到1,也曾经向外界分享过成功,只不过1到2的时候不再开源。 0到1全世界都在抄,但后续的1到2虽然没有0到1那么困难,但也没有答案,必须自己解答。 1到2的答案可以有很多,但你的解法必须不比现有的差,不然没有任何竞争力。 而真正实现了更优解的,目前知名的也只有DeepSeek一个而已。 从这个角度看,GPT的角色更类似特斯拉,但OpenAI却沿用的是曾经Windoes的路径。 国产电动车能够壮大,同样需要感谢特斯拉开源,但并不影响抢占后者的市场份额。 恩情是恩情,生意是生意。 要么秉承初心一直开源,要么一开始就敝帚自珍,而不是半路改道。 半路改道不是行不通,但还是上面的问题,你的优势得足够大。 今时今日,有关AI领域的一切争论,最本质的问题只有一个:作为领头者的OpenAI,太久没有本质上的突破了。 先发者自己沉迷商业化停下来了,难道还不允许后来者追赶? OpenAI被逼迫到如今的境地,除了对其本身不太友好,对其他所有人都是好事。 不论在对市场,还是对技术而言。 DeepSeek的成功,以及继续选择的开源策略,对开源社区而言毫无疑问是一剂春药。 这不但说明AI领域目前的护城河并没有人们想象中那么深,也彻底否定了OpenAI近两年的商业模式。 只要有资金、市场、需求在后面推动,一切限制都没有意义。 AI生态将不再是某两个巨头的独食,全世界更多团队将更加热情地参与其中,大模型市场门槛进一步降低。 行业越发繁荣的同时,生态链也会越发复杂,彼此相互制衡。 制衡好啊,这样才安全。 这又回到了最初的问题。 防止AI技术失控的最佳防火墙是什么?保持充分竞争。 最初最纯粹的OpenAI,确实为了这个目标在奋斗,却在中途背弃了初衷。 在这种时候,若OpenAI还是坚持闭源、为金主爸爸的垄断事业奋斗,只会与市场预期越来越偏离。 除非,你能再度突破,证明自己依然是时代领头羊。 不然,只能被拽入价格战的汪洋大海,卷成本去吧。 在现有的基础上,像DeepSeek一样优化做出成本更低的产品,是有可能的。 但要更进一步,是前往未知的领域,基本不可能有降低成本这个说法。 问题是,现在已经深陷商业化、11人的创始团队只剩2人的OpenAI,还有没有曾经那统治性的创新能力? 如果你无法保证继续突破,保持技术上的领先地位,投资人有什么道理继续以高成本砸钱? 若少了资金来源,巧妇难为无米之炊,那更不可能突破了。 这是个既矛盾又现实的问题。(全文完)
lg
...
格隆汇
02-07 20:02
DeepSeek缩小AI差距,OpenAI调整战略:重新评估开源政策、加速大规模数据中心建设、推进
GPT-5
研发
go
lg
...
模型o3将在“几周到几个月内”推出。
GPT-5
: 目前尚未有明确时间表。 DALL-E 4: Weil确认新一代DALL-E正在研发中,并表示“值得等待”。 编辑观点 此次Reddit AMA显示,OpenAI正在进行战略调整,以应对行业竞争和市场变化。DeepSeek的崛起促使其重新考虑开源策略,同时不断扩大计算资源投入。AI的未来发展仍存诸多不确定性,特别是在自我改进和政府合作领域,仍需保持谨慎的态度。 名词解释 DeepSeek: 一家中国AI公司,被指技术接近OpenAI。 Recursive Self-Improvement(RSI): AI自行提升能力的过程。 Stargate: OpenAI正在建设的大型数据中心项目。 来源:今日美股网
lg
...
今日美股网
02-02 00:12
OpenAI被卷到了!上线新推理模型o3 Mini,首次向免费用户推出,Altman“认错”开源
go
lg
...
推出。语音模式更新即将到来,会直接叫它
GPT-5
而不是GPT-5o,目前还没有时间表。
lg
...
格隆汇
02-01 11:19
DeepSeek的故事对英伟达和芯片制造商来说是坏消息,但对某些股票来说可能更糟糕
go
lg
...
块(后者大致相当于OpenAI用来训练
GPT-5
的集群规模)。 但真正震动市场的是训练的成本有多低。根据DeepSeek自己的研究论文,其一个模型的训练成本不到600万美元。 并非所有人都对此信服。花旗分析师阿提夫·马利克表示:“尽管DeepSeek的成就可能具有突破性意义,但我们对其宣称的成就没有使用先进GPU进行微调,以及通过蒸馏技术构建基础大型语言模型的说法表示怀疑。” 注:蒸馏技术(Distillation Technique)在人工智能和机器学习领域,通常指的是模型蒸馏(Knowledge Distillation)。这是一个将大模型(教师模型)中的知识压缩到小模型(学生模型)中的技术,用于在保证性能的同时大幅降低计算成本和资源需求。 真正的事实是,DeepSeek向终端用户收取的费用显著更低——每百万输入标记仅14美分,而OpenAI的o1模型则高达15美元。 因此,人们开始“先抛售,再提问”。芯片股和相关公司股价遭到重创:英伟达无疑首当其冲,同时ARM、Super Micro、台积电、ASML、超威半导体和博通也受到了波及。 其中,博通刚刚跻身市值1万亿美元俱乐部,现在这一地位似乎突然面临威胁。 就在上周,特朗普还召开了一场新闻发布会,宣布与软银、甲骨文和OpenAI达成的一项高达5000亿美元的人工智能基础设施协议。所有这些基础设施是否还需要投入,现如今也成了一个疑问。 尽管科技股遭受了重创,但在一个由DeepSeek驱动的未来中,它们至少还有用武之地。那么,那些真正推动AI革命的公司呢?比如能源公司及其供应商? 摩根士丹利去年预测,人工智能的电力消耗可能会从2023年占美国电力消费的3%增加到本世纪末的10%。这一预测是否仍然成立? DeepSeek模型是开源的,如果他们的主张经得起考验,其他人工智能模型可能会效仿其技术,从而大幅提高能源效率。 在电力领域,与人工智能革命联系最紧密的一组股票是核能相关公司。 快速反应堆设计公司Oklo的股价今年已经上涨了97%(仅在1月),过去52周涨幅达到289%。由于与微软达成了一项合作协议,重启三哩岛核电站的Constellation Energy的股价在过去52周内上涨了186%。 小型模块化反应堆设计公司NuScale Power的股价在过去52周内惊人地飙升了917%。运营核电站的Vistra的股价在过去52周内上涨了369%。 这种核能的“暴涨”可能很快会转为“暴跌”。(市场观察) 来源:加美财经
lg
...
加美财经
01-28 00:00
AI应用元年还有哪些方向值得期待?
go
lg
...
因此,我们期待OpenAI的下一代模型
GPT-5
的发布。模型准确度是AI应用落地的关键指标,如果
GPT-5
能够通过进一步扩大模型参数量和训练数据规模,在各项任务上取得准确度的大幅提升,那么AI应用的创新将迎来全面爆发。
lg
...
证券之星
01-14 15:15
24小时环球政经要闻全览 | 12月23日
go
lg
...
5%的病例尚未确诊。 OpenAI 的
GPT-5
未达到预期 据华尔街日报报道,OpenAI 开发下一个主要模型
GPT-5
的努力正在落后于计划,其结果尚未证明其巨大的成本是合理的。OpenAI已完成至少两次大规模训练,旨在通过对大量数据进行训练来改进模型。初始训练运行速度比预期的要慢,这意味着更大规模的运行既耗时又昂贵。虽然
GPT-5
的性能比其前辈更好,但它还没有进步到足以证明维持模型运行的成本是合理的。
lg
...
格隆汇
2024-12-23
早报 (12.23)| 特朗普,重磅表态:赞成!爆OpenAI的
GPT-5
训练遇阻,奥特曼怒怼马斯克;退市新规高危名单周末疯传
go
lg
...
会预期的体现。 5. 爆OpenAI的
GPT-5
训练遇阻 据外媒报道,OpenAI的新一代人工智能项目
GPT-5
(代号Orion)正面临重重困难。该项目已开发超过18个月,成本花费巨大,却仍未取得预期成果。有知情人士透露称,OpenAI的最大“金主”微软原本预计能在2024年中期左右看到新模型。而OpenAI曾进行过至少两次大规模训练,每次都耗时数月并消耗海量数据,但每次都出现新问题,软件无法达到研究人员所期望的结果。分析认为,世界上可能没有足够的数据让它变得足够聪明。 6. 苹果被曝在华洽谈大模型合作方已增至6家 继百度之后,近日消息称苹果正与腾讯、字节跳动洽谈,商讨将其AI大模型整合到苹果在中国销售的iPhone中,目前谈判处于早期阶段。另据第一财经消息,苹果也在与智谱就在华版本的iPhone中使用其大模型进行谈判。加之此前6月被曝的阿里巴巴、百川智能等,目前与苹果就同类事宜谈判过的中国大模型公司已增至6家。 7. 本周末6家上市公司或相关方被立案调查 据不完全统计,包括新易盛、天顺股份、莫高股份、豆神教育、金花股份、新迅达在内的6家A股上市公司于周五或周日公告公司或相关方被证监会立案。其中,新易盛公告,涉嫌违反限制性规定转让股票等行为,公司实际控制人高光荣被立案调查。天顺股份公告,涉嫌信息披露违法违规及违反限制性规定转让证券,公司实际控制人王普宇收到中国证监会立案告知书。 包括中金公司、祥源文旅、新乳业、东方集团、中毅达、绿亨科技等6家A股上市公司周五盘后公告收到相关部门的行政处罚决定书或行政监管措施决定书。中金公司公告,因在为思尔芯科创板IPO提供保荐服务过程中未勤勉尽责,被中国证监会责令改正,给予警告,没收保荐业务收入200万元,并处以600万元罚款。 8. 退市新规高危名单周末疯传 还有7个交易日,2025年的退市新规要来了。退市新规明确,在此前2年连续造假达到一定比例强制退市的基础上,新增1年严重造假、3年及以上连续造假的情形,新增资金占用以及内部控制被出具无法表示意见或否定意见等退市标准。同时,进一步收紧了财务类退市指标,对于主板亏损公司的营业收入标准从1亿元提高到3亿元。适当提高市值退市标准,适当将A股主板上市公司的市值退市指标从低于3亿元提至低于5亿元。 9. 白云山再现高管接受调查 多个独立信息源渠道证实,稍早前发布辞职的白云山副总经理黄海文已被有关部门带走调查。两天前的12月20日,华南最大的国有医药企业广州医药集团有限公司旗下上市公司白云山披露收到黄海文的书面辞职报告,“因个人原因”,黄海文辞去公司副总经理职务,不再担任公司及公司附属企业的所有职务。 10. 海尔生物:筹划重大资产重组事项 股票停牌 海尔生物公告,公司与上海莱士正在筹划由海尔生物通过向上海莱士全体股东发行A股股票的方式换股吸收合并上海莱士并发行A股股票募集配套资金的交易。公司证券拟于12月23日开市起开始停牌,预计停牌时间不超过10个交易日。本次交易尚处于筹划阶段,有关事项尚存在不确定性。 11. 盛科通信:国家集成电路产业投资基金拟减持不超过3%公司股份 盛科通信公告称,公司股东国家集成电路产业投资基金股份有限公司计划减持公司股份不超过1230万股,减持比例不超过公司总股本的3%。产业基金因自身经营管理需要进行减持,减持价格按市场价格及交易方式确定。 1. 北京11月社会消费品零售总额同比-14.1% 北京11月社会消费品零售总额1275.9亿元,同比下降14.1%(前值0.7%);1-11月社会消费品零售总额12865.9亿元,同比下降2.8%。 上海11月实现社会消费品零售总额1442.95亿元,同比下降13.5%(前值10.9%);1-11月实现社会消费品零售总额16369.85亿元,同比下降3.1%。 2. 生育率暴跌是全球性的 2023年,总生育率(TFR)已降至每名妇女仅2.25个活产婴儿,偏离历史峰值。平均每名妇女生育的孩子数量从1963年的5.31个高峰骤降至今天的数字。2015年之后,生育率下降尤为明显,表明这种趋势可能很快会将各个国家的生育率推低至2.1以下,这是在不严重依赖移民的情况下维持人口稳定的必要门槛。 3. 以色列消息人士:加沙停火谈判尚未接近达成协议 以色列消息人士称,以色列代表团仍在卡塔尔多哈继续参与加沙停火谈判,尚未接近达成协议。这名消息人士表示,相关方在谈判中依然存在分歧,需要更多的时间才能实现突破,达成各方都能接受的协议。 1. 多地白羽鸡养殖场爆发鸭疫 目前,山东、河南、江苏等多地白羽鸡养殖场出现鸭疫感染,白羽鸡成活率降低,并引发减重,对白羽鸡的供应带来一定影响。由于防控更为严格,相关上市公司尚未受到鸭疫影响。春雪食品、仙坛股份相关负责人均表示,公司养殖场尚未发现鸭疫感染。随着元旦和春节临近,白羽鸡分割品走货量加速,预计相关产品价格将进一步提升。 2. 墨西哥总统:相信国会明年将禁止在该国种植转基因玉米 墨西哥总统表示,她预计国会将在明年初批准一项禁止在该国种植转基因玉米的禁令。前一天,一个贸易争端解决小组裁定墨西哥对美国转基因玉米出口的限制违反了美墨加协定。“在墨西哥国会的帮助下,我们将推翻这项决议,因为很快,在二月份,他们将立法,我确信你不能种植转基因玉米。” 3. 拒绝哗众取宠、低俗庸俗 微短剧片名审核再加强 日前,国家广播电视总局网络视听司发布管理提示(加强微短剧片名审核),其核心要义是对微短剧片名出现的不良倾向进行及时纠偏,并在导向、体例、艺术等方面提出新要求。由平台负责自审的“其他微短剧”,虽然内容违规问题已大幅减少,但片名哗众取宠、低俗庸俗的顽疾,严重拉低了微短剧行业整体形象,亟待治理。对此,管理提示提出:“小程序类微短剧为刻意追求投流效果,片名问题尤为严重,必须严加整治。” 4. 深圳、梅州、惠州、汕尾、东莞五城推动住房公积金异地贷款互认互通 深圳、梅州、惠州、汕尾、东莞五地住房公积金管理中心正式签署《推动住房公积金协同发展合作协议》并召开第一次联席会议。五个城市将在多项住房公积金服务事项“省内通办”“区域通办”“跨省通办”“亮码可办”的基础上,加快推进四项合作:
lg
...
格隆汇
2024-12-23
AI进化遇阻:ChatGPT的下一次重大飞跃,落后于计划且成本高得离谱
go
lg
...
儿变得足够智能。 这个项目的官方名称为
GPT-5
,代号为Orion,已经研发超过18个月,目标是大幅提升驱动ChatGPT的技术水平。 据知情人士透露,OpenAI的最大合作伙伴和投资者微软原本预计新模型会在2024年年中推出。 OpenAI已经进行了至少两次大规模的训练,每次都需要数月时间处理海量数据,目标是提升Orion的智能程度。 但知情人士表示,每次训练都会出现新问题,软件未能达到研究人员的预期。 他们说,在最佳情况下Orion比OpenAI当前的模型表现更好,但进步幅度不足以证明维持这个新模型的高昂成本是合理的。 据公开和私下的估算,一次为期六个月的训练成本。仅计算资源费用就可能高达5亿美元。 两年前,OpenAI及首席执行官萨姆·奥特曼凭借ChatGPT的推出在硅谷引发了震动。人工智能承诺将持续带来显著进步,并渗透到生活的方方面面。 分析师预测,科技巨头们未来几年可能在AI项目上投入1万亿美元。这些期望主要落在了OpenAI身上,这家公司是AI热潮的核心。 10月,投资者给OpenAI的估值达到1570亿美元,这很大程度上基于奥特曼的预测,即
GPT-5
将在各类领域和任务中实现“显著飞跃”。
GPT-5
被寄望于解锁新的科学发现,同时还能完成诸如预约会议或订机票等日常人类任务。 研究人员希望比目前的AI模型错误更少,或至少能承认自己的不确定性——这是当前模型面临的一大挑战,这些模型经常会以极高的自信生成错误内容。 这种现象被称为“幻觉”。 AI聊天机器人依赖于一种名为大型语言模型(LLM)的底层技术。消费者、企业和政府已经将用于从编写计算机代码,到改进营销文案再到规划聚会的方方面面。 OpenAI目前的模型是GPT-4,这是公司自2015年成立以来开发的第四个LLM。 一位OpenAI的前高管表示,GPT-4的表现类似于一个聪明的高中生,而最终的
GPT-5
在某些任务上则相当于拥有博士学位。 今年早些时候,奥特曼在斯坦福大学的一次演讲中告诉学生,OpenAI可以“以高度科学的确定性”表示,
GPT-5
会比当前模型更智能。 没有明确的标准来确定新模型何时足够智能,可以理直气壮的说是
GPT-5
。OpenAI可以通过数学和编程等领域的测试评估LLM,但是否将命名为
GPT-5
更多取决于公司高管的主观判断,或者用很多技术人员的话说,靠“感觉”。 到目前为止,这种“感觉”并不好。 今年11月,奥特曼表示公司不会在2024年推出任何被称为
GPT-5
的产品。 缓慢 缓慢的培训过程 自从GPT-4在2023年3月推出以来,OpenAI就开始着手研发
GPT-5
。 长期从事AI研究的专家表示,开发像LLM这样的系统既是一门科学,也是艺术。全球最受尊敬的AI科学,家以他们对如何获得更好结果的直觉而备受推崇。 在模型训练期间,研究人员会进行测试。训练通常持续数月,期间模型会被输入数万亿个被称为“tokens”的文字片段。 一轮大规模训练需要耗费数月时间,并使用成千上万块昂贵且备受追捧的英伟达芯片,在远程数据中心完成。 训练过程中,研究人员需要伏案工作数周甚至数月,将世界上大量的知识输入到AI系统中,这些操作依赖于全球分布的数据中心中最昂贵的硬件。 奥特曼曾表示,训练GPT-4的成本超过1亿美元,而未来的AI模型预计将突破10亿美元。 一轮失败的训练,就像火箭发射后不久在空中爆炸一样令人挫败。 为了尽量降低失败的风险,研究人员通常会先进行小规模实验,即在正式训练前先进行试运行。 从一开始,
GPT-5
的计划就面临问题。 2023年年中,OpenAI启动了一轮训练,这同时也是对Orion新设计的一次测试。然而,训练过程非常缓慢,这表明更大规模的训练可能会耗费极长时间,导致成本高得令人难以接受。而这次名为Arrakis的项目结果显示,创建
GPT-5
的过程可能不会如预期般顺利。 OpenAI的研究人员决定对Orion进行一些技术调整以增强其性能。他们还得出结论,需要更多种类丰富且高质量的数据。他们认为,仅靠公开的互联网数据已经不足够。通常来说,AI模型摄取的数据越多,其能力就越强。 对于大型语言模型(LLM)而言,这些数据主要来自书籍、学术出版物以及其他权威来源。这类资料有助于模型更清晰地表达,并能够处理广泛的任务。 在此前的模型中,OpenAI使用的是从互联网上抓取的数据,包括新闻文章、社交媒体帖子以及科学论文。 为了让Orion变得更智能,OpenAI需要规模更大。这意味着需要更多的数据,但现有的数据已经不足以支持需求。 “成本会变得非常高昂,同时很难找到更多同等高质量的数据,”创业公司DatologyAI的首席执行官阿里·莫科斯说。这家公司致力于开发改进数据选择的工具。莫科斯正在尝试使用更少但质量更高的数据来训练模型,并认为这一方法将使当今的AI系统更具能力,这与OpenAI等顶级AI公司采取的策略截然不同。 OpenAI的解决方案,是从零开始创造数据,雇佣人员为Orion编写新的软件代码或解决数学问题。部分工作人员是软件工程师和数学家,他们还会将工作原理解释给Orion学习。 许多研究人员认为,代码作为软件的语言,能够帮助LLM解决尚未接触过的问题。 让人类解释他们的思考过程,可以提升新创建数据的价值。这不仅为大型语言模型(LLM)提供了更多的语言素材,还为模型未来解决类似问题提供了参考路径。 “我们正在把人类智慧从人类大脑转移到机器大脑中,”人工智能基础设施公司Turing的首席执行官兼联合创始人乔纳森·西达斯说。Turing与OpenAI、Meta等公司合作。 Turing的高管表示,在AI训练中,一名软件工程师可能会被要求编写一个高效解决复杂逻辑问题的程序。一位数学家可能需要计算出用一百万个篮球搭建金字塔的最大高度。答案——尤其是解决问题的过程,会被整合到AI的训练材料中。 OpenAI还与理论物理学等领域的专家合作,了解他们如何处理自己领域中的一些最棘手的问题。这种方式也有助于提升Orion的智能水平。 数据创建的挑战 这一过程极为缓慢。GPT-4被估计使用了大约13万亿个token进行训练。如果有一千人每天写5000字,也需要数月才能生产出10亿个token。 为了加快进度,OpenAI开始开发所谓的“合成数据”,即由AI生成的数据,用于训练Orion。 然而,研究显示,AI为AI生成数据的反馈循环,常常会导致功能失调或生成无意义的答案。 OpenAI的科学家们认为,可以通过使用另一款AI模型(名为o1)生成的数据来避免这些问题,知情人士透露。 然而,OpenAI本就艰难的任务,还因内部问题和竞争对手不断挖走顶级研究人员的尝试而复杂化。竞争对手通常会开出数百万美元的高薪以吸引人才。 去年,奥特曼被OpenAI董事会突然解雇,一些研究人员当时甚至怀疑公司是否能继续存续。但奥特曼迅速被重新任命为首席执行官,并着手改革OpenAI的治理结构。 今年,OpenAI已有20多名关键高管、研究人员和长期员工离职,包括联合创始人兼首席科学家伊利亚·苏茨克维尔,以及首席技术官米拉·穆拉蒂。 本周四,备受尊敬的研究员亚历克·拉德福德也宣布离职,他曾是OpenAI多篇科学论文的主要作者,在公司工作了近八年。 重启与竞争压力 到2024年初,OpenAI的管理层开始感受到压力。GPT-4已经推出一年,而竞争对手正快速迎头赶上。行业内许多人认为Anthropic的新LLM在某些方面已经优于GPT-4。 同年,谷歌推出了最受欢迎的新AI应用NotebookLM,掀起热潮。 在Orion进展受阻的同时,OpenAI开始开发其他项目和应用,包括简化版的GPT-4和一款名为Sora的AI视频生成产品,这导致负责新产品的团队和Orion研究团队之间为有限的计算资源互相争夺。 AI实验室之间的竞争愈发激烈,以至于科技公司对研究成果的保密程度超出了以往的科学规范。 两年前,当资本涌入市场时,科技公司开始将研究成果视为需要严格保护的商业机密。一些研究人员对保密如此重视,以至于他们不会在飞机、咖啡馆或其他可能被偷窥的地方工作,以免他人瞥见他们的研究内容。 这种秘密主义让许多资深AI研究人员感到不满,包括Meta的首席AI科学家扬·勒昆。 他认为,OpenAI和Anthropic的工作不应再被视为研究,而是“高级产品开发”。 “如果是在商业时钟下完成的,就不能叫研究,”勒昆在最近一次AI会议间隙说道。OpenAI在这次会议上的存在感很低。“如果是秘密进行的,也不能叫研究。” 2024年初,OpenAI准备再次尝试训练Orion,这次带着更好的数据。研究人员在年初进行了几轮小规模训练,为大规模训练建立信心。 到5月,OpenAI的研究人员认为可以开始另一轮大规模训练,这次预计持续到11月。 然而,训练开始后,研究人员发现数据存在问题:数据的多样性并不像他们想象的那样丰富,这可能会限制Orion的学习能力。 这一问题在小规模训练中并未显现,直到大规模训练启动后才暴露出来。OpenAI已经投入了太多时间和金钱,无法重新开始。 研究人员只好在训练过程中尽力寻找更多样化的数据输入模型。 然而,这种策略是否有效尚不清楚。 Orion的困境让OpenAI内部一些人意识到,早期成功所依赖的“更多即是更好”策略可能已经走到了尽头。 OpenAI并非唯一担忧AI进步可能触顶的公司。在整个行业内,关于AI是否已经开始进入发展瓶颈的争论愈演愈烈。 苏茨克维尔最近联合创立了一家名为“安全超级智能”(Safe Superintelligence,简称SSI)的新AI公司。 他在一次AI会议上表示,“最大数据时代”已经结束。 他对一群研究人员、政策专家和科学家说:“数据之所以不再增长,是因为我们只有一个互联网。甚至可以说,数据是AI的化石燃料。” 而这种燃料正在逐渐枯竭。 推理能力:让LLM变得更聪明的新方法 Orion项目的困境,让OpenAI的研究人员转向了一种新方法来让LLM更聪明:推理能力。 研究人员表示,花更长时间“思考”可能让LLM解决一些它未接受过训练的难题。 在后台,OpenAI的o1模型会针对每个问题生成多个答案,并分析这些答案以找出最佳答案。可以执行更复杂的任务,比如撰写商业计划或设计填字游戏,并同时解释其推理过程——这种机制让模型从每个答案中学到一些东西。 然而,苹果的研究人员最近发表了一篇论文,提出推理模型(包括o1的某些版本),很可能只是模仿它们在训练中见过的数据,而不是实际解决新问题。 苹果研究人员指出,如果问题稍作修改,比如在一个关于猕猴桃的数学问题中加入无关细节(例如说明一些水果比其他的更小),模型的表现会出现“灾难性下滑”。 今年9月,OpenAI推出了o1推理模型的预览版,并在本月初发布了o1的完整版本。 但这些增强的推理能力代价高昂。与仅生成单一答案相比,OpenAI现在需要为每个查询生成多个答案,从而增加了运行成本。 在最近的一次TED演讲中,OpenAI的一位高级研究科学家重点介绍了推理能力的优势。 “事实证明,在一局扑克游戏中,让机器人思考20秒所带来的性能提升,相当于将模型扩展10万倍并训练10万倍更长时间所达到的效果,”OpenAI科学家诺亚姆·布朗说。 更高级、更高效的推理模型可能会成为Orion的基础。OpenAI的研究人员正在追求这种方法,并希望将其与以往的大量数据训练方法相结合,这些数据部分可能来自OpenAI的其他AI模型。随后,OpenAI可以使用人类生成的材料对结果进行精细化处理。 上周五,奥特曼宣布了一个新的推理模型计划,这款模型将比公司之前发布的任何模型都更智能。但他并未透露关于何时或者是否会推出一个足以被称为
GPT-5
的模型的信息。 来源:加美财经
lg
...
加美财经
2024-12-23
隔夜美股全复盘(10.26)| 三大股指冲高回落,台积电涨逾2%,亚利桑那工厂芯片良率据悉超越在台同类工厂
go
lg
...
3、OpenAI CEO回应年底推出
GPT-5
Orion:假新闻失控 10.26 不久前,美国科技媒体The Verge发表了一篇独家报道,称OpenAI计划在12月之前推出另一款新的前沿人工智能模型,代号为Orion——可能是也可能不是
GPT-5
。不过随后,OpenAI的联合创始人兼首席执行官萨姆·奥特曼在社交媒体平台“X”上直接回应了相关文章,表示“假新闻失控了”。不过,也有媒体表示,奥特曼此后并没有做过多的阐述,而且他的回应也没有直接否认这些说法--他没有写 “不 ”或 “这是假的”,更没有描述这篇详细文章中哪一部分是错误的。 4、美国商务旅行加速发展 或为航司带来利好 10.25 商务旅行在美国正在加速发展,这对加拿大航空公司来说可能是个好兆头。在加拿大皇家银行的一份报告中,詹姆斯•麦加拉格尔指出,达美航空等同行在商务旅行方面呈现积极趋势,其收入同比增长了7%。同样,美国联合航空公司 9月份的需求也有所增长,公司收入增长了13%,收入几乎达到了疫情前的水平。 波音工人罢工或导致10月美国非农就业岗位减少逾3万个 10.26 美国政府周五公布的数据显示,波音工厂工人罢工可能导致美国10月非农就业岗位减少约3.3万个。美国劳工部的月度罢工报告显示,在10月员工调查期内,波音在加利福尼亚州、俄勒冈州和华盛顿州的工厂有3.3万名员工处于停工状态。另外,国际机械师和航空航天工人协会中的5,000名会员也在堪萨斯州的德事隆罢工。该协会代表波音工厂的工人。报告还显示,加利福尼亚和夏威夷的希尔顿、凯悦和万豪酒店及汽车旅馆有3,400名工人罢工。10月非农就业报告将于11月1日公布,也就是美国大选的前几天。 5、美银:投资者在美国大选前大量买入黄金 10.25 美国银行策略师Michael Hartnett表示,投资者在美国大选前继续大量买入黄金,以对冲通胀可能重新走高的情况。金价周三创下历史新高,黄金基金创下自2020年7月以来的最大单周流入量。在11月5日大选之前,其他近期流行的交易,如抛售债券和购买人工智能股票,都保持了势头。本周,美国10年期国债收益率一度突破4.2%,为去年7月以来的最高水平,而英伟达的股价也创下历史新高。黄金交易是投资者更广泛策略的一部分,目的是在特朗普可能赢得大选的情况下配置投资组合。美元也出现反弹,原因是投资者押注共和党候选人获胜将引发通胀反弹、预算赤字上升以及与中国爆发潜在贸易战。 投资者在美国大选前情绪谨慎 大举买入货币市场基金 10.25 在截至10月23日的一周内,全球投资者将大量投资转向安全的货币市场基金,原因是他们对即将到来的美国和日本选举以及美国利率前景的变化持谨慎态度。LSEG Lipper数据显示,投资者在本周大幅净买入价值257.8亿美元全球货币市场基金,创下9月25日以来的最大单周净买入量。瑞银全球财富管理首席投资官Mark Haefele说:“我们已经发出信号,投资者应该预期大选前的市场波动,随着11月5日临近,市场情绪可能会持续脆弱。”在该统计期内,美国货币市场基金净买入299.8亿美元,前一周则净流出117.9亿美元。与此同时,全球股票基金的净买入额降至42亿美元,创四周新低。投资者大举买入价值16亿美元的黄金和贵金属基金,这是自2022年1月以来最大的单周净买入。 总统大选前美国政府债券违约保险成本上升 10.25 在11月5日总统大选之前,美国政府债券的违约保险成本上升。标普全球市场情报数据显示,美国1年期信用违约掉期升至49个基点,为2023年11月以来的最高纪录。巴克莱分析师在一份报告中说,投资者正在评估选举结果对美国债务上限可能产生的影响。他们表示:“这可能反映出围绕选举结果的不确定性,以及它们可能如何影响1月2日恢复债务上限。”
lg
...
格隆汇
2024-10-26
上一页
1
2
3
4
5
6
•••
16
下一页
24小时热点
终于承认了!美国经济3年来首次萎缩 特朗普向中国、商界领袖关键发话……
lg
...
为金价重大回调做准备!机构:黄金发出2008年金融危机以来最大的崩溃信号
lg
...
突破美国贸易封锁!中美突发重大信号:中国找到规避特朗普关税的管道?
lg
...
中美关税谈判突传重大进展!比特币站上9.5万、黄金3233避险降温 市场紧盯非农报告
lg
...
中美传出重大“关税”消息、习近平语出惊人!比特币和黄金突发脱钩了……
lg
...
最新话题
更多
#Web3项目情报站#
lg
...
6讨论
#SFFE2030--FX168“可持续发展金融企业”评选#
lg
...
32讨论
#链上风云#
lg
...
89讨论
#VIP会员尊享#
lg
...
1926讨论
#CES 2025国际消费电子展#
lg
...
21讨论