全球数字财富领导者
财富汇
|
美股投研
|
客户端
|
旧版
|
北美站
|
FX168 全球视野 中文财经
首页
资讯
速递
行情
日历
数据
社区
视频
直播
点评旗舰店
商品
SFFE2030
外汇开户
登录 / 注册
搜 索
综合
行情
速递
日历
话题
168人气号
文章
周末加餐:AI Agent新项目趋势观察
go
lg
...
全新的生产力工具: - 技术支撑:基于
大型
语言
模型
(LLM)和去中心化框架构建,AI Agent能够完成复杂任务,例如数据分析、自动交易与内容生成。 - 生产关系重塑:通过代币经济学和去中心化治理机制,Web3生态将用户深度绑定至社区,创造更公平、开放的生态系统。 2. 公平分配机制 部分Web3项目通常受到VC高度控制,容易导致用户信任感下降。相比之下,AI Agent项目采用公平启动模式: - 代币100%由社区所有,团队仅保留少量用于激励。 - 无内部锁仓解锁压力,用户和投资者平等参与。 3. 创新驱动的新叙事 AI Agent通过高效迭代构建了独特生态场景。例如,Virtual Protocol聚焦游戏与虚拟世界的多代理互动框架,ai16z (ELIZA) 提供跨平台AI代理开发框架。 链上AI代币的未来趋势 1. 专业化与细分化 AI代理将在金融分析、医疗助手、法律咨询等高精度领域快速发展,同时垂直领域的开发框架将更为丰富。 https://dune.com/cryptokoryo/ai 2. 去中心化基础设施的完善 Hyperbolic和Aethir等去中心化计算与存储平台将为开发者提供更多可能性,进一步提升AI代理性能。 小结 AI Agent赛道正在引领加密行业向真实需求场景与AI技术深度融合的方向转型。尽管短期内可能存在一定的泡沫化迹象,且面临技术与安全风险,其繁荣在一定程度上依赖于比特币等主流资产的高位稳定,但凭借去中心化经济模型、强大的技术支持以及创新的应用场景,这一领域正在为加密行业开创全新的发展趋势。
lg
...
金色财经
01-03 22:59
2024年 区块链+AI Agent的升级打怪
go
lg
...
用户使用针对Solidity代码优化的
大型
语言
模型
(LLMs)创建基于区块链的AI Agent。通过对话界面,用户可以构建和探索自定义的链上代理,能够以最少的监督部署用于交易、交易处理和智能合约交互等任务的自主AI。 第二个产品是Spectral Nova,作为机器智能网络,旨在为智能合约提供高质量的去中心化推理反馈。通过生态激励举措,鼓励顶尖数据科学家和机器学习工程师构建模型,这些模型输出推理反馈,帮助智能合约在无人工干预下做出决策,且所有推断都可通过零知识证明、可验证计算技术确保其正确性和安全性,从而助力Web3应用提升服务质量。 第三个产品是Inferchain,这是连接Spectral Syntax 和 Spectral Nova的桥梁,作为Spectral专为Web3发展定制的 L2,它以无信任、可验证的方式与AI集成,保证数据和命令的顺畅传递,确保整个网络的透明性和去中心化,促进各个链上代理之间更加安全高效地交互。 存在的问题和未来 纵观以上几个比较典型的AI Agent项目我们能发现,该赛道目前存在的最大的问题,或许就是无法摆脱的Meme属性,短期看从资产发行叙事的角度,AI Agent最直观感觉仍旧是MEME。 本轮AI Agent赛道的爆火,开端就在于Meme代币Goat的爆火,而随后爆火的Virtuals,虽说是一个AI Agent发射平台,但本质上就是一个类Pump.fun的Meme发射平台。 Messari在最新报告中指出,目前区块链行业的AI Agent项目发展尚未证明其产品适应性足以支撑市场投机,目前AI Agent既缺乏需求,也没有明确的用户基础,目前AI Agent的推出依赖于市场投机,但当市场意识到它们在可预见的未来仍将只是玩物时,这一投机周期就会崩溃。综上,其预测AI Agent赛道会在2025年一季度市值触顶后就难以回升。 区块链和AI Agent的结合最终一定要落地到具体的运用的,不能只是金融的炒作。而要实现这一初心,就得回归到区块链和AI相结合的本质:AI Agent的发展,需要区块链做些什么?AI Agent又能给区块链带来什么? 对于AI Agent来说,区块链是实现其“自主支付和交易”的一个方向。在当下的阶段,区块链有着开户门槛更低的特点,能够减少传统金融如开户、中介类似的摩擦成本。而且链上交易可以实现实时交易、提高了交易的效率。而对于区块链来说,AI Agent和区块链的结合,也让许多区块链项目本身,有了更多的人工智能性的一面。 目前,我们所看到的能够落地的区块链领域的AI Agent项目,基本上还是以AI Agent为区块链服务为主,真正能够实际落地的项目很少。 不过,在近期多家机构发布的2025年加密行业趋势展望中,a16z、VanEck、Bitwise、Hashed、Blockworks、Messari、Framework纷纷指出AI Agent相关产品将在2025年迎来爆发式增长。 对行业的发展报以乐观,我们期待在2025年,泡沫退却后,可以迎来更多能够落地的相关项目的爆发。
lg
...
金色财经
01-03 00:25
OpenAI:转型盈利架构,筹资面临挑战
go
lg
...
10月完成66亿美元融资。然而,为开发
大型
语言
模型
,OpenAI需要持续投资于高性能处理器(主要由英伟达提供)和云基础设施(主要来自微软支持)。根据公开信息,OpenAI今年预计营收37亿美元,但亏损约50亿美元。为支持持续运营,OpenAI将转型为特拉华州公益股份公司(PBC),允许公益部门专注于医疗、教育等慈善活动,同时按公平估值对PBC拥有重大利益。 转型需求 OpenAI于2015年作为非营利机构成立,由CEO萨姆·奥特曼与埃隆·马斯克等人共同创立,最初专注于通用人工智能(AGI)的研究。 2019年,OpenAI采取利润上限模式运作,希望在保留公益目标的同时吸引投资。然而,现有结构限制了董事会在资金使用上的灵活性。 OpenAI在声明中提到,新结构将使公司能够像竞争对手一样以常规方式筹资。这一变化是为了满足持续开发生成式AI产品的资金需求,同时保持与高增长市场的竞争力。 内部挑战 OpenAI的重组计划受到埃隆·马斯克的强烈反对。 马斯克已对OpenAI提起诉讼,试图阻止其从非营利转为营利。他在社交平台上批评这一举措是“彻头彻尾的骗局”,并声称OpenAI“已经变得邪恶”。 除法律纠纷外,OpenAI还面临高管流失问题。近几个月内,包括首席技术官Mira Murati、研究主管Bob McGrew、副总裁Barret Zoph以及联合创始人John Schulman在内的多名高管相继离职,部分人员加入竞争对手Anthropic。前安全负责人Jan Leike表示,他因优先事项分歧离职,并指出OpenAI在安全文化上已有所忽视。 尽管面临种种压力,OpenAI表示,其董事会已独立讨论重组问题近一年,计划通过新架构实现公司愿景与使命。
lg
...
Sissi
2024-12-28
中美重磅!华尔街日报:中国人工智能公司已找到变通途径 正快速追赶美国同行
go
lg
...
司DeepSeek在11月发布了其最新
大型
语言
模型
的预览版。该公司表示,该程序的能力优于OpenAI的推理模型01,后者于9月以预览版形式推出。 最近几周,其他中国公司也发表了类似的声明。由中国互联网巨头阿里巴巴(Alibaba)和腾讯(Tencent)支持的初创公司Moonshot AI表示,它开发了一个专门研究数学的模型,其能力接近OpenAI 的 o1,而阿里巴巴表示,他们自己的一个实验研究模型在数学上优于OpenAI的o1预览版本。 这些公司还没有发表描述他们模型的论文,而且难以评估这些说法,因为对人工智能模型的能力没有一个公认的测试。不过,一些美国专家表示,他们对对这些模型“印象深刻”。 OpenAI前研究员、现任人工智能企业家Andrew Carr表示,中国正在“更快地追赶”。他说,DeepSeek的研究人员试图复制OpenAI的推理模型,“在几个月内就弄清楚了,坦率地说,我的许多同事对此感到惊讶。” 一个用来做比较的测试是美国国际数学邀请赛(AIME),它是为了挑战最聪明的高中数学学生而设计的。 DeepSeek表示,其模型在AIME上击败了OpenAI。但《华尔街日报》利用今年AIME的15个问题进行的一项实验发现,OpenAI的o1预览模型比 DeepSeek、Moonshot和阿里巴巴的实验模型更快找到了答案。在一个假设的双人游戏中涉及策略的字谜中,OpenAI程序在10秒内给出了答案,而DeepSeek花了两分钟多时间。 在第一次尝试中获得正确答案仍然是一项壮举,因为文字问题经常难倒人工智能程序。 自2022年以来,中国人工智能开发人员一直面临美国对世界上最先进的人工智能芯片的限制,包括芯片领导者英伟达(Nvidia)的芯片。在12月,拜登政府再次收紧出口管制规定。 但《华尔街日报》称,开发人员已经找到了变通途径。在由阿里巴巴和腾讯支持的初创公司Moonshot,创始人杨植麟表示,该公司专注于强化学习,模仿人类的试错过程。这种方法可能在提高性能方面较少地使用计算能力。 自去年年底以来,人工智能开发人员越来越多使用一种名为“混合专家模型”(Mixture of Experts, MoE)的技术,这种技术能降低对芯片的需求。 腾讯表示,11月发布的MoE模型的性能堪比Facebook母公司Meta Platforms今年7月推出的Llama 3.1模型。审阅了两家公司发表的论文的研究人员表示,腾讯的模型可能是用Meta使用的大约十分之一的计算能力训练的。 DeepSeek最初是High-Flyer的人工智能研究部门。High-Flyer是一家拥有80亿美元资产的量化对冲基金管理公司,以利用人工智能进行交易而闻名。2021年,DeepSeek将大约1万块英伟达的A100芯片连接起来,形成了一个用于人工智能训练的集群,该集群被称为Fire-Flyer 2。 在今年8月发表的一篇论文中,DeepSeek表示,Fire-Flyer 2的性能接近英伟达包含类似芯片的系统,但中国的系统成本更低,能耗更低。DeepSeek在5月份发表的关于其MoE模型的论文在业界引起了广泛关注,该模型采用了一种更有效地处理数据的技术。 人工智能初创公司Anthropic的联合创始人Jack Clark在他的博客中写道:“中国绕过出口管制的一种方法是,利用它可以访问的硬件建立非常好的软件和硬件培训。” Clark称:“‘中国制造’将成为人工智能模型的一部分,就像电动车、无人机和其他技术一样。” 《华尔街日报》指出,许多中国人工智能开发人员已经找到获取受限制的英伟达芯片的方法,包括通过与中间商和海外数据中心的交易。尽管如此,据中国高管称,缺乏尖端芯片对中国初创企业来说是痛苦的,而且差距还会扩大。英伟达的客户正准备大规模部署其最新的人工智能数据中心芯片Blackwell。 马斯克(Elon Musk)的xAI公司已经用10万块英伟达芯片建造了一个数据中心,最近还筹集了50亿美元来做更多的事情。亚马逊网络服务公司(Amazon Web Services)计划用数十万块本土芯片打造一台大型人工智能超级计算机。 专注于开源模型的DeepSeek强调数学和编码。Moonshot凭借其类似ChatGPT的聊天机器人Kimi在中国消费者中广受欢迎,并以其处理长文本的能力而闻名。
lg
...
tqttier
2024-12-27
软银创始人孙正义的世纪之梦:下一个英伟达
go
lg
...
范式转变的人之一。两人经常讨论用于驱动
大型
语言
模型
和其他人工智能应用的半导体短缺问题。 每颗英伟达芯片的成本高达数万美元。面对高昂的价格和长时间的等待周期,孙正义和奥特曼探讨了建立一个人工智能芯片竞争对手可能需要的巨额资金。 据华尔街日报报道,孙正义曾提出需要3万亿美元,而奥特曼则反驳称可能需要7万亿美元。 在技术方面,孙正义将目光转向了Arm。 Arm由一小组工程师于1990年创立,现已发展成为全球使用最多的微处理器技术拥有者。在这一领域,后发优势帮助Arm跳过多年研发周期,提出了简洁高效的设计理念。 孙正义希望,Arm的工程师们可以在人工智能芯片上重复35年前的成功,这一次由他提供对人工智能定制芯片的愿景指导。 孙正义与雷内·哈斯定期沟通,有时谈话会持续数小时。讨论的重点常常回到“伊邪那岐”计划上,这是一个旨在补充Arm的知识产权资产,并在软银的人工智能生态系统内打造人工智能芯片巨头的努力。 据知情人士透露,这些谈话还包括了类似于贝莱德公司与微软合作创建一个300亿美元基金,用于建设人工智能数据仓库和能源基础设施的项目。 哈斯希望将Arm转型为一家更大、更有影响力的芯片公司,这与孙正义的雄心不谋而合。 不过,两位首席执行官并非总是一拍即合。 哈斯曾在英伟达负责计算产品,并领导过Arm的IP产品部门,他深知芯片设计的复杂性及行业制造环节的诸多挑战。在多次遭到哈斯的反对后,孙正义一度感到沮丧,并要求直接与其他Arm高管对话,但被哈斯拒绝。 知情人士透露,两人仍然每天交流,而哈斯,尽管有自己的保留意见,已经成为孙正义的主要合作伙伴,负责实施这项宏伟计划的实际操作。 软银正在押注人工智能芯片设计——这是一个历来难以预测且竞争激烈的领域,将在未来十年或二十年发生巨大变化。其中一个悬而未决的问题是,单一GPU同时执行训练和推理是否更高效,就像英伟达的芯片所做的那样。如果训练和推理分开进行能够更节能且速度更快,这可能为新玩家打开突破口。 据知情人士透露,孙正义相信,Arm具备在边缘网络上支持从智能手机到机器人控制系统等连接设备推理的能力。 “因为人工智能是一个刚刚起步的行业,我们仍处于早期阶段,”《芯片战争》的作者克里斯·米勒表示。他说,目前大多数人工智能加速器用于训练,但未来,更多的计算能力可能会用于将训练成果投入实际应用中,比如做出预测或从数据中推导信息。“英伟达显然是人工智能加速器市场的第一个领导者,但这个市场未来十年肯定会增长,并可能发生很大变化。” 不过,其他公司也在争夺这一预期中的需求增长。 AMD认为,在执行某些工作负载方面,自己的芯片比英伟达的更胜一筹。AMD计划在明年升级加速器,称将显著提高推理速度。与此同时,亚马逊,这家通过定制硬件发明了云计算运营的公司,也在利用其规模优势,争取在打造英伟达竞争对手的过程中占据一席之地。 亚马逊的工程师们正致力于在年底前将最新的Trainium人工智能加速器推向数据中心。凭借庞大的基础设施,亚马逊可能迅速展现一些势头。 半导体行业的资深人士,对软银的努力大多抱着一种好奇与怀疑的态度。孙正义在软件销售、杂志出版、移动网络推广以及支持年轻企业家等领域表现出色,但他从未在芯片制造这个以纳米技术和无尘室为基础的资本密集型领域,接受过真正的考验。 即使是英伟达,在崛起之前也几次濒临破产,直到最终获得足够的影响力,来说服台积电为其最新芯片开发制造工艺。 最终,软银成功的关键很大程度上依赖于Arm的知识产权。 孙正义的其他“武器”还包括软银的客户群——尽管规模远小于亚马逊,以及一个愿意花高价追赶人工智能的日本市场。这家科技集团还在美国运营可再生能源项目,为谷歌等超大规模企业的数据中心提供电力支持。 此外,孙正义还拥有一支更加精简的愿景基金团队,专注于寻找他所需的公司和技术,例如此前与Graphcore的交易。 Graphcore首席执行官奈杰尔·图恩在7月软银收购该公司的时候曾表示:“我们的愿景是切合实际的,同时也与孙正义推动的一些宏大愿景相吻合。我们是实现这一宏大愿景的一部分。” 软银芯片计划的许多细节仍在讨论中,包括将涉及多少公司和投资者。尽管台积电是首选的制造合作伙伴,软银可能还会寻求其他合作伙伴以确保产能和技术支持。 与此同时,孙正义还在为与OpenAI的战略合作铺路。愿景基金部门在9月季度转亏为盈,并向OpenAI投资了5亿美元,同时启动了15亿美元的收购计划,通过本月从OpenAI员工手中购买更多股票。 据知情人士透露,软银明年将为第二只愿景基金追加资金,预计规模将从9月底的608亿美元进一步增加。 孙正义在信息中常提醒他的亲信们,要以“世纪”为单位来思考问题。尽管芯片项目规模庞大,但这只是他正在追求的众多想法之一,最终可能占据软银新方向的50%,也可能仅占0.5%,一位熟悉孙正义想法的人士说。 近期,软银的公告涵盖了多个领域,包括一台使用英伟达即将推出的Blackwell芯片的超级计算机、更快的汽车人工智能处理器,以及围绕机器人公司的多项愿景基金投资。 孙正义认为,机器人将在实现人工智能对人类的实际益处方面起到关键作用。有一次,他甚至带着一个机器人设计模型前往前苹果首席设计师乔纳森·艾维的家中,提出了可能的合作建议。 在6月的软银股东大会上,一位与会者提到彭博社关于“伊邪那岐”芯片的报道,并询问项目进展如何。 孙正义笑着回答:“让我们不要谈具体细节。” 他说:“我们不想过早亮出底牌。这是一个专业人士的世界,我们的成功取决于最终取得的成果。在实现成果之前,我们无法评论方法论。但我可以告诉你们,我对交付成果充满信心。” 来源:加美财经
lg
...
加美财经
2024-12-24
AI进化遇阻:ChatGPT的下一次重大飞跃,落后于计划且成本高得离谱
go
lg
...
幻觉”。 AI聊天机器人依赖于一种名为
大型
语言
模型
(LLM)的底层技术。消费者、企业和政府已经将用于从编写计算机代码,到改进营销文案再到规划聚会的方方面面。 OpenAI目前的模型是GPT-4,这是公司自2015年成立以来开发的第四个LLM。 一位OpenAI的前高管表示,GPT-4的表现类似于一个聪明的高中生,而最终的GPT-5在某些任务上则相当于拥有博士学位。 今年早些时候,奥特曼在斯坦福大学的一次演讲中告诉学生,OpenAI可以“以高度科学的确定性”表示,GPT-5会比当前模型更智能。 没有明确的标准来确定新模型何时足够智能,可以理直气壮的说是GPT-5。OpenAI可以通过数学和编程等领域的测试评估LLM,但是否将命名为GPT-5更多取决于公司高管的主观判断,或者用很多技术人员的话说,靠“感觉”。 到目前为止,这种“感觉”并不好。 今年11月,奥特曼表示公司不会在2024年推出任何被称为GPT-5的产品。 缓慢 缓慢的培训过程 自从GPT-4在2023年3月推出以来,OpenAI就开始着手研发GPT-5。 长期从事AI研究的专家表示,开发像LLM这样的系统既是一门科学,也是艺术。全球最受尊敬的AI科学,家以他们对如何获得更好结果的直觉而备受推崇。 在模型训练期间,研究人员会进行测试。训练通常持续数月,期间模型会被输入数万亿个被称为“tokens”的文字片段。 一轮大规模训练需要耗费数月时间,并使用成千上万块昂贵且备受追捧的英伟达芯片,在远程数据中心完成。 训练过程中,研究人员需要伏案工作数周甚至数月,将世界上大量的知识输入到AI系统中,这些操作依赖于全球分布的数据中心中最昂贵的硬件。 奥特曼曾表示,训练GPT-4的成本超过1亿美元,而未来的AI模型预计将突破10亿美元。 一轮失败的训练,就像火箭发射后不久在空中爆炸一样令人挫败。 为了尽量降低失败的风险,研究人员通常会先进行小规模实验,即在正式训练前先进行试运行。 从一开始,GPT-5的计划就面临问题。 2023年年中,OpenAI启动了一轮训练,这同时也是对Orion新设计的一次测试。然而,训练过程非常缓慢,这表明更大规模的训练可能会耗费极长时间,导致成本高得令人难以接受。而这次名为Arrakis的项目结果显示,创建GPT-5的过程可能不会如预期般顺利。 OpenAI的研究人员决定对Orion进行一些技术调整以增强其性能。他们还得出结论,需要更多种类丰富且高质量的数据。他们认为,仅靠公开的互联网数据已经不足够。通常来说,AI模型摄取的数据越多,其能力就越强。 对于
大型
语言
模型
(LLM)而言,这些数据主要来自书籍、学术出版物以及其他权威来源。这类资料有助于模型更清晰地表达,并能够处理广泛的任务。 在此前的模型中,OpenAI使用的是从互联网上抓取的数据,包括新闻文章、社交媒体帖子以及科学论文。 为了让Orion变得更智能,OpenAI需要规模更大。这意味着需要更多的数据,但现有的数据已经不足以支持需求。 “成本会变得非常高昂,同时很难找到更多同等高质量的数据,”创业公司DatologyAI的首席执行官阿里·莫科斯说。这家公司致力于开发改进数据选择的工具。莫科斯正在尝试使用更少但质量更高的数据来训练模型,并认为这一方法将使当今的AI系统更具能力,这与OpenAI等顶级AI公司采取的策略截然不同。 OpenAI的解决方案,是从零开始创造数据,雇佣人员为Orion编写新的软件代码或解决数学问题。部分工作人员是软件工程师和数学家,他们还会将工作原理解释给Orion学习。 许多研究人员认为,代码作为软件的语言,能够帮助LLM解决尚未接触过的问题。 让人类解释他们的思考过程,可以提升新创建数据的价值。这不仅为
大型
语言
模型
(LLM)提供了更多的语言素材,还为模型未来解决类似问题提供了参考路径。 “我们正在把人类智慧从人类大脑转移到机器大脑中,”人工智能基础设施公司Turing的首席执行官兼联合创始人乔纳森·西达斯说。Turing与OpenAI、Meta等公司合作。 Turing的高管表示,在AI训练中,一名软件工程师可能会被要求编写一个高效解决复杂逻辑问题的程序。一位数学家可能需要计算出用一百万个篮球搭建金字塔的最大高度。答案——尤其是解决问题的过程,会被整合到AI的训练材料中。 OpenAI还与理论物理学等领域的专家合作,了解他们如何处理自己领域中的一些最棘手的问题。这种方式也有助于提升Orion的智能水平。 数据创建的挑战 这一过程极为缓慢。GPT-4被估计使用了大约13万亿个token进行训练。如果有一千人每天写5000字,也需要数月才能生产出10亿个token。 为了加快进度,OpenAI开始开发所谓的“合成数据”,即由AI生成的数据,用于训练Orion。 然而,研究显示,AI为AI生成数据的反馈循环,常常会导致功能失调或生成无意义的答案。 OpenAI的科学家们认为,可以通过使用另一款AI模型(名为o1)生成的数据来避免这些问题,知情人士透露。 然而,OpenAI本就艰难的任务,还因内部问题和竞争对手不断挖走顶级研究人员的尝试而复杂化。竞争对手通常会开出数百万美元的高薪以吸引人才。 去年,奥特曼被OpenAI董事会突然解雇,一些研究人员当时甚至怀疑公司是否能继续存续。但奥特曼迅速被重新任命为首席执行官,并着手改革OpenAI的治理结构。 今年,OpenAI已有20多名关键高管、研究人员和长期员工离职,包括联合创始人兼首席科学家伊利亚·苏茨克维尔,以及首席技术官米拉·穆拉蒂。 本周四,备受尊敬的研究员亚历克·拉德福德也宣布离职,他曾是OpenAI多篇科学论文的主要作者,在公司工作了近八年。 重启与竞争压力 到2024年初,OpenAI的管理层开始感受到压力。GPT-4已经推出一年,而竞争对手正快速迎头赶上。行业内许多人认为Anthropic的新LLM在某些方面已经优于GPT-4。 同年,谷歌推出了最受欢迎的新AI应用NotebookLM,掀起热潮。 在Orion进展受阻的同时,OpenAI开始开发其他项目和应用,包括简化版的GPT-4和一款名为Sora的AI视频生成产品,这导致负责新产品的团队和Orion研究团队之间为有限的计算资源互相争夺。 AI实验室之间的竞争愈发激烈,以至于科技公司对研究成果的保密程度超出了以往的科学规范。 两年前,当资本涌入市场时,科技公司开始将研究成果视为需要严格保护的商业机密。一些研究人员对保密如此重视,以至于他们不会在飞机、咖啡馆或其他可能被偷窥的地方工作,以免他人瞥见他们的研究内容。 这种秘密主义让许多资深AI研究人员感到不满,包括Meta的首席AI科学家扬·勒昆。 他认为,OpenAI和Anthropic的工作不应再被视为研究,而是“高级产品开发”。 “如果是在商业时钟下完成的,就不能叫研究,”勒昆在最近一次AI会议间隙说道。OpenAI在这次会议上的存在感很低。“如果是秘密进行的,也不能叫研究。” 2024年初,OpenAI准备再次尝试训练Orion,这次带着更好的数据。研究人员在年初进行了几轮小规模训练,为大规模训练建立信心。 到5月,OpenAI的研究人员认为可以开始另一轮大规模训练,这次预计持续到11月。 然而,训练开始后,研究人员发现数据存在问题:数据的多样性并不像他们想象的那样丰富,这可能会限制Orion的学习能力。 这一问题在小规模训练中并未显现,直到大规模训练启动后才暴露出来。OpenAI已经投入了太多时间和金钱,无法重新开始。 研究人员只好在训练过程中尽力寻找更多样化的数据输入模型。 然而,这种策略是否有效尚不清楚。 Orion的困境让OpenAI内部一些人意识到,早期成功所依赖的“更多即是更好”策略可能已经走到了尽头。 OpenAI并非唯一担忧AI进步可能触顶的公司。在整个行业内,关于AI是否已经开始进入发展瓶颈的争论愈演愈烈。 苏茨克维尔最近联合创立了一家名为“安全超级智能”(Safe Superintelligence,简称SSI)的新AI公司。 他在一次AI会议上表示,“最大数据时代”已经结束。 他对一群研究人员、政策专家和科学家说:“数据之所以不再增长,是因为我们只有一个互联网。甚至可以说,数据是AI的化石燃料。” 而这种燃料正在逐渐枯竭。 推理能力:让LLM变得更聪明的新方法 Orion项目的困境,让OpenAI的研究人员转向了一种新方法来让LLM更聪明:推理能力。 研究人员表示,花更长时间“思考”可能让LLM解决一些它未接受过训练的难题。 在后台,OpenAI的o1模型会针对每个问题生成多个答案,并分析这些答案以找出最佳答案。可以执行更复杂的任务,比如撰写商业计划或设计填字游戏,并同时解释其推理过程——这种机制让模型从每个答案中学到一些东西。 然而,苹果的研究人员最近发表了一篇论文,提出推理模型(包括o1的某些版本),很可能只是模仿它们在训练中见过的数据,而不是实际解决新问题。 苹果研究人员指出,如果问题稍作修改,比如在一个关于猕猴桃的数学问题中加入无关细节(例如说明一些水果比其他的更小),模型的表现会出现“灾难性下滑”。 今年9月,OpenAI推出了o1推理模型的预览版,并在本月初发布了o1的完整版本。 但这些增强的推理能力代价高昂。与仅生成单一答案相比,OpenAI现在需要为每个查询生成多个答案,从而增加了运行成本。 在最近的一次TED演讲中,OpenAI的一位高级研究科学家重点介绍了推理能力的优势。 “事实证明,在一局扑克游戏中,让机器人思考20秒所带来的性能提升,相当于将模型扩展10万倍并训练10万倍更长时间所达到的效果,”OpenAI科学家诺亚姆·布朗说。 更高级、更高效的推理模型可能会成为Orion的基础。OpenAI的研究人员正在追求这种方法,并希望将其与以往的大量数据训练方法相结合,这些数据部分可能来自OpenAI的其他AI模型。随后,OpenAI可以使用人类生成的材料对结果进行精细化处理。 上周五,奥特曼宣布了一个新的推理模型计划,这款模型将比公司之前发布的任何模型都更智能。但他并未透露关于何时或者是否会推出一个足以被称为GPT-5的模型的信息。 来源:加美财经
lg
...
加美财经
2024-12-23
隔夜美股全复盘(12.18) | BTC、特斯拉和苹果续创新高,苹果逐步迈向4万亿美元,道指创46年最长连跌纪录
go
lg
...
o性能显着提升,可作为建构检索增强型的
大型
语言
模型
聊天机器人、视觉AI助理与AI自主机器人,且也能在现行完成软硬体开发的平台环境直接换上Jetson Orin Nano Super单板,使性能更为提升。Jetson Orin Nano Super开发套件的价格为249美元。Jetson Orin Nano Super相较Jetson Orin Nano提升1.7倍的生成式AI推论性能,同时INT8也提高70%自40TOPS提高至67TOPS,此外也换上更高速的记忆体,记忆体频宽提升50%,从69GB/s提高至102GB/s,工作功率为25W。 4、Cloudflare:2024年全球互联网流量同比增长 17.2% 美国仍是主要 Bot 流量来源地 12.17 内容分发网络服务商 Cloudflare 发布了年度互联网流量趋势报告,揭示了 2024 年全球互联网流量的关键变化和持续趋势。报告显示,今年全球互联网流量同比增长 17.2%,谷歌仍然是访问量最高的互联网服务,而美国再次成为全球 Bot 流量(机器人流量,即非人类产生的互联网流量)的主要来源地。报告指出,2024 年上半年全球流量增长相对平缓,但在 8 月中旬开始加速,并持续增长至 11 月底,最终全年增长达到 17.2%。这一增长模式与 2022 年和 2023 年的趋势相似。 5、美国上市ETF管理总资产历史首次超过10万亿美元 12.17 据市场消息,在美国上市的ETF管理的总资产达到10.6万亿美元,有史以来首次超过10万亿美元的门槛,其中400亿美元已投入加密货币领域。 04 今日前瞻 今日重点关注的财经数据 (1)21:30 美国11月新屋开工总数年化 (2)21:30 美国11月营建许可总数 (3)次日03:00 美联储公布利率决议和经济预期摘要 (4)次日03:30 美联储主席鲍威尔召开新闻发布会
lg
...
格隆汇
2024-12-18
80岁甲骨文创始人拉里·埃里森又结婚了!第五任妻子年仅33岁
go
lg
...
者的技术研发生成式AI,为客户提供专业
大型
语言
模型
训练服务。据《财富》报道,由于生成式AI淘金热,甲骨文股价节节攀升,埃里森的个人财富也在不断增加。 商业上的成功使埃里森沉迷于昂贵的爱好:名表、游艇、地产。 埃里森有着庞大的理查德米勒手表收藏,每支价格从六位数到百万美元不等。他还热衷于游艇比赛,并资助过宝马甲骨文赛艇队。他在2009年以1亿美元的价格收购了印第安维尔斯网球锦标赛。此外,埃里森有着数十亿美元的房地产投资,在罗得岛州纽波特、佛罗里达棕榈滩等地都拥有房产。 埃里森还和特朗普关系友好。 在今年大选期间,埃里森曾公开表示过对特朗普的支持,称“我不认为他是魔鬼——我支持他,希望他能有好的表现。”在特朗普上一任任期时,他也与其保持密切关系。在颁布字节跳动出售在美业务的行政令后,特朗普表示支持甲骨文收购TikTok,称甲骨文是一家“伟大的公司”。
lg
...
金融界
2024-12-12
甲骨文股价盘后下跌近8%,因财报不及预期且预测令人失望
go
lg
...
a将使用其云基础设施支持Llama系列
大型
语言
模型
的相关项目。甲骨文创始人拉里·埃里森(Larry Ellison)称:“甲骨文云基础设施训练了世界上几个最重要的生成式AI模型,因为我们的服务比其他云更快、更便宜。” 展望低于预期 甲骨文预计第三财季收入增长7%至9%,即区间为141.7亿至144.3亿美元,低于分析师预期的146.5亿美元。同时,调整后每股收益预计为1.50至1.54美元,也低于市场预期的1.57美元。 尽管公司对本财年的长期展望显示出信心,但近期的业绩和指引引发了市场担忧。 股价表现与AI布局 截至周一收盘,甲骨文股价今年累计上涨超过80%,创下自1999年以来的最佳年度表现。此前,甲骨文在9月上调了2026财年的营收目标至660亿美元,并推出了由超13万颗英伟达芯片支持的“Blackwell”计算集群,用于AI模型训练。 尽管股价承压,甲骨文在云计算和人工智能领域的布局显示出长期增长潜力。投资者将关注公司在未来季度中能否兑现增长目标,同时应对日益激烈的市场竞争。
lg
...
Sissi
2024-12-10
24小时环球政经要闻全览 | 12月5日
go
lg
...
家公司正在为iPhone用户调整百度的
大型
语言
模型
,努力解决诸如LLM对提示的理解和对常见场景的响应准确性等问题。
lg
...
格隆汇
2024-12-05
上一页
1
•••
18
19
20
21
22
•••
115
下一页
24小时热点
中国突然祭出重磅举措引爆黄金市场大行情!金价暴跌近40美元 怎么回事?
lg
...
中美突发重大警告! 美财长贝森特:若出现这种情况 美国准备提高对华关税
lg
...
中美突发重磅!中国将暂停部分稀土管制措施 并停止对美国芯片公司的调查
lg
...
特朗普一句话挑清中美芯片战!非农缺席取而代之的是TA,美联储鹰姿刺激美元
lg
...
【直击亚市】中国一则消息重挫黄金!强财报+中美缓和刺激人气,美国政府还在停摆
lg
...
最新话题
更多
#AI热潮:从芯片到资本的竞赛#
lg
...
13讨论
#SFFE2030--FX168“可持续发展金融企业”评选#
lg
...
36讨论
#VIP会员尊享#
lg
...
1989讨论
#比特日报#
lg
...
10讨论
#Web3项目情报站#
lg
...
6讨论