全球数字财富领导者
财富汇
|
美股投研
|
客户端
|
旧版
|
北美站
|
FX168 全球视野 中文财经
首页
资讯
速递
行情
日历
数据
社区
视频
直播
点评旗舰店
商品
SFFE2030
外汇开户
登录 / 注册
搜 索
综合
行情
速递
日历
话题
168人气号
文章
到了2030年 GPT会发展成什么样?
go
lg
...
0 个单词的人类思维速度为基准。使用
OpenAI
的chat completions API,我们估计 gpt-3.5-turbo 每分钟可以生成 1200 个单词 (words per minute,wpm),而 gpt-4 是 370 wpm(截至 2023 年 4 月初)。规模较小的开源模型,如 pythia-12b ,用 A100 GPU 跑用开箱即用的工具,至少可达到 1350 wpm,通过进一步优化似乎可以再翻一番。 因此,如果以截至 4 月份的
OpenAI
模型为参照,人工智能的速度要么大约是人类速度的 3 倍,要么等于人类速度。我预测模型在未来的推理速度会更快,因为在加速推理方面存在很大的商业与实践压力。事实上,根据 Fabien Roger 的跟踪数据,在这篇文章发表之前的一周,GPT-4 的速度已经增加到约 540wpm(12 个token/秒);这表明存在持续的改进空间与意愿。 我的预测中值是模型的 wpm 将是人类的 5 倍(范围:[0.5x, 20x]),因为这之后会出现边际收益递减的情况,尽管有一些考虑会指向更高或较低的数字。 重要的是,机器学习模型的速度不是固定的。模型的串行推理速度可以以吞吐量减少 k 倍为代价将速度提高 k 平方倍(换句话说,一个模型 k 立方倍的并行副本可以替换为速度快 k 平方倍的一个模型)。这可以通过并行平铺法来实现,理论上甚至适用于比 k 平方还要大的情况,可能至少是 100 甚至更多。因此,通过把 k 设为 5 的话,可以将 5 倍于人类速度的模型加速到 125 倍于人类速度。 重要提醒,速度与质量未必匹配:如第 1 节所述,GPT 2030 的技能组合跟人类不一样,机器在某些我们认为很容易的任务上会失败,而在某些我们感觉困难的任务却很精通。因此,我们不应把 GPT 2030 看作是“高速版人类”,而应将其看作是具有违反直觉的技能的,“高速版员工”。 尽管如此,把加速因素纳入考虑仍然很有参考意义,尤其是当加速值很大时。如果语言模型获得了 125 倍的加速,假设其处于 GPT 2030 的技能范围内,需要我们一天时间的认知动作,GPT 就可以在几分钟内完成。以前面的黑客攻击为例,机器学习系统可以快速建立起对我们来说生成速度较慢的漏洞利用或攻击。 3. 吞吐量与并行副本 模型可以根据可用的计算和内存情况任意复制。这样任何可以并行化的工作都可以快速完成。此外,一旦一个模型被微调到特别有效,改变就可以立即传播到其他实例。模型也可以针对专门的任务进行提炼,从而跑得更快、成本更低。 一旦模型经过训练,可能就会有足够的资源来跑模型的多个副本。这是因为训练一个模型需要运跑它的很多个并行副本,而训练这个模型的组织在部署的时候仍将拥有这些资源。因此,我们可以通过估算训练成本来降低副本数量。 举个例子说明一下这种逻辑,训练 GPT-3 的成本足以让它执行 9 x 10^11 次前向传播。换句话说,人类每分钟的思考量是 380 个单词,一个单词平均为 1.33 个 token,因此 9 x 10^11 次前向传播相当于以人类速度工作约 3400 年。因此,用人类的工作速度该组织可以跑 3400 个模型的并行副本一整年,或者以 5 倍于人类的速度跑相数量的副本 2.4 个月。 我们接下来为未来的模型设计同样的“训练悬垂”(训练与推理成本的比率)。这个比率应该会更大:主要原因是训练悬垂与数据集大小大致成正比,而数据集会随着时间的推移而增加。随着自然产生的语言数据被我们用完,这种趋势将会放缓,但新的模式以及合成或自生成的数据仍将推动它向前发展。我预测 2030 年的模型可使用足够的资源进行训练,去执行相当于人类速度 1800000 年的工作[范围:400k-10M]。 请注意,Cotra (2020) 与 Davidson (2023) 估计的数量相似,得出的数字比我得预测更大;我想主要区别在于我对自然语言数据耗尽所产生影响得建模方式不一样。 上面的预测有些保守,因为如果组织购买额外的计算资源的话,模型可使用得资源可能会多于训练时所用资源。粗略估计表明,GPT-4 使用了全球计算资源的约 0.01% 进行训练,不过我预计未来的训练占用全球计算总量的份额会更大,因此在训练后进一步扩展的空间会更小。尽管如此,如果组织有充分理由去扩展资源的话,仍然可以将所运行的副本数量提高到另一个数量级。 4. 知识分享 (感谢 Geoff Hinton 首先向我提出了这个观点。) 模型的不同副本可以共享参数更新。比方说,ChatGPT 可以部署到数百万用户那里,从每次交互中学到一些东西,然后将梯度更新(gradient updates)传播到中央服务器,在做过平均处理后再应用到模型的所有副本上。通过这种方式,ChatGPT 在一个小时内观察到的人性比人类一辈子(100 万小时 = 114 年)看过的东西还要多。并行学习也许是模型最重要的优势之一,因为这意味着它们可以快速学习任何自己缺失的技能。 并行学习的速率取决于一次跑多少个模型副本,它们获取数据的速度有多快,以及数据是否可以高效地并行利用。最后这一点,即使是极端的并行化也不会对学习效率造成太大影响,因为数百万的批量大小在实践中很常见,并且梯度噪声尺度(McCandlish 等人,2018 年)预测学习性能在某个“临界批量大小”以下劣化程度最小。因此,我们将聚焦在并行副本和数据采集上。 我会提供两个估计,这两个估计都表明以人类的速度并行学习至少约 100 万份模型是可行的。也即是说,机器一天的学习量相当于人类学 2500 年,因为 100 万天 = 2500 年。 第一个估计用到了第 3 节中的数字,得出的结论是训练模型的成本足以模拟模型 180 万年的工作(根据人类速度进行调整)。假设训练运行本身持续了不到 1.2 年(Sevilla 等人,2022 年),这意味着训练模型的组织有足够的 GPU 以人类速度运行 150 万个副本。 第二个估计考虑了部署该模型的组织所占市场份额。比方说,如果一次有 100 万用户向模型发起查询,则组织必然有资源来服务 100 万个模型副本。大致而言,截至 2023 年 5 月,ChatGPT 拥有 1 亿用户(并非同时全部活跃),截至 2023 年 1 月,其每天有 1300 万活跃用户。我假设典型用户的请求量相当于模型几分钟的生成文本,因此 1 月份的数字可能意味着每天大概只有 5 万人日的文本。不过,未来的 ChatGPT 式的模型似乎很可能会达到其 20 倍之多,日活用户可以达到 2.5 亿更多,因此每天将会有 100 万人日的数据。相比之下,Facebook 的日活用户数是 20 亿。 5. 多模态、工具与执行器 从历史上看,GPT 风格的模型主要是基于文本和代码进行训练,除了通过聊天对话之外,与外界互动的能力有限。然而,这种情况正在迅速改变,因为模型正在接受图像等其他模态的训练,正在接受使用工具的训练,并开始与物理执行器交互。此外,模型不会局限于文本、自然图像、视频和语音等以人类为中心的模态——它们也可能会接受网络流量、天文图像或其他海量数据源等人类不熟悉的模态的训练。 工具。最近发布的模型开始利用了外部工具,如 ChatGPT 插件等。文本与工具使用相结合足以编写出可执行的代码,说服人类让机器替他们采取行动,进行 API 调用,交易,甚至执行网络攻击都有可能。工具的使用具备经济用途,因此会有进一步发展这种能力的强烈动机。 ChatGPT 是被动的:用户说 X,ChatGPT 回应 Y。风险存在但有限。很快就会有主动系统 - 一个助手会替你回复电子邮件,代表你采取行动等。这样风险会更高。 - Percy Liang (@percyliang) 2023 年 2 月 27 日 新模态。现在有大型开源视觉语言模型,如 OpenFlamingo,在商业方面,GPT-4 和 Flamingo 都接受了视觉和文本数据的训练。研究人员还在试验更多奇异的模态对,例如蛋白质和语言(Guo 等人,2023 年)。 我们应该期望大型预训练模型的模式会继续扩展,原因有二。首先,在经济上,将语言与不太熟悉的模态(如蛋白质)配对有它的用处,这样用户就可以从解释并有效地进行编辑中受益。预测会用蛋白质、生物医学数据、CAD 模型以及与主要经济部门相关的任何其他模态进行多模态训练。 其次,我们将开始用完语言数据,因此模型开发人员得搜索新类型的数据,从而可以继续受益于规模。除了传统的文本和视频之外,现有数据源当中天文数据(很快将达到每天艾字节得规模)和基因组数据(大约 0.1 艾字节/天)是规模最大之一。这些以及其他得海量数据源可能会被用于训练 GPT 2030。 使用外来模态意味着 GPT 2030 可能会具备非直觉的能力。它可能比我们更了解恒星和基因,即尽管它现在处理基本的物理任务都比较困难。这可能会带来惊喜,比方说设计出新的蛋白质,这是我们基于 GPT 2030 那种“一般”智能水平预料不到的。在思考 GPT 2030 的影响时,重要的是要思考由于这些奇异的数据源而可能形成的超人能力。 执行器。模型也开始使用物理的执行器:ChatGPT 已经用于机器人控制,
OpenAI
正在投资一家人形机器人公司。不过,在物理域收集数据要比在数字域收集数据昂贵得多,而且人类在进化上也更适应物理域(因此机器学习模型与我们竞争的门槛更高)。因此,与数字工具相比,我预计人工智能掌握物理执行器的速度会更慢,而且我不确定我们是否该在 2030 年之前做到这一点。量化而言,我认为在 2030 年实现自主组装一辆按比例复制的法拉利的概率是 40%。 6. GPT-2030 的影响 接下来我们将分析像 GPT 2030 这样的系统对社会意味着什么。具备 GPT 2030 特征的系统至少会显著加速某些领域的研究,同时被滥用的规模也大得很。 我会从分析 GPT 2030 的一些一般优势和局限性开始,然后用来作为分析加速和滥用的视角。 优势。GPT 2030 代表的是一支庞大、适应性强、高产出的劳动力队伍。回忆一下吧,多个 GPT 2030 副本并行工作,按照 5 倍于人类的运行速度,可以完成 180 万年的工作。这意味着我们可以(受到并行性的限制)模拟 180 万个代理,每个代理在 2.4 个月内即可完成一年的工作。如上所述,对于 FLOP (浮点运算),我们可以开出 5 倍的费用,从而换取额外 25 倍的加速(这将达到人类速度的 125 倍),因此我们还可以模拟出 14000 个代理,这些代理每个都能在 3 天内完成一年的工作。 限制。利用这种数字劳动力存在三个障碍:技能情况、实验成本以及自主性。首先,GPT 2030 将拥有与人类不同的技能组合,导致它在某些任务上表现更差(但在其他任务上表现更好)。其次,模拟人工仍然需要与物理世界对接,以便收集数据,这个本身需要时间和计算成本。最后,在自主性方面,如今的模型在被“卡住”之前只能通过思维链生成几千个 token,进入到没法生成高质量输出的状态。在将复杂任务委托给模型之前,我们需要显著提高其可靠性。我预计可靠性会提高,但并非没有限制:我(非常粗略)的猜测是 GPT 2030 可以稳定运行数天(与人类等效的时间),然后就得重新设置或交给外部反馈控制。如果模型以 5 倍的速度运行的话,这意味着它们每隔几个小时就需要人工监督的介入。 因此,GPT 2030 影响最大的任务应该具备以下特性: 利用了 GPT 2030 相对于人类具备优势的技能。 只需要外部经验数据(收集应该很轻松快速,与昂贵的物理实验相反)的任务。 可以先验分解为可靠执行的子任务,或者具有清晰且可自动化的反馈指标来帮助引导模型的任务。 加速。有项任务这三条标准都很容易满足,那就是数学研究。首先,GPT 2030 可能具备超人的数学能力(第 1 节)。这第二条和第三条,数学可以纯粹通过思考和写作来完成,而且什么时候定理得到证明我们是知道。此外,全球的数学家总共也没多少(比方说美国就只有 3000 人左右),因此 GPT 2030 也许每隔几天模拟一次产出就能超过所有数学家的年产。 机器学习研究的一些重要部分也符合上述标准。GPT 2030 在编程方面能力超人,其中包括实施和运行实验。鉴于 GPT-4 擅长以通俗易懂的方式解释复杂的主题(并且市场对此也有很大需求),我猜它也能很好地呈现和解释实验结果。因此,届时机器学习研究可能会简化成构思出好的实验来运行,并与高质量(但可能不可靠)的结果报告进行交互。因此,到 2030 年时,研究生拥有的资源堪比今天带领几名优秀学生的教授手上的资源。 部分社会科学也可以得到显著加速。很多论文大部分的工作是对具备科学有趣性的数据源进行追查、分类和标记,并从中析取出重要模式。这满足了第 3 条要求,因为分类和标记可以分解为简单的子任务,并且也满足第 2 条要求,只要数据在互联网上能找到,或者可以通过在线调查收集到即可。 滥用。加速只是一方面,另一方面也会存在严重的滥用风险。最直接的案例是表现出网络攻击性的黑客能力。检查特定目标是否存在特定类型的漏洞可能会得到可靠执行,并且很容易就能检查漏洞利用是否成功(前提是能够与代码交互),因此第 3 条要求是都可以满足的。在第 2 条要求上,GPT 2030 需要与目标系统交互去了解漏洞利用是否有效,这会带来一些成本,但不足以构成重大瓶颈。此外,该模型可以在本地设计好,以开源代码作为训练数据源,去测试漏洞利用,因此它可以提前练好黑客攻击技能,然后再与外部系统进行交互。也就是说,GPT 2030 可以针对大量并行目标快速执行复杂的网络攻击。 滥用的第二个来源是操纵。如果 GPT 2030 同时与数百万用户进行交互的话,那么它在一个小时内获得的人机交互体验比人一生(100 万小时 = 114 年)获得的交互体验都要多。如果它利用这些交互来学习如何操纵,那么它就可以获得远超人类的操纵技能——打个比方,骗子擅长欺骗受害者,因为他们之前已经在数百人身上练习过,而 GPT 2030 可以将这项技能提高几个数量级。因此,它可能非常擅长在一对一对话中操纵用户,或者擅长撰写新闻文章来影响公众舆论。 因此,总而言之,GPT 2030 可以将几乎所有的数学研究以及其他研究领域的重要组成部分自动化,并且可能成为网络攻击和说服/操纵等滥用行为的强大载体。其大部分影响将受到“监督瓶颈”的限制,因此如果人工智能可以长时间自主运行的话,那么它的影响可能会更大。 来源:金色财经
lg
...
金色财经
2023-06-19
AI动力生成meme平台AiDoge即将在MEXC交易所上市 将带来$AI的100倍涨幅?
go
lg
...
领先Web3行业的AI和meme币初创企业AiDoge即将在顶尖加密货币交易所MEXC上市。 从2023年6月19日UTC时间上午开始,加密货币投资者将能够通过MEXC的加密货币交易平台直接购买AiDoge的本地$AI加密代币。 鉴于MEXC已经有一个代币使用相同的代码,AiDoge将在该平台上以$AI2进行交易(但在其他平台上,如去中心化交易所,仍然是$AI)。 参与AiDoge预售的投资者将能够在2023年6月19日UTC时间09:00(北京时间6月19日下午5时)后领取他们的代币。 Aidoge正在建立一个独特的、由人工智能(AI)驱动的meme生成和分享平台。 考虑到该项目已经引起了meme币群众和对投资尖端AI加密项目感兴趣的人的关注,分析师对$AI的前景预测非常看好。 一些分析师甚至提出了$AI可能会获得100倍收益的说法。 英国知名加密预售分析师Jacob Crypto Bury认为$AI很可能成为下一个爆炸性增长的加密项目,有着100倍的潜力。 与此同时,同行的加密预售分析师Crypto Gains认为$AI很容易实现20倍的收益,他的YouTube帐户拥有超过10万订
lg
...
Business2Community
2023-06-19
马云的蓝池资本再押注 NFT?速览 5 月获顶级加密 VC 投资的 25 个项目
go
lg
...
合创始人 Sam Altman 也是
OpenAI
的首席执行官,他认为,未来人工智能将使大部分人失业,因此 UBI(全民基本收入)将至关重要。 因此,Worldcoin 旨在:验证并创建人们在数字世界中的身份,以及为他们提供基本收入。 20. Transak 2023 年 5 月 31 日 A 轮:2000万美元 领投方:CE Innovation Capital 投资者:SBI Ven Capital、Sygnum、Azimut、Third Kind Venture Capital、UOB Venture Management、Signum Capital、Animoca Brands、Genting Ventures、Istari Ventures、No Limit Holdings、Woodstock Fund、IOSG Ventures、KX、Axelar、Tokentus、The Lao、和更多 Transak 是目前最大的 Web3 支付服务之一,可让用户在任何集成了该服务的平台或 dApp 上进行“法币<>加密货币”兑换功能。 21. Magic 2023 年 5 月 31 日 战略:5200 万美元 领投方:PayPal Ventures 投资者:Cherubic、Synchrony、KX、Northzone、Volt Capital 等 Magic 是一家“钱包即服务”公司,旨在抽离 Web3 的复杂性,为企业、用户提供与 Web2 一样简单的可定制加密钱包。迄今为止,Magic 已经创建了超过 2000 万个钱包,并被超过 13 万名开发人员使用。 六、基础设施 22. zkLink 2023 年 5 月 4 日 战略:1000 万美元 投资者:Coinbase Ventures、Ascensive Assets、SIG DTI、BigBrain Holdings、Efficient Frontier 等 zkLink 是一个基于 zk-SNARKs 的 L2 协议,专注于多链交易,目前支持的网络包括以太坊、BNB Chain、Polygon、Avalanche、zkSync、Scroll 等。此外,开发人员可以使用其 API 创建范围更广泛的跨链产品,包括跨链 DEX 和跨链 NFT 市场等。 23. Webb 2023 年 5 月 8 日 种子轮:700 万美元 领投方:Polychain Capital,Lemniscap 投资者:Zee Prime、CMS Holdings 等 Webb 是一种基于 ZK 技术的隐私跨链协议,其拳头产品 Hubble Bridge 允许用户在多个网络之间进行资产转移、验证身份、消息传递。 24. Airstack 2023 年 5 月 17 日 种子前:700 万美元 领投方:Superscrypt 投资者:Polygon、Hashed Emergent、NGC、Primal Capital、UOB Ventures、Signum Capital 等 Airstack 是一个区块链数据平台,可让开发人员轻松查询来自多个网络的数据。它还为用户开发了一个人工智能助手,可以通过询问进行查询。例如,询问“帮我查找拥有超过 10,000 MATIC 的持有人的钱包地址”,Ai 助手会自动提供查询结果。 25. PYOR 2023 年 5 月 19 日 种子轮:400万美元 领投方:Castle Island Ventures 投资者:Hash3、Antler、Future Perfect Venture、Force Ventures、CoinSwitch Ventures、Coinbase Ventures、Balaji Srinivasan PYOR 是一个面向机构的区块链数据分析平台,用户可以访问各个网络的数据,并且可以创建自定义仪表板。目前该平台处于私人测试阶段。 风险提示: 根据央行等部门发布的《关于进一步防范和处置虚拟货币交易炒作风险的通知》,本文内容仅用于信息分享,不对任何经营与投资行为进行推广与背书,请读者严格遵守所在地区法律法规,不参与任何非法金融行为。 来源:金色财经
lg
...
金色财经
2023-06-18
一周财闻:降息、降息、降息;5月金融数据出炉;美联储暂停加息
go
lg
...
对生成式人工智能增加更多安全控制措施,
OPENAI
、谷歌需要对GPT-4等工具进行评估。 人民日报:加快发展新一代人工智能 人民日报发题为《加快发展新一代人工智能》的时评文章,文章指出,人工智能是新一轮科技革命和产业变革的重要驱动力量,加快发展新一代人工智能是事关我国能否抓住新一轮科技革命和产业变革机遇的战略问题。文章也提到,人工智能大模型带来的治理挑战也不容忽视。 股份行、城农商行跟进国有大行下调存款利率 继国有六大行后,全国性股份行紧随其后官宣下调人民币存款利率。6月12日,12家股份行跟随国有大行完成存款利率下调,各期限存款产品调整幅度在5-15个bp。同日,兰州银行相关负责人表示,近期该行也将适度下调存款挂牌利率,各期限品种调降幅度在5bp-30bp之间。 国内成品油迎年内第6次下调:汽油下调55元/吨 柴油下调50元/吨 国内成品油迎年内第6次下调,汽油下调55元/吨,柴油下调50元/吨。按一般家用汽车油箱50L容量估测,加满一箱92号汽油,将少花2元。 证监会主席易会满:围绕加强资本市场监管等重点领域研究制定一揽子政策措施 证监会主席易会满13日表示,围绕支持高水平科技自立自强、服务现代化产业体系建设、投资端改革、加强资本市场监管等重点领域研究制定一揽子政策措施。 高通对华为恢复提供5G芯片供应?余承东:假消息 有消息称,高通恢复为华为提供5G芯片供应,华为下半年或将发布有5G服务的mate60。对此,华为常务董事余承东表示,假消息。 调整起售价及新车主权益 蔚来全系车型降价3万元 蔚来宣布12日起旗下全系车型起售价下调3万元,免费换电补能不再作为标准用车权益。至此,蔚来车型起售价下探至22.8万元起。 FSD完全版将试点上海?特斯拉中国:消息不实 针对市场流传“上海将作为FSD完全版第一个试点城市开放”的消息,特斯拉中国回应,“消息不实。” 美国联邦贸易委员会将设法阻止微软收购动视暴雪的交易最终完成 微软收购动视暴雪在获得欧盟反垄断监管机构的批准近一个月后,美国反垄断机构又以可能违反反垄断法为由试图暂停这笔交易。 AMD公布新款MI300X AI芯片 AMD公布新款MI300X AI芯片,公司还公布了MI300A芯片,将用于美国的"El Capitan"超级计算机。
lg
...
金融界
2023-06-18
ChatGPT“真香”?!调查发现:美国高达92%程序员在工作中使用AI
go
lg
...
得利益,而这还没有考虑到其母公司微软与
OpenAI
的深度纠缠。 开发人员的职业生涯最终是否会被生成式AI削弱(或增强)还有待观察。毕竟,我们已经看到工作被人工智能取代 ,程序员可能也无法幸免。
lg
...
Elva
2023-06-18
年薪最高破37.5万美元!全球AI人才需求激增 美媒:42%首席执行官认同10年内毁灭人类
go
lg
...
Today报道称,ChatGPT母公司
OpenAI
正在寻找经验丰富的AI训练专员,工作内容包括测试和评估AI系统潜在危险,以及研发修复软件,开出的年薪从20万至37万美元不等,甚至提供股权分红、29周有薪育婴假、全家保险和无限制休假等福利。由于上班地点位于旧金山,
OpenAI
还提供搬家费补贴。#ChatGPT火爆全网# AI安全和研究公司Anthropic正在寻找合适的人选来“发现、测试和记录AI最佳实践”,建立提示库以完成任务,创建教程并直接与客户合作。如果你拥有“富有创造力的黑客精神和热爱解决难题”,以及“热衷于让强大的技术安全并造福于社会”,那么旧金山的职位非常适合。 重点来了,该职务的预期薪资范围为28万至37.5万美元,同样也包含股权分红。福利包括为入职者和家人提供保险、4%匹配的401k、无限制带薪休假,以及搬到湾区的搬迁支持。 保险公司GEICO也在AI游戏中,他们正在招聘一位专注于自然语言处理的远程数据科学家,需要“在数据实验和营销的交叉点上拥有丰富的经验和对创新的热情”。公司设立的首选资格是3年以上的数据科学经验,强大的统计知识、贝叶斯学习、实验设计,以及聚类和分割方法专业知识。 薪酬范围为每年12万至19万美元,且GEICO提供无等待期的保险、带利润分享的401(k)、学费报销等福利。 此外,ShortList Recruitment正在寻找AI研究员。他们的客户是“美国领先的人工智能研究公司”之一,需要团队中有高技能的研究人员。远程角色的基本工资为20万至24万美元,需要3年以上的AI研究经验,专攻深度学习。 当然,微软(Microsoft)在名单中,他们正在招聘一名数据注释专家。不需要大学学位,但求职者必须说和写魁北克法语。该运营角色将帮助“通过生成高质量的转录来训练和改进微软产品和服务,从而构建下一代语音识别。受聘人员将使用内部工具转录和注释数据,审查内容的准确性和一致性,并评估转录工具。 42%首席执行官认同10年内毁灭人类 根据美国有线电视新闻网(CNN)独家分享的调查结果,本周在耶鲁CEO峰会上接受调查的42%的首席执行官表示,AI有可能在未来5到10年内摧毁人类。 这项调查是在Sonnenfeld首席执行官领导力研究所举办的一次虚拟活动中所进行的,发现人们对与AI相关的风险和机遇几乎没有达成共识。耶鲁大学教授Jeffrey Sonnenfeld在接受电话采访时提到这些发现时说:“它非常黑暗且令人担忧。” Sonnenfeld表示,该调查包括来自不同行业的119位首席执行官的回复,其中包括沃尔玛首席执行官Doug McMillion、可口可乐首席执行官James Quincy、施乐和Zoom等科技公司的领导人,以及制药、媒体和制造业的首席执行官。 就AI对文明的危害程度,商界领袖表现出明显的分歧。尽管34%的首席执行官表示AI可能会在10年内毁灭人类,8%的人表示这可能会在5年内发生,但58%的人表示这永远不会发生,他们“并不担心”。 在另一个问题中,耶鲁大学发现,42%的受访首席执行官表示,AI的潜在灾难被夸大了,而58%的人表示并没有被夸大。几周前,数十名人工智能行业领袖、学者甚至一些名人签署了一份声明,警告人工智能存在“灭绝”风险。 该声明由
OpenAI
首席执行官山姆·奥特曼、“人工智能教父”杰弗里·辛顿,以及谷歌和微软的高管签署,呼吁社会采取措施防范AI的危险。 “减轻人工智能灭绝的风险应该与流行病和核战争等其他社会规模的风险,已共同成为全球优先事项,”声明说。
lg
...
颜辞
2023-06-17
这回能成么?马斯克表示特斯拉将很快解决自动驾驶问题
go
lg
...
了聊天机器人ChatGPT的运营商——
OpenAI
公司。 讲到人工智能,马斯克在会议上再次重申了这项技术可能对人类构成的威胁。他警告称,AI可能会给人类带来“灾难性后果”,需要制定法规来防止AI演变成无法控制的事物。 马斯克还表示,希望旗下的脑机接口公司Neuralink能在今年晚些时候进行首次人体设备植入操作。上月,该公司获得了美国食品药品监督管理局(FDA)的批准,将启动首次脑植入物人体临床研究。
lg
...
金融界
2023-06-17
微软收盘创纪录新高 年迄今涨幅达45%
go
lg
...
人工智能功能引入其产品和服务。微软正用
OpenAI
技术彻底更新其整个办公应用程序系列,包括Excel、PowerPoint、Outlook和Word。
lg
...
金融界
2023-06-16
多维度解析DePIN如何助力人工智能?
go
lg
...
造者都是诸如 Microsoft 的
OpenAI
、Nvidia、Google 甚至 Meta 这样的传统科技巨头。 发生了什么?为什么这一次巨头赢过了初创?初创企业可以写出优秀代码,但与科技巨头相比,它们面临多种阻碍: 计算成本居高不下 AI 发展存在反向凸角:由于缺少必要的方针,围绕 AI 社会影响的担忧和不确定性阻碍了创新 AI 黑盒问题 大型科技公司建立的“数据护城河”形成进入壁垒 那么,为什么需要区块链技术出场?它与人工智能的交集在哪?虽然不能一次性解决所有问题,但Web3中的分布式物理基础设施网络(DePIN)为解决上述问题创造了条件。下文将阐述 DePIN 背后的技术如何助力人工智能,主要从四个维度: 降低基础设施成本 验证创作者和人格 填补AI 民主和透明度 设置数据贡献奖励机制 下文中: “web3”指下一代互联网,区块链技术与其他现有技术是其有机组成。 “区块链”指去中心化和分布式账本技术。 “加密”指利用代币机制进行激励和去中心化的做法。 一、降低基础设施成本(计算和存储) 每一波技术创新的引子都是某种昂贵的东西变得廉价到可以浪费。 ——社会的技术债务和软件的古腾堡时刻,来自 SK Ventures 基础设施的可负担性有多重要(人工智能的基础设施指计算、传输和存储数据的硬件成本),Carlota Perez 的技术革命理论有指明,该理论提出技术突破包含两个阶段: 来源:Carlota Perez 的技术革命理论 安装阶段以大量风险投资、基础设施建设和“推动式”市场推广(GTM)策略为特征,因为客户不了解新技术的价值主张。 部署阶段以基础设施供应的大量增加为特征,降低拉新门槛,并采用“拉动式”市场推广(GTM)策略,表明产品市场匹配度高,客户期待更多尚未成型的产品。 既然 ChatGPT 等尝试已证明市场契合度和客户需求,人们可能觉得 AI 已经进入部署阶段。然而,AI 还缺少重要一环:过剩的基础设施供价格敏感的初创企业进行搭建和尝试。 问题 当前物理基础设施领域主要由垂直一体化寡头垄断,包括 AWS、GCP、Azure、Nvidia、Cloudflare、Akamai 等,行业利润率高,据估计AWS 在商品化计算硬件上的毛利率为 61% 。所以 AI 领域、尤其是 LLM 领域的新进入者要面对及其高昂的计算成本。 ChatGPT 一次训练的成本估计在 4 百万美元,硬件推理运营成本约 70 万美元/天。 Bloom 第二版可能需要花费 1000 万美元进行训练和重新训练。 如果 ChatGPT 进入 Google 搜索,谷歌营收将减少 360 亿美元,巨额利润将从软件平台(Google)向硬件提供商(Nvidia)转移。 来源:层层分析— LLM 搜索架构与成本 解决方案 DePIN 网络如 Filecoin(起源于 2014 年的 DePIN 先驱,专注集合互联网级硬件,服务于分布式数据存储)、Bacalhau、Gensyn.ai、Render Network、ExaBits(用于匹配 CPU/GPU 供需的协调层)可以通过以下三个方面节约 75% 至 90% +的基础设施成本: 1. 推动供应曲线,激发市场竞争 DePIN 为硬件供应商成为服务提供商提供了平等机会。它创建了一个人人可以作为“矿工”加入,用 CPU/GPU 或存储能力可换取经济报酬的市场,从而给现有提供商带来竞争。 虽然像 AWS 这样的公司无疑在用户界面、运营和垂直整合方面享有 17 年的先发优势,但是DePIN 吸引了无法接受中心化供应商客定价的新户群。就像 Ebay 不直接与 Bloomingdale 竞争,而是提供更经济的替代品来满足类似需求,分布式存储网络并不取代中心化供应商,而是旨在服务于价格敏感的用户群体。 2.通过加密经济设计促进市场经济平衡 DePIN 创建的补贴机制能引导硬件供应者参与网络,从而降低最终用户的成本。究其原理,我们可以看看 AWS 和 Filecoin 在Web2和Web3中存储提供者的成本和收入。 客户获得降价:DePIN 网络营造了竞争性市场,引入Bertrand 式竞争,从而降低客户支付费用。相比之下,AWS EC 2 需要约 55% 的利润率和 31% 的总体利润率来维持运营。DePIN 网络提供的Token 激励/区块奖励也是新的收入来源。在 Filecoin 的背景下,存储提供者托管越多真实数据越能获得区块奖励(代币)。因此,存储提供者有动力吸引更多客户达成交易增加收入。几个新兴计算 DePIN 网络的代币结构仍未公开,但很可能遵循类似模式。类似网络包括: Bacalhau:将计算引入数据存储位置的协调层,避免移动大量数据。 exaBITS:服务于 AI 和计算密集型应用程序的分布式计算网络。 Gensyn.ai:深度学习模型计算协议。 3. 降低间接成本:Bacalhau、exaBITS 等 DePIN 网络以及 IPFS/内容寻址存储的优势包括: 释放潜在数据的可用性:由于传输大型数据集的带宽成本高,目前大量数据未被开发,比如体育场馆产生的大量事件数据。DePIN 项目可以现场处理数据并仅传输有意义的输出,发掘潜在数据的可用性。 降低运营成本:通过本地获取数据来降低数据输入、传输和导入/导出成本。 最小化敏感数据共享中的人工作业:如果医院 A 和 B 需要将各自患者的敏感数据进行组合分析,它们可以使用 Bacalhau 协调 GPU 算力,直接在本地处理敏感数据,而不必通过繁琐的行政流程与对方进行个人身份信息(PII)交换。 无需重计算基础数据集:IPFS/内容寻址存储自带去重、溯源和验证数据的能力。有关 IPFS 的功能和性价比可参考这篇文章。 AI 生成摘要:AI 需要 DePIN 提供的经济实惠的基础设施,目前基础设施市场由垂直一体化的寡头垄断。像 Filecoin、Bacalhau、Render Network、ExaBits 这样的 DePIN 网络使成为硬件供应商的机会民主化,引入竞争,通过加密经济设计维护市场经济平衡,让成本降低 75% -90% 以上,并降低了间接成本。 二、验证创作者和人格 问题 一份近期调研显示,50% 的 AI 学者认为 AI 给人类带来毁灭性伤害的可能性超过 10% 。 人们需要警醒,A.I.已经引发社会混乱,而且仍缺乏监管或技术规范,这种情况被称为“反向凸角”。 比如,在这段 Twitter 视频中,播客主持人 Joe Rogan 与保守评论员 Ben Shapiro 在就电影《料理鼠王》进行着辩论,然而这段视频是 AI 生成的。 来源:Bloomberg 值得注意的是,A.I.的社会影响力远不止虚假博客、对话和图像带来的问题: 2024 年美国大选期间,AI 生成的 deepfake 竞选内容首次达到了以假乱真的效果。 参议员 Elizabeth Warren 的一段视频经过编辑,让她“说”出了"共和党人不应该被允许投票"这样的话(已辟谣)。 语音合成的拜登的声音批评跨性别女性。 一群艺术家对 Midjourney 和 Stability AI 提起了集体诉讼 ,指控其未经授权使用艺术家的作品来训练 AI,侵犯版权并威胁艺术家生计。 AI 生成的由 The Weeknd 和 Drake 合唱的歌曲“Heart on My Sleeve”在流媒体平台上走红,但随后被下架。当新技术在没有规范的情况下进入主流,就会造成诸多问题,版权侵犯就属于“反向凸角”问题。 那么我们能否在Web3中加入 AI 的相关规范? 解决方案 利用加密链上来源证明进行人格证明和创作者证明 让区块链技术真正发挥作用——作为一个包含不可篡改链上历史记录的分布式账本,数字内容的真实性可以通过内容加密证明得到验证。 数字签名作为创作者证明和人格证明 要识别 deepfake,可用原始内容创作者独有的数字签名生成加密证明,签名可以使用只有创作者知晓的私钥创建,并可由对所有人公开的公钥进行验证。有了签名就可以证明内容是由原始创作者创建,不论创建者是人类还是 AI,还可以验证授权或未授权的对内容的更改。 利用 IPFS 和默克尔树进行真实性证明 IPFS 是使用内容寻址和默克尔树引用大型数据集的分布式协议。为了证明文件内容收到、更改,会生成一个默克尔证明,即一串哈希,显示特定的数据块在默克尔树中的位置。每次更改,都会在默克尔树中增加一个哈希,提供了文件修改的证明。 加密方案的痛点是激励机制,毕竟,识别出 deepfake 制造者虽然能减少负面社会影响,但不会带来同等的经济利益。这份责任很可能落在 Twitter、Meta、Google 等主流媒体分发平台上,事实也的确如此。那么我们为什么需要区块链? 答案是区块链的加密签名和真实性证明更加有效、可验证和确定。目前,检测 deepfake 的过程主要通过机器学习算法(如 Meta 的“Deepfake Detection Challenge”、Google 的“Asymmetric Numeral Systems” (ANS)和 c 2 pa:https://c 2 pa.org/)来识别视觉内容中的规律和异常,但时常不够准确,落后于 deepfake 发展速度。一般需要人工审核来确定真实性,低效且昂贵。 如果有一天每条内容都有加密签名,每个人都能可验证地证明创作来源,标记篡改或伪造行为,那我们将迎来美丽的世界。 AI 生成摘要:AI 可能对社会构成重大威胁,尤其是 deepfake 和未授权使用内容,而Web3技术,如使用数字签名的创作者证明和使用 IPFS 和默克尔树的真实性证明,可以验证数字内容的真实性,防止未经授权的更改,为 AI 提供规范。 三、AI 民主化 问题 今天的 AI 是由专有数据和专有算法构成的黑盒。大型科技公司 LLM 的封闭性扼杀了我眼中的“AI 民主”,即每个开发者甚至用户都能为 LLM 模型贡献算法和数据,并在模型盈利时获得部分利润(相关文章)。 AI 民主=可视性(能看到输入模型的数据和算法)+贡献(能向模型贡献数据或算法)。 解决方案 AI 民主的目的是让生成式 AI 模型对公众开放、与公众相关、为公众所有。下表对比了 AI 现状与通过Web3区块链技术能实现的未来。 目前—— 对于客户: 单向接收 LLM 输出 无法控制个人数据如何被使用 对于开发者: 可组合性低 ETL 数据处理不可追溯,难复现 数据贡献来源仅限于数据所有机构 闭源模型只能通过 API 付费访问 分享数据输出缺乏可验证性,数据科学家 80% 的时间用于低端数据清洗 结合区块链后—— 对于客户: 用户可提供反馈(比如偏见、内容审核、针对输出的颗粒度反馈)作为微调依据 用户可选择贡献数据换取模型盈利后的利润 对于开发者: 分布式数据管理层:众包重复耗时的数据标记等数据准备工作 可视性&组合&微调算法的能力,借助可验证源(可以看到所有改动的防篡改历史记录) 数据主权(通过内容寻址/IPFS 实现)和算法主权(例如 Urbit 实现了数据和算法的点对点组合和可移植性) 加速 LLM 创新,从基础开源模型的各种变体中加速 LLM 创新。 可复现训练数据输出,通过区块链对过去 ETL 操作和查询的不可变记录(如 Kamu)实现。 有人说Web2的开源平台也提供了一种折中方案,但其效果并不理想,相关讨论可见 exaBITS 的博文。 AI 生成摘要:大型科技公司封闭的 LLM 扼杀了“AI 民主”,即每个开发者或用户都能够为一个 LLM 模型贡献算法和数据,并在模型盈利时获得部分利润。AI 应该对公众开放,与公众相关,为公众所有。借助区块链网络,用户能够提供反馈,为模型贡献数据换取变现后的利润,开发者也能获得可视性和可验证源,从而组合和微调算法。内容寻址/IPFS 和 Urbit 等Web3创新将实现数据和算法主权。通过区块链对过去 ETL 操作和查询的不可变记录,训练数据输出的可复现性也将成为可能。 四、设置数据贡献奖励机制 问题 今天,最有价值的消费者数据为大型科技公司的专有资产,构成其核心商业壁垒。科技巨头没有动力将这些数据与外部方共享。 那么,为什么我们不能直接从数据创造者或用户那里获取数据呢?为什么我们不能把数据变成公共资源,贡献数据将数据开源化供数据科学家使用? 简单来说是因为缺乏激励机制和协调机制。维护数据和执行 ETL(提取、转换和加载)是一大笔间接成本。事实上,仅数据存储就将在 2030 年成为价值 7770 亿美元的行业,这还不包括计算成本。没有人会无偿承担数据处理的工作和成本。 不妨看看
OpenAI
,最初设定是开源非盈利,但变现困难无法覆盖成本。2019 年,
OpenAI
不得不接受微软注资,算法不再对公众的开放。预计到 2024 年,
OpenAI
盈利将达 10 亿美元。 解决方案 Web3引入了名为“dataDAO”的新机制,促进了 AI 模型所有者和数据贡献者之间的收入再分配,为众包数据贡献创建了激励层。由于篇幅限制,此处不会展开,想要了解可阅读下方两篇文章: How DataDAO works/DataDAO 原理,作者是 Protocol Labs 的 HQ Han How data contribution and monetization works in web3/web3数据贡献和变现如何运作,我在这篇深入讨论了 dataDAO 的机制、欠缺和机遇 总的来说,DePIN 另辟蹊径,为推动Web3和 AI 创新提供了新的硬件能源。尽管科技巨头主导了 AI 行业,但新兴参与者可以利用区块链技术加入竞争:DePIN 网络降低准入门槛的方式包括降低计算成本;区块链的可验证和分布式特性使真正的开放式 AI 成为可能;dataDAO 等创新机制激励数据贡献;区块链的不可变性和防篡改特性提供了创造者身份证明,打消人们对 AI 负面社会影响的担忧。 来源:金色财经
lg
...
金色财经
2023-06-16
中国主席习近平与比尔·盖茨讨论人工智能的崛起,欢迎美国公司将技术带到中国
go
lg
...
销售活动,使外国商界感到不安。 微软是
OpenAI
公司的支持者,
OpenAI
的聊天机器人ChatGPT去年点燃了全球人工智能的热潮,并蔓延至中国。
OpenAI
和ChatGPT本身没有被中国政府封锁,但
OpenAI
不允许一些国家的用户登录,包括中国大陆和香港。 微软在中国已经有30多年的历史,在中国有一个大型研究中心。微软的必应门户网站是唯一可以在中国所谓的长城防火墙内访问的外国搜索引擎,但对敏感话题的搜索结果经过了审查。 近年来,随着中国收紧对互联网领域的控制,这家美国科技巨头在中国面临着各种问题。2021年微软关闭了LinkedIn中国,用一个只专注于工作的精简版取代了这个社交网络应用。微软在5月宣布,公司也将关闭在中国的应用程序,理由是激烈的竞争和宏观经济挑战,但表示将保留在中国的业务。
lg
...
Sue
2023-06-16
上一页
1
•••
470
471
472
473
474
•••
591
下一页
24小时热点
黄金开盘劲爆行情!美国“黑天鹅” 刺激金价暴涨逾40美元 究竟怎么回事?
lg
...
中国突向美国征收“反倾销”关税,究竟怎么回事?
lg
...
中国传一则坏消息!“抛售美国”的导火索找到:股汇债三杀了
lg
...
中国中央政府向全国各地官员发出一份重要通知!彭博: 习近平正推动厉行节约
lg
...
【直击亚市】中国4月成绩单不太好看!穆迪最新举动重燃“抛售美国”,黄金又涨了
lg
...
最新话题
更多
#Web3项目情报站#
lg
...
6讨论
#SFFE2030--FX168“可持续发展金融企业”评选#
lg
...
32讨论
#链上风云#
lg
...
101讨论
#VIP会员尊享#
lg
...
1964讨论
#CES 2025国际消费电子展#
lg
...
21讨论