全球数字财富领导者
财富汇
|
美股投研
|
客户端
|
旧版
|
北美站
|
FX168 全球视野 中文财经
首页
资讯
速递
行情
日历
数据
社区
视频
直播
点评旗舰店
商品
SFFE2030
外汇开户
登录 / 注册
搜 索
综合
行情
速递
日历
话题
168人气号
文章
英伟达2023Q3业绩电话会分析师问答
go
lg
...
采用的推动,我们预计终端需求会更强劲
Jensen
Huang
Vivek,我们的数据中心业务与两个基本动态相关。第一个与不再扩展的通用计算有关。因此,需要加速以达到成本效率规模和能源效率规模的必要水平,这样我们才能在省钱省电的同时继续增加工作量。随着通用计算变慢,加速计算通常被认为是前进的道路。第二个动力是人工智能。我们看到一些非常重要的 AI 领域的需求激增,以及 AI 的重要突破。一个叫做深度推荐系统,它现在对于向使用手机之类的设备或仅使用语音与计算机交互的人推荐最好的内容、项目或产品来说是非常重要的。你需要真正了解自然, 第二个与大型语言模型有关。这是 - 这始于几年前 Transformer 的发明,它导致了 BERT,导致了 GPT-3,这导致了现在与之相关的一大堆其他模型。我们现在有能力学习各种语言的表征。它可能是人类语言。它可能是生物学的语言。它可能是化学语言。最近,我刚刚看到一个名为基因 LM 的突破,这是学习人类基因组语言的第一个例子。 第三个与生成人工智能有关。你知道,前 10 年,我们一直致力于感知 AI。现在,感知的目标当然是理解上下文。但 AI 的最终目标是做出贡献,创造一些东西来生成产品——现在是生成 AI 时代的开始。你可能到处都看到它,无论是生成图像、生成视频还是生成各种文本,以及增强我们的性能以提高我们的性能以提高生产力以降低成本并改进我们所做的一切的能力。不得不说,生产力真的比以往任何时候都重要。 因此,您可以看到我们公司与两件事相关联,这两件事比以往任何时候都更加重要,即能源效率、成本效率,当然还有生产力。这些事情比以往任何时候都更重要。我的期望是,出于这些原因,我们会看到对人工智能的所有强劲需求和激增需求。 CJ缪斯 您现在开始使用 H100 捆绑 NVIDIA AI 企业版。我很好奇你能否谈谈我们应该如何考虑软件货币化的时机?我们应该如何通过模型来看待这种流动,特别是关注 AI Enterprise 和 Omniverse 方面的事物?
Jensen
Huang
我们在 NVIDIA AI Enterprise 方面取得了长足的进步。事实上,您可能已经看到我们在本季度发布了多项与云相关的公告。你知道 NVIDIA 拥有丰富的生态系统。多年来,我们丰富的生态系统和我们的软件堆栈已融入各种开发人员和初创企业。但更重要的是——我们比以往任何时候都更处于云层的临界点。这太棒了,因为如果我们能够将 NVIDIA 的架构和我们的完整堆栈应用到每一个云中,我们就可以更快地接触到更多的客户。本季度,我们宣布了几项举措,其中一项 - 有多项合作伙伴关系和合作,我们今天宣布的一项与微软和我们在那里的合作伙伴关系有关。 与我们交谈的每家公司都希望拥有云的敏捷性和规模、灵活性。因此,在过去一年左右的时间里,我们一直致力于将我们所有的软件堆栈迁移到云端——我们所有的平台和软件堆栈都迁移到云端。所以今天,我们宣布微软和我们自己将在 NVIDIA 堆栈上进行标准化,这是我们共同开展的大部分工作,以便我们可以将完整的堆栈应用于全球企业。这就是包括的所有软件。 一个月前,我们宣布了与 Oracle 的相同类型的合作伙伴关系。您还看到,高性能计算云领域的领导者 Rescale 已将 NVIDIA AI 集成到他们的堆栈中。Monite 已集成到 GCP 中。我们最近宣布了 NeMo 大型语言模型和 BioNeMo 大型语言模型,以将 NVIDIA 软件置于云端。我们还宣布 Omniverse 现在可在云端使用。所有这一切的目标是将 NVIDIA 平台全栈软件转移到云端,这样我们就可以更快地吸引客户,并且客户可以使用我们的软件。如果他们想在云中使用它,则按 GPU 实例小时计算;如果他们想在本地使用我们的软件,他们可以通过软件许可等方式来实现——许可和订阅。所以,在这两种情况下, 与我们合作的合作伙伴对此非常兴奋,因为 NVIDIA 丰富的生态系统是全球性的,这可以为他们和我们自己带来新的消费到他们的云中,而且还将所有这些新机会连接到其他 API 和其他服务他们提供的。因此,我们的软件堆栈正在取得巨大进步。 身份不明的分析师 想知道您是否可以更多地说明本季度的库存费用以及一般的内部库存。在文档中,您谈到这是手头库存的一部分加上一些采购义务。你还在准备好的发言中说,其中一些是由于中国数据中心造成的。所以,如果你能澄清这些指控中的内容。然后一般来说,对于您的内部库存,是否还需要进行处理?如果需要在接下来的几个季度内解决这个问题,会有什么影响? 科莱特克雷斯 正如我们在准备好的评论中强调的那样,我们在本季度内为库存储备登记了 7.02 亿美元。其中大部分,主要是所有这些都与我们的数据中心业务有关,只是由于对中国的预期需求发生变化。因此,当我们查看数据中心产品时,其中很大一部分也是我们记下的 A100。 现在看看我们手头的库存和增加的库存,其中很多只是由于我们即将上市的架构,我们的 Ada 架构,我们的 Hopper 架构,甚至更多是因为我们的网络业务。我们一直在构建这些架构以推向市场,这样说。我们总是在每个季度末查看我们的库存水平,以了解我们未来的预期需求。但我认为我们做得很好,至少在本季度只是基于对未来的预期。 蒂莫西·阿库里 第一,数据中心指引中的囤货有没有影响?我问是因为您现在拥有的 A800 是 A100 的改良版,具有较低的数据传输速率。因此,可以想象客户可能会在仍然可以买到的情况下囤积这种产品。我想第二部分与库存费用有关,你能再多谈谈吗?因为上个季度,你收取费用是有道理的,因为收入比你想象的要少,但收入几乎符合预期。听起来中国是网络中立的。那么,收费是否与 A100 库存下降得更快有关?这与收费有关吗? 科莱特克雷斯 我们看到的大部分数据中心业务都是与客户合作,专门满足他们构建加速计算和人工智能的需求。就为此持有单位而言,这不是一项业务。它们通常是我们看到的四个非常非常具体的产品和项目。所以,我要回答不,我们看不到任何东西。 你关于库存规定的第二个问题。上个季度末,我们开始看到中国经济疲软。我们一直在关注我们的长期需求。如您所见,这不是关于当前季度库存的声明。我们通常需要两到三个季度的时间来构建满足未来需求的产品。所以,这始终是我们订购的库存的情况。因此,现在看看我们在中国持续的封锁、持续的经济挑战方面所看到的情况,是时候认真审视我们认为未来数据中心需要什么,而不是导致我们的减记。 斯泰西·拉斯根 听起来数据中心可能有一些中国软性问题。你说游戏恢复连续增长。但是你说公司的连续增长是由汽车、游戏和数据中心驱动的。如果整体指导有点持平,这三者怎么能依次增长呢?它们都只是增长了一点点,还是其中之一实际上下降了?鉴于该评论,我们如何看待进入第四季度的细分市场? 科莱特克雷斯 关于从第三季度到我们为第四季度提供的指导的顺序。正如我们在指导方面看到的数字,你是对的,只增长了大约 1 亿美元。我们已经指出,其中三个平台可能会略有增长。但我们认为我们的专业可视化业务将持平并且可能不会增长,因为我们仍在努力纠正渠道库存水平,以达到正确的数量。很难说哪个会增加。但同样,我们正计划让所有这三个不同的市场平台增长一点点。 马克·利帕西斯 我想对你来说,你已经阐明了数据中心的愿景,我认为,在该愿景中,为所有工作负载或大多数工作负载部署了具有 CPU、GPU 和 DPU 集成解决方案集的解决方案。您能否给我们一种感觉——或者谈谈这种愿景在渗透周期中的位置?或许可以谈谈 Grace——Grace 对于实现该愿景的重要性,Grace 与现成的 x86 相比将交付什么,您是否知道 Grace 将在该愿景中首先或最快被接受的地方?谢谢你。
Jensen
Huang
Grace 的数据移动能力出类拔萃。Grace 还与我们的 GPU 保持内存一致,这允许我们的 GPU 将其有效 GPU 内存、快速 GPU 内存扩展 10 倍。如果没有在 Hopper 和 Grace 以及 Grace 架构之间设计的特殊功能,这是不可能的。因此,它的设计——Grace 专为以非常高的速度处理非常大的数据而设计。这些应用程序与——例如,数据处理与推荐系统相关,它一次处理数 PB 的实时数据。都是热的。这一切都需要快速,以便您可以在几毫秒内向使用您服务的数亿人提出建议。它在人工智能训练、机器学习方面也非常有效。因此,这类应用程序真的很棒。 我想我之前说过我们将在第一季度提供生产样品,而且我们仍在按计划进行。 哈兰苏尔 你们的数据中心网络业务,我相信,正在推动每季度约 8 亿美元的销售额,在过去几年中非常非常强劲的增长,正如你们指出的那样,短期内,团队正在推动强大的 NIC 和 BlueField 附加到您自己的计算解决方案(如 DGX)和更多合作伙伴公告(如 VMware)。但我们也知道,网络在很大程度上受到通用云和超大规模计算支出趋势的影响。那么,未来几个季度网络业务的知名度和增长前景如何?
Jensen
Huang
首先,感谢您的提问。如您所知,我们的网络与高性能计算密切相关。我们不是——我们不为绝大多数商品网络提供服务。我们所有的网络解决方案都非常高端,专为移动大量数据的数据中心而设计。现在,如果您现在拥有一个超大规模数据中心,并且正在部署大量人工智能应用程序,那么您提供的网络带宽很可能会对数据中心的整体吞吐量产生重大影响。 因此,他们在高性能网络上所做的小额增量投资坦率地转化为在供应服务方面节省数十亿美元或吞吐量增加数十亿美元,从而增加了他们的经济效益。 因此,如今,通过分解和 AI 应用程序AI 供应和数据中心,高性能网络真的非常棒,它会立即收回成本。但这就是我们专注于高性能网络和提供人工智能服务的地方我们关注的人工智能应用程序。 您可能已经注意到 NVIDIA 和 Microsoft 正在构建世界上最大的 AI 基础设施之一。它完全由 NVIDIA 的 InfiniBand 每秒 400 GB的网络提供支持。这样做的原因是因为该网络会立即收回成本。你要投入基础设施的投资是如此巨大,如果你被慢速网络拖累,显然,整体基础设施的效率不会那么高。因此,在我们关注的地方,网络真的非常重要。 这可以追溯到我们首次宣布收购 Mellanox 时。我想当时,他们每个季度大约做几亿美元,大约一个季度 4 亿美元。而现在,我们正在做他们过去在一年内所做的事情,实际上是在一个季度内完成。因此,这可以告诉您高性能网络的发展。它与企业和数据中心的总体支出挂钩,但与人工智能的采用高度挂钩。 亚伦雷克斯 我想进一步扩展网络问题。当我们今天看到微软的公告时,我们会想到 Meta 在他们正在部署的 AI 足迹上做了什么。Jensen,你能帮助我们了解你的 InfiniBand 网络相对于传统数据中心交换的位置吗?也许在此基础上,你如何在市场上定位频谱,这是否会与以太网世界中更广泛的 AI 结构网络机会竞争?
Jensen
Huang
是的。谢谢,亚伦。数学是这样的。如果您打算在基础设施上花费 200 亿美元,并且整个数据中心的效率提高 10%,那么这个数字是巨大的。当我们做这些大型语言模型和推荐系统时,处理是在整个数据中心完成的。因此,我们将工作负载分布在多个 GPU、多个节点上,并且它会运行很长时间。因此,可以过分强调网络的重要性。因此,整体效率提高 10% 的差异,这很容易实现,NVIDIA InfiniBand 的差异,整个软件堆栈与我们所说的 Magnum IO,它允许我们在网络本身中进行计算,a许多软件在网络本身中运行,而不仅仅是移动数据。网络本身的边缘。我们在整体效率上取得了显着差异。因此,如果您在基础设施上花费数十亿美元,甚至数亿美元,那么差异确实非常大。 安布里什·斯里瓦斯塔瓦 在数据中心方面,是否可以公平地假设计算在报告的季度中下降 Q-over-Q,因为前一个季度,Mellanox 或网络业务在被调用时上升。再一次,你说它环比增长。那么,这是一个公平的假设吗?然后我对 USG 频段进行了澄清。最初,它应该是 4 亿美元,真正用于政府试图阻止的部分。是 A800——我只是想确保我理解它。这不是违背了政府正在尝试做的事情的精神,即防火墙、高性能计算,还是 A800 将面向不同的客户群?谢谢你。 科莱特克雷斯 看看我们本季度的计算结果是持平的。是的,我们也看到了增长,网络方面的增长,但你应该看看我们的第三季度,计算与上一季度持平。
Jensen
Huang
Ambrish,A800,硬件,A800的硬件确保它始终满足美国政府对出口管制的明确测试。并且不能通过客户重新编程或应用程序重新编程来超过它。它受硬件限制。硬件决定了 A800 的功能。因此,它在文字和精神上都经受了明确的考验。我们对 4 亿美元的 A100 提出了担忧,因为我们不确定我们是否能够及时执行、将 A800 介绍给我们的客户并通过我们的供应链。公司做了出色的反馈来应对这种情况,确保我们的业务不受影响,我们的客户不受影响。但A800的硬件肯定能确保它始终满足美国政府对出口管制的明确测试。. 威廉斯坦 我希望您能在我们明年取得进展时讨论 H100 的增长速度。我们收到了很多关于该产品的增长是否应该看起来像一种传统产品周期的问题,在这种周期中,对这种性能显着提高的产品有相当多的被压抑的需求,而且也有供应。那么,从这个角度来看,这种推出是否看起来相对典型,或者我们是否应该期望增长轨迹的开始可能更晚,我们可能会看到 23 年下半年的增长可能会大幅增加?
Jensen
Huang
H100 斜坡在几个方面不同于 A100 斜坡。首先是 TCO、成本收益、运营成本收益,因为每个数据中心现在都受到功率限制,因此节省了能源,而且因为这个令人难以置信的变压器引擎专为最新的 AI 模型设计。与 Ampere 相比的性能是如此重要,以至于我——并且由于这些新模型对 Hopper 的需求被压抑——我谈到了早期的深度推荐系统和大型语言模型以及生成 AI 模型。客户要求尽快推出 Hopper,我们也在努力做到这一点。我们全力以赴帮助云服务提供商建立超级计算机。 请记住,NVIDIA 是世界上唯一一家大批量生产和运输半定制超级计算机的公司。每三年出货一台超级计算机是一个奇迹。在一个季度内向每个云服务提供商运送超级计算机的情况闻所未闻。因此,我们正在与他们中的每一个人密切合作,他们中的每一个人都在竞相站起来 Hoppers。我们预计他们将在第一季度推出 Hopper 云服务。因此,我们预计会出货一些——我们预计在第四季度出货,然后我们预计在第一季度出货量很大。这比安培更快。所以,这是因为我描述的动态。 马特拉姆齐 我在你的脚本中听说你曾谈到过可能是一种新的方式来评论或报告你的数据中心业务中的超大规模收入。我想知道您是否可以向我们提供更多详细信息,说明您在那里的想法以及是什么推动了这个决定?我猜 Jensen 的衍生结果如何 - 决定以不同的方式与超大规模讨论数据中心业务。我的意思是,这对业务意味着什么,它只是反映了需求在哪里,你将以不同的方式解决问题,或者我猜,超大规模客户内部属性与垂直行业需求的组合发生了一些变化根据。谢谢你。 科莱特克雷斯 让我澄清一下就我们认为在我们继续讨论我们的数据中心业务时应该关注的内容而言。我们的数据中心业务越来越大,我们的客户也越来越复杂。当我们谈论超大规模时,我们倾向于谈论 7、8 家不同的公司。但现实是,有很多非常大的公司,我们可以根据他们购买的产品加入讨论。此外,查看云、查看我们的云采购以及我们的客户正在为云构建什么是一个需要关注的重要领域,因为这确实是我们的企业所在、我们的研究所在、我们的高等教育也在采购的所在。
Jensen
Huang
让我双击科莱特刚才说的话,这是绝对正确的。有两种主要的动态正在发生。首先,NVIDIA AI 在全球互联网服务公司中的采用,他们这样做的数量和规模已经增长了很多,互联网服务公司。这些是提供服务的互联网服务公司,但他们不是公共云计算公司。第二个因素与云计算有关。我们现在正处于云计算的转折点。世界上几乎每个企业都有云优先和多云战略。这正是我们今年发布的所有公告的原因——这个季度,自 GTC 以来的最后一个季度,关于现在在云中可用的所有新平台、CSP、超大规模服务器——都是两件事因此,对我们来说,超大规模可以卖给客户;他们也是与合作伙伴一起出售。 在他们业务的公共云方面,由于 NVIDIA 生态系统的丰富性,因为我们有如此多的互联网服务客户和企业客户使用 NVIDIA 的完整堆栈,他们业务的公共云方面真正享受并重视与我们的合作伙伴关系和销售他们与我们的关系。现在很明显,对于所有超大规模企业来说,他们业务的公共云方面很可能——很可能是他们整体消费的绝大部分。因此,因为世界上的 CSP,世界上的公有云只是处于他们企业的早期阶段——将企业提升到云世界,很明显,公有云方面的业务将非常庞大.因此,我们与 CSP 的关系越来越多, 约瑟夫摩尔 想知道您是否可以回顾一下加密货币的影响。显然,这已经从你的数字中消失了,但你是否看到挖矿网络中 GPU 的清算潜力,对未来的影响?您是否预见到区块链会在未来的某个时候成为您业务的重要组成部分?
Jensen
Huang
我们不希望看到区块链成为我们未来业务的重要组成部分。转售市场总是存在的。如果您查看任何主要的转售网站,例如 eBay,就会一直有二手显卡出售。其原因是因为某人今天购买的 3090 升级为 4090,或者他们几年前购买的 3090 今天升级为 4090。如果以合适的价格出售,那 3090 可以卖给某人并享受。因此,二手和用过的显卡的数量一直存在。而且库存永远不会为零。当库存比平时多时,就像所有的供应需求一样,它可能会降低价格并影响我们市场的低端。 但我的感觉是,我们现在与 Ada 一起去的地方非常明确地瞄准了我们市场的上半部分。早期的迹象是,我相信你也看到了 Ada 的发布是一个本垒打。那个 4090——我们运送了大量的 4090,因为如你所知,我们已经做好了准备。然而几分钟之内,它们就在世界各地销售一空。因此,今天 4090 和 4080 的接收量已经超出了图表。这说明了游戏市场的实力、健康和活力。所以,我们对 Ada 的发布非常热情。我们将推出更多 Ada 产品。 张敏也 非常感谢你把我挤进去。我有两个给科莱特的。关于供应,我认为您的言论中有一些混合信息。我想你曾经说过供应是一个逆风。然后当你在与网络业务交谈时,我想你谈到了供应放松。所以,如果你此时赶上需求,我希望你能谈谈供应。其次,我意识到,仅关于基于股票的薪酬,这是一个非常平凡的话题,但它是——我认为在本季度,它大约是 7 亿美元。它在您的运营支出中所占的比重越来越大。所以,很好奇我们应该如何对未来进行建模。谢谢你。 科莱特克雷斯 当我们审视过去每个季度的供应限制时,情况正在好转。网络可能是一年前我们的问题之一,它可能把我们带到了本季度和下个季度,真正看到我们的供应得到改善,以便我们可以支持我们为那里的客户提供的管道。现在这是我们的供应。我们还就我们的客户、供应限制问题进行了讨论。在建立数据中心时,即使获得数据中心容量也非常困难。因此,这对他们的采购决策提出了挑战,因为他们仍在寻找供应链的某些部分。因此,这有望澄清我们所谈论的关于两个供应领域的内容。 在我们的基于股票的薪酬中,我们将看到,很难预测我们的基于股票的薪酬在到达时会是多少。我们已经向我们的新员工提供了服务,但也每年向我们的员工提供一次服务,而且就定价时间而言,这是一个单一的日期。所以,很难确定。但基于股票的薪酬是我们员工薪酬的重要组成部分,并将继续如此。所以,我们从整体薪酬的角度来看。因此,到目前为止,当我们进行焦点时,我们将看到与现在相同的规模,并增加了一些以减少我们现在的员工招聘水平。
Jensen
Huang
我们正在迅速适应宏观环境,调整库存水平,为中国的数据中心客户提供替代产品,并在未来几个季度保持运营支出持平。 我们的新平台开局良好,为我们恢复增长奠定了基础。NVIDIA RTX 正在通过光线追踪和 AI 重塑 3D 图形。Ada Lovelace 的推出是非凡的。全球玩家大排长龙,4290股迅速售罄。Hopper 凭借其革命性的 Transformer 引擎及时满足了对推荐系统、大型语言模型和生成 AI 不断增长的需求。NVIDIA 网络是最高数据中心吞吐量和创纪录成果的代名词。Orin 是世界上第一个专为 AI 驱动的自动驾驶汽车和机器人技术设计的计算平台,并使汽车成为我们下一个价值数十亿美元的平台。 这些计算平台运行 NVIDIA AI 和 NVIDIA Omniverse,这些软件库和引擎可帮助公司构建 AI 并将其部署到产品和服务中。NVIDIA 在加速计算方面的开创性工作比以往任何时候都更加重要。受商业限制,通用通勤已经放缓,就像人工智能需要更多计算一样。从成本或功率的角度来看,仅通过一般购买计算来扩展不再可行。加速计算是前进的道路。我们期待在下个季度向您通报我们的进展情况。 (这份记录可能不是100%的准确率,并且可能包含拼写错误和其他不准确的。提供此记录,没有任何形式的明示或暗示的保证。表达的记录任何意见并不反映老虎的意见)
lg
...
老虎证券
2022-11-17
芯片制造商英伟达股价小幅上涨 公司暗示销售额正在增长
go
lg
...
伟达(Nvidia)首席执行官黄仁勋(
Jensen
Huang
)在一份声明中表示:“我们正在迅速适应宏观环境。”黄补充说,该公司正在“纠正库存水平,为新产品铺平道路。” 英伟达发布业绩的当天,芯片类股普遍下跌,因为存储芯片巨头美光科技表示将削减2023年的资本支出计划。
lg
...
金融界
2022-11-17
穿越山谷的英伟达 会成为元宇宙最重要的基础设施吗?
go
lg
...
在接受采访时,英伟达首席执行官黄仁勋(
Jensen
Huang
)坦诚,公司没有预见到这一点: 我不觉得我们本可以预见到这一点。我不认为我会做什么不一样的事情,但我从之前的例子学到了一点,那就是一旦事情最终发生在你身上时,就唯有吞下苦果,然后放下……我们度过了两个糟糕的财季,在公司的背景下,两个糟糕的财季确实会让所有投资者感到沮丧,让所有员工感到艰难。 英伟达以前也遇到过这种情况。 出问题应对就是了,不要过度情绪化,了解问题是怎么出来的,让公司尽可能保持敏捷。但是一旦既成事实,你只能做出客观、艰难的决定。我们照顾好我们的合作伙伴,我们照顾好我们的渠道,我们确保每个人都有足够的时间。我们推迟了 Ada 的发售,从而确保各方都有足够的时间来对产品进行重新定价,这样即便在 Ada 的背景下,即便 Ada 出来了,重新定价后的产品其实还是具备非常好的价值的。我认为我们已经把各方都尽量照顾到了,这导致了两个相当糟糕的季度。但我认为从大局来看,我们很快就会回来的,所以我认为这也许是过去的教训。 这个说法也许有点托大;今年早些时候,Tae Kim 与 Doug O'Laughlin 等分析师预测英伟达的股价会暴跌,尽管鉴于英伟达在疫情中期已经订购了额外的一批 3000 系列 GPU,这些预测对于避开 PC 销售放缓与以太坊(从工作量证明)过渡的完美风暴大概已经为时已晚(黄仁勋还指出,芯片的生产前置时间增加是英伟达错得如此厉害的一个重要原因)。 对于英伟达来说,更令人担忧的是,虽然库存和以太坊问题是经历了“相当糟糕的财季”的最大的驱动因素,但这还不是其游戏业务正在经历的唯一低谷。我想到了约翰·班扬(John Bunyan)的《天路历程》(Pilgrim’s Progress): 可是在屈辱谷里,可怜的信徒可够受了;因为他还没有走多远,就看见一个叫做魔王(Apollyon)的凶恶的敌人在田野里迎面而来。 这个魔王叫做库存问题;故事里信徒打败了魔王,英伟达最终也能战胜库存问题。 走完这个山谷,又是一个叫做死荫谷的山谷;信徒必须要从这儿经过,因为到天国去的路就在它中间穿过。这山谷是个非常冷落的地方。先知耶利米对它这样形容过:“一片旷野,一片沙漠有深坑之地,一片干旱和死荫之地,一片无人(除了信徒)经过、无人居住之地。” 上周英伟达关于 GTC 的主题演讲令人震惊的是这个寓言在多大程度上契合英伟达的野心:该公司正在走上一段似乎相当孤独的旅程,去定义游戏的未来,现在还不清楚业界其他人会不会跟进或者什么时候跟进。此外,该公司在数据中心以及元宇宙方面也在追求同样大胆的战略:在所有这三个方向上,英伟达要追求的高度比它在过去两年里达到的那些成就都要高,但路径却是出奇的不确定。 山谷中的游戏:光线跟踪与人工智能 长期以来,3D 游戏的呈现都要靠一系列的技巧,尤其是照明方面的技巧。首先,游戏决定了你能看到什么(也就是渲染一个被其他物体遮挡的物体是无用功);然后,你得给物体(如一棵树、一棵草或任何你能想象到的东西)应用合适的纹理。最后,你得从预先确定的光源位置去打光,然后再给物体添加阴影。最后再把整个场景转换成一个个的像素,渲染到 2D 屏幕上;这个过程叫做光栅化。 光线跟踪对光线的处理方式是完全不一样的:光线跟踪不是用预先确定的光源来打光,应用阴影映射,而是从你的眼睛(或更准确地说,是你观察场景的摄像头)开始。然后再跟踪目光所及的屏幕的每一个像素,然后(基于像素所代表的对象类型)对像素进行折射处理,并继续跟踪该光线,直到光线击中光源(然后就进行光照处理),或者丢弃这条光线。这种处理能产生非常逼真的打光效果,尤其是反射和阴影效果。不妨看看下面这一来自《PC Magazine》 的图片: 我们来看看光线跟踪是如何改善了游戏的视觉效果的。我截取了 Square Enix 的《古墓丽影:暗影》PC 版的几张屏幕截图,这款游戏是支持Nvidia GeForce RTX 显卡的光线跟踪阴影效果的。可以仔细看看地面上的阴影。 与效果更粗糙的光栅化版本相比,光线跟踪的阴影效果更加柔和、更为逼真。其暗度取决于被物体遮挡住的光量多寡,甚至阴影本身都有明暗之分,而光栅化似乎给每个物体都赋予了一个非常生硬的边缘。光栅化的阴影效果看起来还不错,但是在玩了带有光线跟踪阴影效果的游戏之后,就很难回去了。 英伟达是在 2009 年首次宣布 API 支持光线跟踪的;不过,使用这种技术的游戏寥寥无几,因为这种技术的计算成本很高(电影 CGI 倒是运用了光线跟踪技术;不过,那些场景渲染一般都需要数小时甚至数天的时间;可游戏的渲染却必须是实时进行的)。所以 2018 年英伟达才推出了引入了专用光线追踪硬件的 GeForce 2000 系列显卡(所以才叫做“RTX”)。AMD 则走了另一条路,给其核心的着色器单元添加了光线跟踪功能(同时还进行光栅化处理);与英伟达的纯硬件解决方案相比 AMD 的要慢一些,但能用,而且重要的是,由于 AMD 同时为 PS5 和 Xbox 制造显卡,这意味着现在整个行业都支持光线追踪技术了。将来会有越来越多的游戏支持光线追踪,不过由于性能问题,大多数应用仍然相当受限。 不过,光线跟踪很重要一点在于:光照效果是动态计算出来的,而不是靠光线和阴影贴图,所以开发者可以“免费”获得光照效果。完全依赖光线跟踪技术的游戏或 3D 环境开发起来应该更容易、更便宜;更重要的是,这意味着环境可以以开发者从未预料到的动态方式发生变化,而且与大多数靠手工费力预制的环境相比,其光照效果还更为逼真。 对于两个新兴的应用场景而言,这一点尤其吸引人:一是像《我的世界》(Minecraft)一样的模拟游戏 。有了光线追踪技术,拥有高度详尽的 3D 世界这个梦想会变得越来越接近现实,因为这些 3D 世界都是动态构建的,而且拥有完美的光照效果。未来的游戏可以走得更远:英伟达的主旨演讲一开始就介绍了一款叫做 RacerX 的游戏,包括物体在内,游戏当中的每一个部分都进行了完整的模拟;游戏内的物理特性也利用了相同类型的光照计算。 第二个场景是我在《DALL-E、元宇宙与零边际成本内容》中讨论过的 AI 生成内容的未来。我上面提到的所有纹理目前都是手工绘制的;随着图形功能(主要由英伟达推动)的增强,由于需要创作高分辨率的资产,新游戏的开发成本也会随之增加。因此,可以想象,将来有可能资产完全是自动化创建出来的,而且是实时进行的,然后再通过光线跟踪技术赋予合适的光照效果。 不过,目前英伟达已经在用 AI 来渲染图像了:该公司此次还发布了深度学习超级采样(DLSS)技术的第 3 版。这项技术可以预测帧并进行预渲染处理,这意味着那些帧根本不需要计算(之前版本的 DLSS 需要对独立像素进行预测和预渲染)。此外,就像光线跟踪技术一样,英伟达也采用了专用硬件,让 DLSS 的性能更好。这些新做法搭配上英伟达 GPU 的专用内核,令英伟达非常适合为游戏与沉浸式 3D 体验(如虚拟世界)建立全新的范例。 但问题是:所有这些专用硬件都要付出代价。 英伟达的新 GPU 是大芯片——顶级的 AD102,以 RTX 4090 的形式出售,这是一款完全集成的片上系统,采用台积电 N4 工艺,尺寸为 608.4 平方毫米;相比之下,AMD 即将推出的 RDNA 3 显卡系列内置的顶级芯片 Navi 31 芯片是小芯片(chiplet)设计,采用台积电 N5 工艺,尺寸为 308 平方毫米,加上采用台积电 N6 工艺的 6 颗 37.5 平方毫米的内存芯片。简而言之, 英伟达的芯片要大得多(这意味着更贵),而且它采用了稍微更现代的工艺流程(可能成本会更高)。 Dylan Patel 在 SemiAnalysis 上解释了这种做法的潜在影响: 简而言之,通过放弃 AI 和光线追踪固定功能加速,转而采用先进封装的更小芯片,从而节省了大量芯片成本。 AMD 的 RDNA 3 N31 和 N32 GPU 的先进封装成本显著上升,但相对于晶圆和成品率成本来说,小型扇出 RDL 封装仍然非常便宜。到头来,与通过将内存控制器与无限的缓存拆分、使用更便宜的 N6 而不是 N5 ,以及更高的产出所节省的成本相比,AMD 封装成本的增加就不值一提了......在接近十年的时间里,英伟达在传统光栅化的游戏性能方面第一次出现成本结构更糟的局面。 这就是英伟达正在走进的山谷。由于 4000 系列的高昂价格,在英伟达做完主旨演讲之后,尤其是当英伟达的网站上的细则表明英伟达发布的其中一款二级芯片其实更类似于三级芯片换了个马甲时,游戏玩家们马上开始竭力反对,他们怀疑英伟达是在玩营销游戏来掩盖价格的大幅上涨。 Nvidia 的显卡性能也许是最好的,而且毫无疑问最适合未来的光线追踪与 AI 生成内容,但代价是它无法为当今的游戏提供最佳的价值。要达到纯模拟虚拟世界的高度,需要熬过一代的时间,对大多数游戏玩家还不关心的功能进行收费。 在山谷中的人工智能:是系统,而不是芯片 对英伟达在游戏方面的做法持乐观态度的原因之一,是该公司在发明着色器(shader)时已经对未来下了类似的赌注。我曾经在去年的 GTC 之后解释过着色器: 英伟达先是凭借 Riva 和 TNT 系列视频卡(经过了硬编码,可对类似微软的 Direct3D 等 3D 库进行加速)而声名鹊起: 不过,GeForce 系列可以通过一种叫做“着色器”的计算机程序进行充分编程。这意味着哪怕是在制造出来之后,GeForce 卡也可以通过开发新的着色器(比方说用来支持新版本的 Direct3D)来加以改进。 更重要的是,着色器不一定就得是渲染图形;任何类型的软件——理想情况下任何可以并行运行的简单计算程序——都可以编程为着色器;诀窍是弄清楚如何写这种程序,这就是 CUDA 的用武之地。我在 2020 年的那篇谈英伟达的集成梦想的文章中解释道: 这种抽象层次的增加意味着底层图形处理单元可以更简单,这意味着图形芯片可以拥有更多的 GPU。比方说, 英伟达刚刚发布的 GeForce RTX 30 系列最先进版本的内核数达到了令人难以置信的 10496 个。 这种程度的可扩展性对视频卡来说很有意义,因为图形处理完全是并行处理的:一块屏幕可以分成任意数量的多个部分,每一部分均可同时独立计算。这意味着性能可以水平扩展,也就是说,每增加一个内核都能提高性能。不过,事实证明,可以充分并行运算的计算类型并不只有图形而已…… 所以英伟达才从模块化的组件制造商变成了软硬件集成制造商。模块化组件是指它的显卡,而软硬件集成是指它的 CUDA(统一计算设备架构)的平台。 CUDA 平台可以让程序员通过多种语言访问英伟达显卡的并行处理能力,但又不需要了解如何对图形进行编程。 现在 Nvidia &技术栈有三个层级: 不过,要想了解 CUDA ,重要的一点是要知道它并不仅仅是让外部程序员能够为英伟达的芯片编写程序,CUDA 也为英伟达本身赋能了。 这大部分是出于绝望。 去年春天,黄仁勋在接受我们采访时解释到,在他看来对公司未来至关重要的着色器的引入,几乎杀死了这家公司: 可编程性的缺点是效率要差一些。正如我之前所提到的那样,功能固定的东西更高效。任何东西只要是可编程的,任何光看定义可以做不止一件事情的东西,对于完成任何特定任务来说都会带来不必要的负担,所以这里的问题是“我们该什么时候做这件事(让自己的东西可编程)?”当时给我们启发的一点是,一切看起来都像 OpenGL 的飞行模拟(OpenGL Flight Simulator)。一切都可以看成是模糊纹理和三线性插值细化纹理,一切东西都没有生命,但我们觉得,如果不赋予媒介生命的话,就没法让艺术家创造出不一样的游戏,不一样的流派,讲述不一样的故事,而最终媒介也将不复存在。与此同时,我们也希望做出一个更加可编程的调色板,让游戏和艺术家可以用它做一些很棒的事情,我们受到了这种野心的驱使。还有一个动机也在敦促我们做这件事,那就是有朝一日就算显卡被商品化了我们也不会倒闭。所以当这些考量到了一定程度,我们就开始做可编程的着色器,所以我认为要这样做的动机是非常明确的。但后来我们受到的惩罚是我们没想到的。 什么样的惩罚? 这个惩罚来得太突然,所有我们对可编程性的预期,所有我们为将来所做的,在一切不必要功能方面的开销,这些都是惩罚,因为当前的应用并不能从中收获好处。除非出来新的应用,否则的话,我们的芯片会显得太贵,而现在的市场竞争非常激烈。 英伟达之所以能活下来,是因为他们的直接加速能力仍然是最好的。从长远来看,英伟达仍将蓬勃发展,因为他们为了利用着色器而开发了一整个 CUDA 基础设施。这就是数据中心增长的来源;黄仁勋解释道: 从你成为一家处理器公司的那一天起,你就必须内化这一点:这个处理器架构是全新的。以前从未出现过像这样的可编程像素着色器,或者这样的可编程 GPU 处理器,以及这样的编程模型,因此我们得内化这个。你必须内化这是一种全新的编程模型,而且与成为一家程序处理器公司或一家计算平台公司相关的一切你都得做出来。所以我们必须建立一支编译器团队,我们必须考虑做出 SDK,必须考虑建立自己的库,也必须与开发者接触,宣传我们的架构,并帮助人们实现它的好处,如果不行的话,甚至你得自己开发新的库,让人们可以轻松地将自己的应用移植到我们的库,然后看到它的好处。 这个故事之所以要再讲一遍,第一个原因是要指出着色器复杂性的成本与当前游戏的光线追踪和人工智能的成本之间的相似之处;二是要大家注意这一点,英伟达解决问题的方法一直都是自己把所有的事情都干了。在那时候,它意味着要开发出 CUDA 来对这些着色器进行编程;而在今天,这意味着要为人工智能开发出整套系统。 黄仁勋在上周的主旨演讲中谈到: 英伟达致力于通过加速计算来推动科学与工业发展。无需做加速计算即可取得更好性能的时代已经结束了。使用没有加速支持的软件,只能花费高昂成本来弥补其性能与扩展性的不足。近 30 年来英伟达始终专注于这一领域, 作为加速软件与扩展计算的专家,英伟达提供了百万倍的加速,远超摩尔定律。 加速计算是一项全栈挑战。需要对问题领域有深入了解,并对计算的每一个层次以及 CPU、GPU 与 DPU 这三种芯片进行优化。跨多 GPU 多节点扩展是数据中心规模所面临的挑战,要将网络和存储与计算资源统一调配,从 PC 到超级计算中心和企业数据中心,从云端到边缘,开发者和客户希望能在许多地方跑自己的软件。不同的应用希望在不同的位置以不同的方式运行。 今天,我们将着眼于全栈来讨论加速计算。我们将介绍新的芯片,并阐述其如何用有限的晶体管释放更多的性能,我会介绍新的库,以及这些库如何加速科学和工业领域的关键任务,还有特定领域专用的新框架,有助于开发性能更高且易于部署的软件。以及新平台,它可以让你安全、安心地部署软件,并获得数量级的提升。 在黄仁勋看来,光是有速度很快的芯片已不足以应对未来的工作负载:这就是英伟达要用上自己的所有设备来建设整个数据中心的原因。不过,再一次地,在一个每家公司都需要加速计算的未来里,英伟达专门为他们打造的数据中心——英伟达的天国之城(Celestial City)——却与现状形成鲜明对比,因为现在的数据中心里面,英伟达芯片的最大用户是那些自己的系统已经就位的大型玩家(hyperscalers)。 比方说,像 Meta 这样的公司就不需要英伟达的网络;他们发明了自己的。这些公司确实需要大量可大规模并行化的芯片来训练自己的机器学习算法,这意味着他们必须给英伟达交钱,贡献其高额利润。也就难怪 Meta 和之前的谷歌一样,正在开发自己的芯片。 这就是所有大公司都可能要走的一个过程:他们不需要英伟达的系统,他们需要的是可以满足他们的要求,跑他们的系统的芯片。这就是为什么英伟达会如此卖力地投入到人工智能和加速计算的大众化的原因:从长期看,规模化的关键在于为除了最大玩家之外的所有人开发系统。穿越山谷的诀窍在于,在英伟达目前的大客户停止购买英伟达昂贵的芯片之前,就能看到该生态体系的发展。 黄仁勋曾经预见到 3D 加速器将会被商品化,于是用着色器来实现跨越;你会感觉到他对芯片也有同样的恐惧,所以现在正在跃进到做起系统来。 在山谷中的元宇宙: Omniverse Nucleus 在去年春天的采访中,我曾问黄仁勋英伟达会不会自己做云服务; 如果我们要做服务的话,除了我们自己做的东西以外(如果必须自己做的话),这个服务还会运行在世界各地的 GPU 上,跑在每个云上面。我们公司制定的其中一条规则是不浪费公司的资源去做已经有的东西。如果某个东西已经存在,比方说 x86 CPU 这样的东西,我们会直接用。或者如果某个东西已经有了,我们会选择与其合作,因为我们不想把自己稀缺的资源浪费在那上面。所以,如果云端已经有了某个东西了,我们绝对只会用那个东西,或者让那个东西去做就行了,这样会更好。但是,如果做有些东西对我们来说行得通,但对他们没有意义的话,我们会找他们去做;如果其他人不想做,那么我们可能会决定自己去做。对于要做什么我们是很有选择性的,但对于其他人已经做过的,我们态度非常坚决,那就是不做。 事实证明,有个东西是没有其他人想做的,那就是为 3D 对象建立一个通用的数据库,这个数据库的用处是英伟达所谓的 Omniverse。这些对象可以是用于制造业或供应链的超级详细的毫米精度级对象,也可以是为虚拟世界生成的奇幻对象和建筑物;按照黄仁勋的设想,任何在 Omniverse Nucleus 上做开发的人都可以使用这些对象。 此处的天国之城是一个跨行业和娱乐可用的 3D 体验世界——如果你愿意的话,可称之为元宇宙的 Omniverse,它们全都连接上英伟达的云服务——且其雄心壮志足以让扎克伯格感到脸红!出于同样的原因,这座山谷似乎更加漫长,更加黑暗:你不仅需要创建所有这些资产以及 3D 体验,而且需要让整个市场相信其实用性和必要性。为一个尚不存在的世界建设一个云服务,就是为了攀上目前仍然看不见的高度。 黄仁勋与英伟达的雄心壮志之大是毫无疑问的了,尽管有些人可能会质疑同时穿越三座山谷的智慧如何;除了那场游戏业的完美风暴以外,他们的股票本身仍走不出山谷也许也是合理的。 不过,值得考虑的是, 英伟达客户(无论是消费者客户还是企业客户)对公司感到沮丧的首要原因是价格:英伟达的 GPU 价格昂贵,而且公司的利润(除了最近几个季度以外)非常高。不过,就英伟达的情况而言,其定价权直接来自英伟达自己的创新,这既体现在既定工作负载的绝对性能方面,也体现在其对 CUDA 生态体系的投资、为全新的工作负载创造出来的工具上。 换句话说,因为过去承担了自己现在正在着手的事情的那种风险,英伟达已经赢得了被憎恨的权利。举个例子,假设未来对所有游戏的期望不仅仅是要能光线追踪,而且要对所有粒子进行全方位的模拟:英伟达在硬件上的投资将意味着它会像光栅化时代一样主宰那个时代。同样地,如果 AI 应用被大众化,而且可供所有企业使用,而不只是超大规模的企业能用的话,那么英伟达的价值定位将是掌握整个长尾。再者,如果我们进入了元宇宙的世界的话,那么英伟达不仅在基础设施方面有领先优势,而且在让那个世界成为现实所必需的基本对象库方面也有领先优势(当然了,这些对象将在 AI 生成的空间里利用光线追踪点亮),从而让英伟达成为该领域最重要的基础设施。 这些赌注未必全都能获得回报;不过,我确实欣赏这个愿景之大胆,如果英伟达将来得以穿过山谷,到达天国之城,从而获得可观利润的话,我也不会嫉妒的。 来源:金色财经
lg
...
金色财经
2022-10-10
上一页
1
•••
12
13
14
15
16
下一页
24小时热点
特朗普宣布对欧盟和墨西哥商品征收30%关税,金融圈大佬如何看?
lg
...
黄金周评:金价上演“过山车”,震荡中守住涨势!地缘风险叠加通胀预期,机构预判后市或突破上行
lg
...
德银警告:若特朗普罢免鲍威尔,将引发美元与美债抛售潮
lg
...
前首席经济顾问警告:美国“债务冲击”风险逼近,财政路线如同“失控学生贷款”
lg
...
本周展望:美股冲高后迎“大考” 财报和CPI通胀数据将揭示关税冲击?
lg
...
最新话题
更多
#Web3项目情报站#
lg
...
6讨论
#SFFE2030--FX168“可持续发展金融企业”评选#
lg
...
36讨论
#链上风云#
lg
...
109讨论
#VIP会员尊享#
lg
...
1989讨论
#CES 2025国际消费电子展#
lg
...
21讨论