全球数字财富领导者
财富汇
|
美股投研
|
客户端
|
旧版
|
北美站
|
FX168 全球视野 中文财经
首页
资讯
速递
行情
日历
数据
社区
视频
直播
点评旗舰店
商品
SFFE2030
外汇开户
登录 / 注册
搜 索
综合
行情
速递
日历
话题
168人气号
文章
成立2年 每名员工价值2100万美元 MosaicML凭什么卖出13亿美元?
go
lg
...
成了对Neeva的收购,而中国国内巨头
美
团
则以20.65亿收购了AI公司光年之外。 然而,最引人瞩目的交易无疑是初创公司MosaicML的收购案。据了解,MosaicML以约13亿美元的价格被大数据巨头Databricks收购,其估值在本次交易中翻了六倍,成为了今年上半年最大的收购案。仅成立2年时间,拥有60多名员工,是什么撑起了MosaicML的高估值? Databricks收购MosaicML,加速生成式AI技术民主化 Databricks近期正式宣布,以约13亿美元(约93亿元人民币)收购生成式人工智能初创公司MosaicML,以提供为企业构建类ChatGPT工具的服务。 该收购之后,MosaicML 将成为 Databricks Lakehouse 平台的一部分,MosaicML 的整个团队和技术都将纳入Databricks旗下,为企业提供统一的平台来管理数据资产,并且能够使用自己的专有数据来构建、拥有和保护自己的生成式 AI 模型。 MosaicML是一家非常年轻的生成式AI公司,它于2021年成立于旧金山,目前只公开披露过一轮融资,员工仅62人。在上一轮的融资中,其估值为2.2亿美元,也就是说,此次收购MosaicML的估值直接跃升了6倍。此笔交易是截至目前今年生成式AI领域内所公布的最大一笔收购案。就在不久前,云计算巨头Snowflake刚刚宣布收购了另一家生成式AI公司Neeva。在经历了几个月的投资热之后,大型企业对生成式AI初创公司的大规模并购潮似乎正在开启。 Databricks起源于UC伯克利,曾参与Apache Spark项目开发。作为数据存储和分析巨头,截至2022年估值310亿美元,帮助AT&T、壳牌、Walgreens等大型公司处理数据。前段时间,刚开源了自己大模型Dolly,旨在以更少参数实现与ChatGPT类似的效果。而在云计算更加普及后,Spark提出的“湖仓一体”理念,深深影响了一批大数据初创企业。自2013年成立后,Databricks火速成长为全球最火的Data Infra公司。去年,Databricks公布的年收入超过10亿美元,而在2021年8月完成最新一轮融资后,其最新估值达到380亿美金。 MosaicML MPT系列模型的优势 MosaicML的MPT系列模型是从HuggingFace PretrainedModel基类中子类化的,与HuggingFace生态系统完全兼容。MPT-7B模型是MosaicML最受欢迎的模型之一,拥有数十亿个参数,可以处理超过2,000种自然语言处理任务。其中,MPT-7B的优化层包括FlashAttention和低精度层范数等,可以让该模型比传统训练方法快2-7倍,资源的近线性可伸缩性确保了具有数十亿参数的模型可以在几小时内训练,而不是过去的几天。MosaicML还发布了新的可商用的开源大语言模型MPT-30B,拥有300亿参数,并且性能优于GPT-3。 数据来源:MT-Bench对MosaicML主流模型进行的评估 MPT系列模型的优势在于它们的高效性和低成本。使用大量数据进行“训练”的人工智能模型的复杂度急剧上升,训练一个模型现在至少要花费数百万美元,除了大公司之外,其他中小型企业普遍都无法承受。而MosaicML的MPT系列模型可以让企业以更低的成本和更高的效率训练自己的语言模型,从而可以更轻松地应用生成式AI技术,实现更好的业务表现。大多数开源语言模型只能处理最多具有几千个tokens的序列(参见图 1)。但是,借助 MosaicML 平台和 8xA100-40GB 的单个节点,用户可以轻松微调 MPT-7B 以处理高达 65k 的上下文长度。处理这种极端上下文长度适应的能力来自ALiBi,这是MPT-7B中的关键架构选择之一。 例如,《了不起的盖茨比》的全文不到68k个Token。在一个测试中,模型StoryWriter阅读了《了不起的盖茨比》并生成了一个尾声。模型生成的尾声之一如图 2 所示。StoryWriter在大约20秒内(每分钟约15万字)读完了《了不起的盖茨比》。由于序列长度较长,其“打字”速度比其他MPT-7B型号慢,每分钟约105个单词。尽管 StoryWriter 的上下文长度为 65k 进行了微调,但 ALiBi 使模型能够推断出比训练更长的输入:在《了不起的盖茨比》的情况下为 68k 个Token,在测试中高达 84k 个标记。 图2:MPT-7B-StoryWriter-65k+ 为《了不起的盖茨比》写了尾声。尾声的结果是提供《了不起的盖茨比》的全文(大约 68k 个Token)作为模型的输入,后跟“尾声”一词,并允许模型继续生成。 生成式AI技术的普及 生成式AI技术是人工智能的一种分支,它利用大量的数据和深度学习算法,能够自动生成原始文本、图像和计算机代码等内容。这种技术的出现,让人们可以更加便捷地处理数据、分析数据,更好地服务于人类的需求。随着大数据和人工智能技术的快速发展,生成式AI技术已经被广泛应用于自然语言处理、图像识别和虚拟现实等领域。例如,在自然语言处理领域中,GPT-4已经成为了最受欢迎的生成式AI模型之一,可以用于生成文章、翻译语言和回答问题等任务。在图像识别领域,StyleGAN2能够生成高质量的图像,可以用于游戏开发、影视制作和虚拟现实等领域。 MosaicML的CEO Naveen Rao此前曾表示,自 2018 年以来,使用大量数据进行“训练”的人工智能模型的复杂度急剧上升,训练一个模型现在至少要花费数百万美元,除了大公司之外,其他中小型企业普遍都无法承受。而此次收购之后,Databricks的Lakehouse 平台和 MosaicML 技术的联合产品将能够让企业可以使用自己的专有数据来简单、快速、低成本进行生成式AI模型的训练和构建,在让用户拥有数据的控制权和所有权的情况下,可以进行自定义 AI 模型开发。根据Databricks的相关说法,在 Databricks 和 MosaicML的平台和技术支持下,企业训练和使用 LLMs 的成本将显著降低,预计可以降至数千美元左右。这为生成式AI的普及提供了便利。 Databricks收购MosaicML的意义 Databricks收购MosaicML的主要目的是加速生成式AI技术的发展和民主化。通过将两家公司的技术和资源整合起来,Databricks可以更好地满足客户的需求,提供更高效、更便捷的解决方案。具体而言,该收购将带来以下几个方面的改变: 1. 更高效的大语言模型 Databricks收购MosaicML后,可以将MPT系列模型集成到其Lakehouse平台中,为客户提供更高效、更低成本的大语言模型。这将有助于企业更好地处理自然语言处理任务,提高业务效率和准确性。 2.更快的模型训练速度 MosaicML的MPT系列模型具有快速训练的特点,这将有助于Databricks提供更快速的模型训练服务。这对于需要快速响应市场需求的企业来说尤为重要,可以帮助他们更好地满足客户的需求。 3. 更高的民主化程度 Databricks收购MosaicML也意味着生成式AI技术的民主化程度将会进一步提高。MosaicML的MPT系列模型可以让中小型企业更轻松地训练自己的语言模型,从而可以更好地应用生成式AI技术,实现更好的业务表现。这将有助于推动生成式AI技术的发展和应用,促进人工智能技术的普及和发展。 总结 生成式人工智能应用程序旨在根据用户的自然语言提示生成原始文本、图像和计算机代码。自去年11月人工智能初创公司OpenAI推出在线生成AI聊天机器人ChatGPT以来,人们对这项技术的兴趣激增。“每个组织都应该能够从人工智能革命中受益,并对其数据的使用方式有更多的控制。Databricks 和 MosaicML 有一个难以置信的机会来实现人工智能的民主化,并使 Lakehouse 成为构建生成式人工智能的最佳场所。”Databricks 联合创始人兼首席执行官 Ali Ghodsi表示。 Databricks收购MosaicML的意义不仅在于加速生成式AI技术的发展和民主化,更在于将两家公司的技术和资源整合起来,为客户提供更高效、更便捷的解决方案。随着人工智能技术的快速发展和应用,生成式AI技术将扮演着越来越重要的角色,Databricks收购MosaicML的举动也体现了各企业对于这个方向的重视和投资。像Anthropic和OpenAI这样的公司将现成的语言模型授权给企业,然后企业在其上构建生成AI应用程序。在对这些模型的强劲商业需求的推动下,为像MosaicML这样的初创公司创造了机会。从Snowflake和Databricks接连的收购步伐中我们可以看到,大型科技公司对于生成式AI技术正在从自主研发、战略投资逐步迈向兼并收购阶段。 参考来源: https://www.databricks.com/company/newsroom/press-releases/databricks-signs-definitive-agreement-acquire-mosaicml-leading-generative-ai-platform https://mattturck.com/mosaic/ https://twitter.com/lmsysorg/status/1672077353533730817/photo/1 https://www.mosaicml.com/blog/mpt-7b#appendix-eval https://www.mosaicml.com/blog/mpt-30b 来源:金色财经
lg
...
金色财经
2023-08-06
光大证券:零售行业继续关注行业政策,短期业绩为王
go
lg
...
亿元用于发放消费券;上海市体育局将联合
美
团
、大众点评于2023年8月5日至9月3日陆续发放500万元体育消费券等。光大证券认为未来一段时间地方政府有可能陆续提出其他促消费举措,有利于自上而下推动消费复苏,短期政策面仍然有继续发酵的可能性。2023年中报业绩也陆续披露,高估值的消费品公司或将相对承压,需要超市场预期的业绩增速消化高估值压力。
lg
...
金融界
2023-08-06
市场综述 | 大金融强势撑住行情,超导概念“复活”
go
lg
...
科技股全天表现强势,京东集团涨超3%,
美
团
、快手、网易、阿里巴巴涨超2%,小米集团、百度集团涨超1%。 证券业“定向降准”落地,中资券商股普遍上涨,中州证券涨近5%,中信证券涨超3%。惟国联证券尾盘转跌至9%。 影视股表现强势,猫眼娱乐涨超17%。阿里影业、欢喜传媒涨超4%。据猫眼专业版数据,2023年7月国内电影总票房87.16亿元,观影人次2.11亿,总场次1181.8万场。7月共11部影片单月破亿。 复星旅游文化涨近13%,公司昨晚公告,预计中期归母溢利不少于4.3亿元,同比扭亏为盈。 韩国放出第二段LK-99悬浮视频,超导概念股尾盘拉升。 另一方面,军工股、煤炭股、香港本地地产股全天表现萎靡,中船防务录得3连跌,电力股、航空股多数走低。 A股 周五,沪指今日冲高回落。截至收盘,上证综指涨7.62点,涨幅0.23%,报3288.08点;深证成指涨74.64点,涨幅0.67%,报11238.06点;沪深300指数涨15.6点,涨幅0.39%,报4020.58点;创业板指涨21.39点,涨幅0.95%,报2263.37点;科创50指数涨5.41点,涨幅0.56%,报975.78点。 券商等大金融板块继续活跃,首创证券、天茂集团涨停,指南针、信达证券、太平洋、国信证券、瑞丰银行等多股午后炸板。8月3日,中国结算表示,拟自2023年10月起进一步降低股票类业务最低结算备付金缴纳比例,将该比例由现行的16%调降至平均接近13%,并正式实施股票类业务最低结算备付金缴纳比例差异化安排。 超导概念股午后大涨,百利电气封板,国缆检测触及20cm涨停,全天振幅超32%。韩国团队第二篇论文三作HuynTak Kim放出了第二个LK-99半悬浮视频。 数据要素、金融软件股拉升,安硕信息、卓创资讯、恒银科技、顶点软件涨停,高伟达、拉卡拉涨超14%,中国联通一度触板。 美股 美股三大指数期货在盘前时段集体上涨。市场准备迎接美国非农数据。 亚马逊盘前涨9%。公司二季度业绩超预期,告别盈利衰退,三季度指引炸裂。 苹果盘前跌近2%。公司营收和EPS超预期,大中华区营收显著利好,但七年来首次营收三季连降,iPad收入超预期跳水20%。 美国超导盘前涨超8%。此前韩国团队放出第二段LK-99悬浮视频,华科大新论文首证抗磁性。 特百惠盘前飙涨超50%。特百惠发布公告,称已经与贷款机构敲定了债务重组协议,按照协议规定将减少和重新分配约1.5亿美元的现金、利息以及各项费用,还包括了对3.48亿美元本金的债务进行展期。 每日优鲜盘前大涨40%,两投资者入股,获近2亿“救命款”。
lg
...
老虎证券
2023-08-04
成立2年每名员工价值2100万美元 MosaicML凭什么卖出13亿美元?
go
lg
...
成了对Neeva的收购,而中国国内巨头
美
团
则以20.65亿收购了AI公司光年之外。 然而,最引人瞩目的交易无疑是初创公司MosaicML的收购案。据了解,MosaicML以约13亿美元的价格被大数据巨头Databricks收购,其估值在本次交易中翻了六倍,成为了今年上半年最大的收购案。仅成立2年时间,拥有60多名员工,是什么撑起了MosaicML的高估值? Databricks收购MosaicML,加速生成式AI技术民主化 Databricks近期正式宣布,以约13亿美元(约93亿元人民币)收购生成式人工智能初创公司MosaicML,以提供为企业构建类ChatGPT工具的服务。 该收购之后,MosaicML 将成为 Databricks Lakehouse 平台的一部分,MosaicML 的整个团队和技术都将纳入Databricks旗下,为企业提供统一的平台来管理数据资产,并且能够使用自己的专有数据来构建、拥有和保护自己的生成式 AI 模型。 MosaicML是一家非常年轻的生成式AI公司,它于2021年成立于旧金山,目前只公开披露过一轮融资,员工仅62人。在上一轮的融资中,其估值为2.2亿美元,也就是说,此次收购MosaicML的估值直接跃升了6倍。此笔交易是截至目前今年生成式AI领域内所公布的最大一笔收购案。就在不久前,云计算巨头Snowflake刚刚宣布收购了另一家生成式AI公司Neeva。在经历了几个月的投资热之后,大型企业对生成式AI初创公司的大规模并购潮似乎正在开启。 Databricks起源于UC伯克利,曾参与Apache Spark项目开发。作为数据存储和分析巨头,截至2022年估值310亿美元,帮助AT&T、壳牌、Walgreens等大型公司处理数据。前段时间,刚开源了自己大模型Dolly,旨在以更少参数实现与ChatGPT类似的效果。而在云计算更加普及后,Spark提出的“湖仓一体”理念,深深影响了一批大数据初创企业。自2013年成立后,Databricks火速成长为全球最火的Data Infra公司。去年,Databricks公布的年收入超过10亿美元,而在2021年8月完成最新一轮融资后,其最新估值达到380亿美金。 MosaicML MPT系列模型的优势 MosaicML的MPT系列模型是从HuggingFace PretrainedModel基类中子类化的,与HuggingFace生态系统完全兼容。MPT-7B模型是MosaicML最受欢迎的模型之一,拥有数十亿个参数,可以处理超过2,000种自然语言处理任务。其中,MPT-7B的优化层包括FlashAttention和低精度层范数等,可以让该模型比传统训练方法快2-7倍,资源的近线性可伸缩性确保了具有数十亿参数的模型可以在几小时内训练,而不是过去的几天。MosaicML还发布了新的可商用的开源大语言模型MPT-30B,拥有300亿参数,并且性能优于GPT-3。 数据来源:MT-Bench对MosaicML主流模型进行的评估 MPT系列模型的优势在于它们的高效性和低成本。使用大量数据进行“训练”的人工智能模型的复杂度急剧上升,训练一个模型现在至少要花费数百万美元,除了大公司之外,其他中小型企业普遍都无法承受。而MosaicML的MPT系列模型可以让企业以更低的成本和更高的效率训练自己的语言模型,从而可以更轻松地应用生成式AI技术,实现更好的业务表现。大多数开源语言模型只能处理最多具有几千个tokens的序列(参见图 1)。但是,借助 MosaicML 平台和 8xA100-40GB 的单个节点,用户可以轻松微调 MPT-7B 以处理高达 65k 的上下文长度。处理这种极端上下文长度适应的能力来自ALiBi,这是MPT-7B中的关键架构选择之一。 例如,《了不起的盖茨比》的全文不到68k个Token。在一个测试中,模型StoryWriter阅读了《了不起的盖茨比》并生成了一个尾声。模型生成的尾声之一如图 2 所示。StoryWriter在大约20秒内(每分钟约15万字)读完了《了不起的盖茨比》。由于序列长度较长,其“打字”速度比其他MPT-7B型号慢,每分钟约105个单词。尽管 StoryWriter 的上下文长度为 65k 进行了微调,但 ALiBi 使模型能够推断出比训练更长的输入:在《了不起的盖茨比》的情况下为 68k 个Token,在测试中高达 84k 个标记。 图2:MPT-7B-StoryWriter-65k+ 为《了不起的盖茨比》写了尾声。尾声的结果是提供《了不起的盖茨比》的全文(大约 68k 个Token)作为模型的输入,后跟“尾声”一词,并允许模型继续生成。 生成式AI技术的普及 生成式AI技术是人工智能的一种分支,它利用大量的数据和深度学习算法,能够自动生成原始文本、图像和计算机代码等内容。这种技术的出现,让人们可以更加便捷地处理数据、分析数据,更好地服务于人类的需求。随着大数据和人工智能技术的快速发展,生成式AI技术已经被广泛应用于自然语言处理、图像识别和虚拟现实等领域。例如,在自然语言处理领域中,GPT-4已经成为了最受欢迎的生成式AI模型之一,可以用于生成文章、翻译语言和回答问题等任务。在图像识别领域,StyleGAN2能够生成高质量的图像,可以用于游戏开发、影视制作和虚拟现实等领域。 MosaicML的CEO Naveen Rao此前曾表示,自 2018 年以来,使用大量数据进行“训练”的人工智能模型的复杂度急剧上升,训练一个模型现在至少要花费数百万美元,除了大公司之外,其他中小型企业普遍都无法承受。而此次收购之后,Databricks的Lakehouse 平台和 MosaicML 技术的联合产品将能够让企业可以使用自己的专有数据来简单、快速、低成本进行生成式AI模型的训练和构建,在让用户拥有数据的控制权和所有权的情况下,可以进行自定义 AI 模型开发。根据Databricks的相关说法,在 Databricks 和 MosaicML的平台和技术支持下,企业训练和使用 LLMs 的成本将显著降低,预计可以降至数千美元左右。这为生成式AI的普及提供了便利。 Databricks收购MosaicML的意义 Databricks收购MosaicML的主要目的是加速生成式AI技术的发展和民主化。通过将两家公司的技术和资源整合起来,Databricks可以更好地满足客户的需求,提供更高效、更便捷的解决方案。具体而言,该收购将带来以下几个方面的改变: 1. 更高效的大语言模型 Databricks收购MosaicML后,可以将MPT系列模型集成到其Lakehouse平台中,为客户提供更高效、更低成本的大语言模型。这将有助于企业更好地处理自然语言处理任务,提高业务效率和准确性。 2.更快的模型训练速度 MosaicML的MPT系列模型具有快速训练的特点,这将有助于Databricks提供更快速的模型训练服务。这对于需要快速响应市场需求的企业来说尤为重要,可以帮助他们更好地满足客户的需求。 3. 更高的民主化程度 Databricks收购MosaicML也意味着生成式AI技术的民主化程度将会进一步提高。MosaicML的MPT系列模型可以让中小型企业更轻松地训练自己的语言模型,从而可以更好地应用生成式AI技术,实现更好的业务表现。这将有助于推动生成式AI技术的发展和应用,促进人工智能技术的普及和发展。 总结 生成式人工智能应用程序旨在根据用户的自然语言提示生成原始文本、图像和计算机代码。自去年11月人工智能初创公司OpenAI推出在线生成AI聊天机器人ChatGPT以来,人们对这项技术的兴趣激增。“每个组织都应该能够从人工智能革命中受益,并对其数据的使用方式有更多的控制。Databricks 和 MosaicML 有一个难以置信的机会来实现人工智能的民主化,并使 Lakehouse 成为构建生成式人工智能的最佳场所。”Databricks 联合创始人兼首席执行官 Ali Ghodsi表示。 Databricks收购MosaicML的意义不仅在于加速生成式AI技术的发展和民主化,更在于将两家公司的技术和资源整合起来,为客户提供更高效、更便捷的解决方案。随着人工智能技术的快速发展和应用,生成式AI技术将扮演着越来越重要的角色,Databricks收购MosaicML的举动也体现了各企业对于这个方向的重视和投资。像Anthropic和OpenAI这样的公司将现成的语言模型授权给企业,然后企业在其上构建生成AI应用程序。在对这些模型的强劲商业需求的推动下,为像MosaicML这样的初创公司创造了机会。从Snowflake和Databricks接连的收购步伐中我们可以看到,大型科技公司对于生成式AI技术正在从自主研发、战略投资逐步迈向兼并收购阶段。 参考来源: https://www.databricks.com/company/newsroom/press-releases/databricks-signs-definitive-agreement-acquire-mosaicml-leading-generative-ai-platform https://mattturck.com/mosaic/ https://twitter.com/lmsysorg/status/1672077353533730817/photo/1 https://www.mosaicml.com/blog/mpt-7b#appendix-eval https://www.mosaicml.com/blog/mpt-30b 来源:金色财经
lg
...
金色财经
2023-08-04
中国房地产业应发挥品牌引领作用,走好高质量发展之路
go
lg
...
O、中国绿色食品有限公司副总经理马祎、
美
团
研究院副院长张薇、抖音集团媒体合作商业化负责人袁子超。 本次大会的一个重磅环节是发布“2023中国房地产品牌价值榜百强榜单及系列榜单”,并为优秀企业、项目颁奖。他们是行业的佼佼者,是品牌赛道上的追光者。 “好企业都产生在危机之中。”曾执掌过4家500强企业的掌门人宁高宁说过。的确,越是困难时期,房地产企业越要坚定发展方向,坚定地做好产品,塑造好品牌价值。因为追光的人终会光芒万丈。
lg
...
金融界
2023-08-04
ChatGPT爆火这半年:热钱、巨头与监管
go
lg
...
万物均成立于这波大模型热潮开始之后。
美
团
联合创始人王慧文在2023年年初成立的光年之外,一度融资5000万美元,已是彼时中国大模型行业为数不多的融资案例。与智谱AI、西湖心辰这类已有大模型为基础的公司不同,光年之外是2023年2月开始,从零开始做大模型,其难度可想而知,6月29日,
美
团
公告宣布收购光年之外的全部权益,总代价包括现金约2.33亿美元(合人民币16.7亿元)、债务承担约3.67亿元、及现金1元。 “起码要有自然语言处理背景的人,有一定大模型训练实操经验的人,以及数据处理、大规模算力集群等方面的专业人才。如果同时还要做应用,那应该还要有对应领域的产品经理和运营人才。”陈润泽如此描述一个大模型核心团队的标配。 大公司的AI赌注 过去半年中,老牌互联网大厂们的AI新闻漫天纷飞。对AI大模型的投入,看似是在追热点,但如百度、阿里、华为这样的大公司,在AI上投下的赌注,显然不是跟风。 巨头们在AI上的押注很早就已开始,对这些公司来说,AI并不是一个新鲜的话题。虎嗅根据企查查数据不完全统计,各大厂在2018年开始就对人工智能相关的企业有不同程度的投资,从投资企业来看,大多是人工智能应用方面的企业,尽管涉及到一部分AI芯片企业,但是数量并不多,涉及大模型方面的企业几乎没有,并且大厂所投资的人工智能相关的公司大多与其业务息息相关。 大厂投资机构 投资企业数 平均持股比例 最高持股比例 100%持股企业数 阿里巴巴 23 36.25% 100% 5 百度风投 25 5.50% 15% 0 腾讯投资 54 17.54% 100% 2 三家互联网大厂投资AI相关公司情况|数据来源:企查查 2017年阿里达摩院成立,研究对象涵盖机器智能、智联网、金融科技等多个产业领域,将人工智能的能力赋能到阿里的各个业务线中。2018年,百度提出了“All in AI”的战略。 有所不同的是,生成式AI的出现,似乎是一个转折点。对于拥有数据、算力和算法资源优势的科技巨头来说,人工智能对他们已经不光是赋能场景,而是需要承担基础设施的角色,毕竟,生成式AI的出现,意味着针对人工智能产业的分工已经开始。 以百度、阿里、华为、腾讯,四家云供应商为代表的大厂,虽然都宣布了各自的AI策略,但明显各有侧重。 在过去的半年时间里,巨头纷纷发布自己的大模型产品。对于百度、阿里这样的大厂来说,他们入局大模型的时间并不算晚,基本在2019年。 百度自2019年开始研发预训练模型,先后发布了知识增强文心(ERNIE)系列模型。阿里的通义千问大模型也是始于2019年。除了百度和阿里的通用大模型,6月19日,腾讯云发布了行业大模型的研发进展。7月7日,华为云发布了盘古3.0行业大模型产品。 这些侧重也与各家的整体业务,云战略,以及在AI市场里的长期布局有所呼应。 百度的主线业务盈利能力在过去的5年中,出现了较大波动。百度很早就看到了基于搜索的广告业务在国内市场中的问题,对此,百度选择了大力投入AI技术寻找新机会。这些年来,百度不仅邀请过吴恩达、陆奇等业界大佬出任高管,在自动驾驶上投入热情也远超其他大厂。如此关注AI的百度,势必会在这波大模型之争里重手投注。 阿里对通用大模型同样表现出了极大的热情。一直以来,阿里云一直被寄予厚望,阿里希望走通技术路线创造集团的第二增长曲线。在电商业务竞争日趋激烈,市场增长放缓的大环境下,依云而生的AI产业新机遇,无疑是阿里云在国内云市场上再发力的好机会。 相比百度和阿里,腾讯云在大模型方面选择了优先行业大模型,而华为云则公开表示只会关注行业大模型。 对于腾讯来说,近年来主营业务增长稳中向好。在通用大模型的前路尚不明朗的阶段,腾讯对于AI大模型的投注相对谨慎。马化腾在此前的财报电话会上谈及大模型时曾表示:“腾讯并不急于把半成品拿出来展示,关键还是要把底层的算法、算力和数据扎扎实实做好,而且更关键的是场景落地。” 另一方面,从腾讯集团的角度看,腾讯目前有4所AI Lab,去年也发布了万亿参数的混元大模型,腾讯云投身行业大模型方面的动作,更像是一种“不把鸡蛋放在同一个篮子里”的投注策略。 对于华为来说,一直以来都是重手投注研发,过去10年里华为在研发方面的总投入超过9000亿元。但由于手机业务遇到发展障碍,华为在很多技术研发上的整体策略或也正在面临调整。 一方面手机业务是华为C端技术最大的出口,如果手机业务不为通用大模型买单的话,那么华为研发通用大模型的动力就会明显下降。而对于华为来说,把赌注押在能快速落地变现的行业大模型,似乎是这场AI博弈当中的最优解。正如华为云CEO张平安所说“华为没有时间作诗”。 不过,对科技巨头来说,无论赌注多大,只要能赌对,就能够先一步抢占基础设施的市场份额,从而在人工智能时代获得话语权。 拿着锤子找钉子 对于商业公司来说,所有的决策仍然落到经济账上。 即便是一笔不小的投入,越来越多有远见的公司创始人也意识到,这是一项未来必须要做的事情,即便前期投入可能完全看不到回报。 AI大模型的研发需要一笔不小的投入,但越来越多企业创始人、投资人都认为,这是一项”必要投入”,即便眼下完全看不到回报。 由此,很多在上一波AI浪潮下诞生的人工智能公司,都在沉寂良久之后看到了新的曙光。 “3年前,大家都说GPT-3是通向通用人工智能的可能性。”李志飞在2020年就开始带着一班人马研究GPT-3,彼时出门问问正处在一个发展的转折点,他们希望探索新业务,但经过一段时间的研究之后,李志飞的大模型项目中止了,原因之一是当时模型不够大,另外就是找不到商业落地场景。 不过,2022年底ChatGPT问世以后,李志飞仿佛被扎了一剂强心针,因为他和所有人一样,看到了大模型的新机会。今年4月,出门问问发布了自研的大模型产品——序列猴子。眼下,他们准备拿着新发布的大模型“序列猴子”冲刺港交所,出门问问已在5月末递交了招股书。 另一家老牌AI公司也在跟进,去年7月,思必驰向科创板递交了IPO申请,在今年5月被上市审核委员会否决。 俞凯坦言,就连OpenAI,在GPT2阶段也是用微软的V100训练了将近一年的时间,算力和A100差好几个量级。思必驰在大模型前期积累阶段,也是用更为经济的卡做训练。当然,这需要时间作为代价。 相比于自研大模型,一些应用型公司有自己的选择。 一家在线教育公司的总裁张望(化名)告诉虎嗅,过去半年,他们在大模型应用场景的探索上不遗余力,但他们很快发现在落地过程中存在诸多问题,例如成本与投入。这家公司的研发团队有50人-60人,开始做大模型研究以来,他们扩充了研发团队,新招了一些大模型方面的人才,张望说,偏底层模型方面的人才很贵。 张望从未想过从头开发大模型,考虑到数据安全和模型稳定性等问题,他也不打算直接接入API做应用。他们的做法是参考开源大模型,用自己的数据做训练。这也是很多应用公司目前的做法——在大模型之上,用自己的数据做一个行业小模型。张望他们从70亿参数的模型开始,做到100亿,现在在尝试300亿的模型。但他们也发现,随着数据量增多 ,大模型训练会出现的情况是,可能新版本不如上一个版本,就要对参数逐一调整,“这也是必须要走的弯路。”张望说。 张望告诉虎嗅,他们对于研发团队的要求就是——基于公司的业务探索AI大模型场景。 这是一种拿着“锤子”找“钉子”的方法,但并不容易。 “目前最大的难题是找到合适的场景。其实有很多场景,即便用了AI,效果也提升不了太多。”张望说,例如在上课的场景中,可以用AI大模型赋能一些交互模式,包括提醒学员上课功能、回答问题和打标签等,但他们试用了AI大模型之后,发现精准度不行,理解能力和输出能力并不理想。张望的团队尝试过一段时间后,决定在这个场景里暂时放弃AI。 另一家互联网服务商小鹅通,也在AI大模型爆发后第一时间开展了相关业务的探索。小鹅通的主要业务是为线上商家提供数字化运营工具,包括营销、客户管理以及商业变现。 小鹅通联合创始人兼COO樊晓星告诉虎嗅,今年4月,当越来越多的应用基于生成式AI诞生时,小鹅通看到了这个技术背后的潜力,“例如MidJourney,生成式AI对于设计图像生成方面的提效确实有目共睹。”樊晓星她们在内部专门组织了AI研究的业务线,寻找与自身业务相关的落地案例。 樊晓星说,在将大模型接入业务的过程中,她所考虑的就是成本和效率,“大模型的投入成本还是蛮高的。”她说。 互联网行业的“钉子”算是好找的,AI落地真正的难点还是在工业、制造这样的实体产业。 俞凯告诉虎嗅,这一波AI浪潮仍然是螺旋式上升、波浪式前进,在产业落地上面的矛盾一点都没变化,只是换了一个套壳而已。所以从这个意义上看,这两次AI浪潮的规律是相同的,最好的办法就是学习历史——“上一波AI浪潮的教训,这次就别再犯了。” 虽然很多厂商在AI大模型的落地方面都喊出了“产业先行”的口号,但很多实体产业的场景真的很难与目前的AI大模型相匹配。比如在一些工业检测场景应用的AI视觉检测系统,即便对AI模型的需求没有高到10亿参数的量级,但初期的训练数据仍然捉襟见肘。 以一个简单的风电巡检场景为例,一个风场的巡检量达到七万台次,但同样的裂痕数据,可能只会出现一次,机器可以学习的数据量是远远不够的。扩博智能风电硬件产品总监柯亮告诉虎嗅,目前风机叶片的巡检机器人还做不到100%的精确分析叶片裂痕,因为可供训练和分析的数据量太小了,要形成可靠的全自动巡检和识别,还需要大量的数据积累和人工分析。 不过,在工业数据积累较好的场景中,AI大模型已经可以做到辅助管理复杂的三维模型零件库了。国内某飞机制造企业的零件库就已经落地了一款基于第四范式“式说”大模型的零件库辅助工具。可以在十万余个三维建模零件中,通过自然语言实现三维模型搜索,以三维模型搜三维模型,甚至还能完成三维模型的自动装配。这些功能,在很多卡住制造业脖子的CAD、CAE工具中都需要经过多步操作才能完成。 今天的大模型和几年前的AI一样面临落地难题,一样要拿着锤子找钉子。有人乐观地相信,今天的锤子和过去完全不一样了,但到了真金白银地为AI付费时,结果却有些不同。 彭博社在7月30日发布的Markets Live Pulse调查显示,在514名受调投资者中,约77%的人计划在未来六个月内增加或保持对科技股的投资,且只有不到10%的投资者认为科技行业面临严重的泡沫危机。然而这些看好科技行业发展的投资者中,却只有一半人对AI技术持开放的接受态度。 50.2%的受访者表示,目前还不打算为购买AI工具付费,多数投资公司也没有计划将AI大范围应用到交易或投资中。 卖铲子的人 “如果你在1848年的淘金热潮里去加州淘金,一大堆人会死掉,但卖勺子和铲子的人,永远可以赚钱。”陆奇在一次演讲时说。 高峰(化名)想当这样的“卖铲子的人”,准确地说,是能够“在中国卖好铲子的人”。 作为一名芯片研究者,高峰大部分科研时间都在AI芯片上。过去一两个月,他感到了一种急迫性——他想做一家基于RISC-V架构的CPU公司。在一家茶室,高峰向虎嗅描绘了未来的图景。 然而,要从头开始做AI芯片,无论是在芯片界,还是在科技圈,都像是一个“天方夜谭”。 当AI大模型的飞轮飞速启动时,背后的算力逐渐开始跟不上这一赛道中玩家的步伐了。暴涨的算力需求,使英伟达成了最大的赢家。但GPU并非解决算力的全部。CPU、GPU,以及各种创新的AI芯片,组成了大模型的主要算力提供中心。 “你可以把CPU比喻为市区,GPU就是开发的郊区。”高峰说,CPU和AI芯片之间,需要通过一个叫做PCIE的通道连接,数据传给AI芯片,然后AI芯片再把数据回传给CPU。如果大模型的数据量变大,一条通道就会变得拥挤,速度就上不去,因此需要拓宽这条路,而只有CPU能够决定这条通路的宽窄,需要设置几车道。 这意味着,中国在大模型上,即便突破了AI芯片,仍有最关键的CPU难以破局。哪怕是在AI训练上,越来越多的任务可以被指派给GPU承担,但CPU依旧是最关键的“管理者”角色。 2023WAIC大模型展区展出的部分国产芯片 自1971年英特尔造出世界上第一块CPU至今50余年,在民用服务器、PC市场,早已是英特尔和AMD的天下,英特尔更是建立起涵盖知识产权、技术积累、规模成本、软件生态于一体的整个商业模式壁垒,且这种壁垒从未衰退。 要完全抛开X86架构和ARM架构,基于一个全新架构研发完全自主的CPU芯片,可以说是“九十九死一生”,基于MIPS指令集的龙芯,在这条路上走了20多年,更不用说是 RISC-V这样未被充分开垦和验证过的开源架构。 指令集,就像一块块土地,基于指令集开发芯片,就相当于是买地盖房子。X86的架构是闭源的,只允许Intel生态的芯片,ARM的架构需要支付IP授权费,而RISC-V是免费的开源架构。 产业界和学术界已经看到了这样的机会。 2010年,加州伯克利两位教授的研究团队从零开始开发了一个全新的指令集,就是RISC-V,这个指令集完全开源,他们认为CPU的指令集不应该属于任何一家公司。 “RISC-V或许是中国CPU的一道曙光。”高峰说。2018年,他在院所孵化了一家AI芯片公司,彼时他表示,自己不想错过 AI浪潮发展的机会,这一次,他依然想抓住,而这个切入点,就是RISC-V。在大模型以及如今国产替代的时代,这个需求显得更为紧迫,毕竟,极端地考虑一下,如果有一天,中国公司用不了A100了,又该怎么办。 “如果要取代ARM和X86,RISC-V的CPU需要性能更强,也需要和Linux上做商业操作系统的人参与到代码的开发中。”高峰说。 高峰不是第一个意识到这个机会的人,一位芯片行业投资人告诉虎嗅,他曾与一家芯片创业公司创始人聊起,用RISC-V的架构去做GPU的机会。如今,在中国已有一些基于RISC-V架构做GPU的公司,但生态依旧是他们面临的最大的问题。 “Linux已经示范了这条路是可以走通的。”高峰说,在Linux这套开源操作系统中,诞生了红帽这样的开源公司,如今许多云服务都建立在Linux系统上。“需要足够多的开发者。”高峰提出了一个方法。这条路很难,但走通了,将是一条光明的道路。 飞轮转得太快了 大模型的“应激反应”下,感到急迫的不光是高峰。 国内某AI大模型公司联创告诉虎嗅,今年初他们也曾短暂上线过一款对话大模型,但随着ChatGPT的升温,有关部门提高了对大模型安全性的重视,并对他们提出了很多整改要求。 “在没有特别明确的监管政策出来之前,我们不会轻易把产品开放给普通用户,主要还是To B的逻辑。”左手医生CEO张超认为,在《管理办法》出台之前,贸然将生成式AI产品开放给C端用户,风险很大。“现阶段,我们一方面在持续迭代优化,另外一方面也在持续关注政策、法规,保证技术的安全性。” “生成式AI的监管办法还不明确,大模型公司的产品和服务普遍很低调。”一家数字化技术供应商,在6月发布了一款基于某云厂商通用大模型开发的应用产品,在发布会上,该公司技术负责人向虎嗅表示,他们被这家云厂商要求严格保密,如果透露使用了谁的大模型,他们会被视为违约。而对于为何要对案例保密,这位负责人分析,可能很大一部分原因是要规避监管风险。 在全球都对AI提高警惕的当下,任何市场都不能接受监管的“真空期”。 7月13日,网信办等七个部门正式发布了《生成式人工智能服务管理暂行办法》(下文简称“《管理办法》”),该办法自2023年8月15日起施行。 “《管理办法》出台后,政策会从问题导向转为目标导向发展就是我们的目标。”观韬中茂律师事务所合伙人王渝伟认为,新规是重“疏”而不重“堵”。 浏览美国的风险管理库,是王渝伟每天必需的功课,“我们正在为利用GPT等大模型进行细分行业的商业应用提供风控合规的方案,建立一套合规治理框架。”王渝伟说。 美国的AI巨头们正排着队向国会表忠心。7月21日,谷歌、OpenAI、微软、Meta、亚马逊、AI创业公司Inflection、Anthropic,七家最具影响力的美国AI公司,就在白宫签署了一份自愿承诺。保证在向公众发布AI系统前允许独立安全专家测试他们的系统。并与政府和学术界分享有关他们系统安全的数据。他们还将开发系统,当图像、视频或文本是由AI生成时向公众发出警告,采用的方法是“加水印”。 7家美国AI巨头排代表在白宫签署AI承诺 此前,美国国会听证会上,OpenAI的创始人山姆·奥特曼表示,需要为人工智能模型创建一套安全标准,包括评估其危险能力。例如,模型必须通过某些安全测试,例如它们是否可以“自我复制”和“渗透到野外”。 或许山姆·奥特曼自身也没有想到,AI的飞轮会转得这么快,甚至有失控的风险。 “我们一开始还没有意识到这件事情这么紧迫。”王渝伟说,直到上门来咨询的公司创始人越来越多。他感到,这一次的人工智能浪潮正在发生与过去截然不同的变化。 今年年初,一家最早接入大模型的文生图公司找到王渝伟,这家公司希望把自己的业务引入中国,因此,他们想了解这方面的数据合规业务。紧接着,王渝伟发现,这类的咨询越来越多,更明显的变化是,前来咨询的不再是公司的法务,而是创始人。“生成式AI的出现,原有的监管逻辑已经很难适用。”王渝伟说。 从事大数据法律工作多年的王渝伟发现,生成式AI与上一波AI浪潮正在呈现更加底层的变化。例如,上一次的AI更多是基于算法进行推荐,还有就是一些人脸识别,都是针对一个场景,针对一些小模型,在具体应用场景当中进行训练,涉及的法律问题不外乎知识产权、隐私保护的问题。而在这个生成式AI生态之上的不同角色,例如提供底层大模型的公司,在大模型之上接入做应用的公司,存储数据的云厂商等,对应的监管都不尽相同。 目前大模型所带来的伴生风险已经有了共识,业界明白,商业化应用势必会放大这种风险,要想保持业务的连续性,就需要重视监管。 难点就是,“如何找到一条既能做好监管,又能不影响行业发展的路径。”王渝伟说。 结语 对于整个行业来说,在对技术加深探讨的同时,也正在引发更为深远的思考。 在AI逐渐占据科技产业的主导地位之时,要如何确保技术的公正、公平和透明性?当头部公司紧紧掌控技术和资金流向时,如何确保中小企业和初创公司不被边缘化?大模型的开发和应用蕴含巨大潜力,但盲目跟风是否会导致我们忽视其他创新技术? “从短期来看AI大模型正在被严重高估。但从长期看,AI大模型被严重低估了。” 半年时间里,AI热浪翻涌。然而对于中国的创业公司和科技巨头来说,在热炒的市场氛围中,如何保持清醒的判断,做出长远的规划和投资,将是检验其真正实力和远见的关键。 来源:金色财经
lg
...
金色财经
2023-08-04
ETF日报|港股三大指数齐涨!恒生科技ETF基金(513260)收涨0.78%,成交额超4279万元
go
lg
...
重股分别为理想汽车-W(02015)、
美
团
-W(03690)、快手-W(01024)、阿里巴巴-SW(09988)、京东集团-SW(09618)、小米集团-W(01810)、腾讯控股(00700)、网易-S(09999)、百度集团-SW(09888)、小鹏汽车-W(09868),前十大权重股合计占比71.05%。 兴业证券指出,7月24日高层会议在地产形势、资本市场、债务化解、稳内需等方面的政策导向积极,之后,相关政策密集落地。政策预期改善的窗口期将有望在8月份延续。8月份,行情进入反弹的右侧,获利回吐的压力有所增加,行情有望在过去一年恒生指数的底部区域18000点-23000点震荡上行,上行的空间跟中国经济基本面的复苏力度一致。 风险提示:界面有连云呈现的所有信息仅作为参考,不构成投资建议,一切投资操作信息不能作为投资依据。投资有风险,入市需谨慎!
lg
...
有连云
2023-08-04
港股收评:恒生指数涨0.61%、恒生科技指数涨2.06% 影视股走强猫眼娱乐涨超17%
go
lg
...
W涨1.33%,网易-S涨2.49%,
美
团
-W涨2.71%,快手-W涨2.76%,哔哩哔哩-W涨6.58%。 中资券商股走强,中信证券涨3%。8月3日夜,中国结算发布消息称,拟自2023年10月起进一步降低股票类业务最低结算备付金缴纳比例,将该比例由现行的16%调降至平均接近13%,并正式实施股票类业务最低结算备付金缴纳比例差异化安排。 股票类业务最低结算备付金缴纳比例调降被视为证券业“定向降准”,将有助于鼓励结算参与人及客户尽早完成资金交收,放松券商资金限制,缓解市场流动性压力。分析人士称,目前来看,经纪业务实力强劲的券商或是最大受益者。 影视股表现强势,猫眼娱乐涨超17%。据猫眼专业版数据,2023年7月国内电影总票房87.16亿元,观影人次2.11亿,总场次1181.8万场。7月共11部影片单月破亿。另外,猫眼娱乐预计中期纯利升最多1.8倍,中金称其业绩预告好于预期,主要系内容板块表现超预期。 复星旅游文化涨超12%,公司昨晚公告,预计中期归母溢利不少于4.3亿元,同比扭亏为盈。报告期内,得益于中国国内旅游重启后强劲的度假需求释放,三亚亚特兰蒂斯的营业额预计将取得不低于人民币8.4亿元,较2022年同期增长不低于73%。
lg
...
金融界
2023-08-04
重磅利好齐发!恒生科技指数ETF(513180)成交总额超24亿元!哔哩哔哩领涨!
go
lg
...
涨超7%,蔚来、小鹏汽车一度涨超4%,
美
团
、京东、快手一度涨超3%,阿里巴巴涨超2%。恒生科技指数ETF(513180)盘中一度涨超2%,截至发文,成交总额超24亿元! 具体来看,中国结算于昨日称,拟引入差异化最低结算备付金缴纳比例机制,自今年10月起,将缴纳比例由现行的16%调降至平均13%左右,预计释放资金超过300亿元。此外,昨日三大官媒共同发声,分别从降低印花税、实施T+0交易制度等多方面,为活跃资本市场、提振投资者信心出谋划策。近期0724会议中“活跃资本市场”的相关举措相继落地,投资者数量和两市成交量或将迎来持续增长。 华夏基金认为,近日恒生科技指数大跌后已有企稳迹象,且目前仍处于历史估值低位,指数覆盖互联网、新能源车等高成长板块,长期景气度向好,有较大反弹空间。恒生科技指数ETF(513180)为普通投资者布局港股科技板块提供了门槛更低、更为便捷的投资工具,且支持T+0交易,看好港股机会的普通投资者可借道ETF布局。 风险提示:界面有连云呈现的所有信息仅作为参考,不构成投资建议,一切投资操作信息不能作为投资依据。投资有风险,入市需谨慎!
lg
...
有连云
2023-08-04
港股午评:恒生指数涨0.99%,恒生科技指数涨1.96%,影视娱乐股表现出色
go
lg
...
W涨1.49%,网易-S涨3.08%,
美
团
-W涨2.85%,快手-W涨2.69%,哔哩哔哩-W涨7.17%。 中资券商股集体走强,国联证券一度涨近13%,现涨2.25%;弘业期货涨超5%,申万宏源香港涨超4%,中信证券、中州证券涨超3%。消息面上, 8月3日深夜,中国结算发布消息称,拟自2023年10月起进一步降低股票类业务最低结算备付金缴纳比例,将该比例由现行的16%调降至平均接近13%,并正式实施股票类业务最低结算备付金缴纳比例差异化安排。 股票类业务最低结算备付金缴纳比例调降被视为证券业“定向降准”,将有助于鼓励结算参与人及客户尽早完成资金交收,放松券商资金限制,缓解市场流动性压力。分析人士称,目前来看,经纪业务实力强劲的券商或是最大受益者。 受高票房暑期档影响,影视娱乐股涨幅活跃,猫眼娱乐大涨17%领涨。消息面上,猫眼娱乐公司昨晚公告,预计2023年上半年的收入将介乎约人民币21.5亿元至人民币22.5亿元,同比增长约80.5%至88.9%;预计2023年上半年本公司拥有人应占溢利将介乎约人民币3.8亿元至人民币4.3亿元,同比增长约150.2%至183.1%。中金称其业绩预告好于预期,主要系内容板块表现超预期。 内房股今日走强,禹州集团涨超8%,中骏集团控股涨超7%,没地美的置业涨近5%,合生创展集团、领地控股、融创中国等涨超3%。消息面上,8月3日,央行行长潘功胜主持召开金融支持民营企业发展座谈会。潘功胜指出推进民营企业债券融资支持工具(“第二支箭”)扩容增量,强化金融市场支持民营企业发展。金融机构要深入了解民营企业金融需求,回应民营企业关切和诉求,做好银企融资对接,为民营企业提供可靠、高效、便捷的金融服务。要精准实施差别化住房信贷政策,满足民营房地产企业合理融资需求,促进房地产行业平稳健康发展。 短暂复苏的医药板块今日回调,CRO板块低迷。
lg
...
金融界
2023-08-04
上一页
1
•••
671
672
673
674
675
•••
850
下一页
24小时热点
这些股票突遭猛烈抛售!特朗普重大宣布:新关税要来了
lg
...
周评:鲍威尔释降息重大信号!美元突然暴跌、金价飙升 特朗普关税传大消息
lg
...
张津镭:鲍威尔引爆黄金大涨,下周一开盘操作指南!
lg
...
盛文兵:下周黄金行情大揭秘:趋势走向与最优操作指南
lg
...
许浩:8.22 黄金行情风云变幻,晚间黄金行情走势分析
lg
...
最新话题
更多
#Web3项目情报站#
lg
...
6讨论
#SFFE2030--FX168“可持续发展金融企业”评选#
lg
...
36讨论
#链上风云#
lg
...
113讨论
#VIP会员尊享#
lg
...
1989讨论
#CES 2025国际消费电子展#
lg
...
21讨论