全球数字财富领导者
财富汇
|
美股投研
|
客户端
|
旧版
|
北美站
|
FX168 全球视野 中文财经
首页
资讯
速递
行情
日历
数据
社区
视频
直播
点评旗舰店
商品
SFFE2030
外汇开户
登录 / 注册
搜 索
综合
行情
速递
日历
话题
168人气号
文章
SNOW现金流创新高,成长公司竞争进入下半局
go
lg
...
提高,但运营利润率仍然较低。此外,来自
Databricks
和云计算巨头的竞争威胁也值得关注。
lg
...
老虎证券
2023-11-30
Arm/Instacart上市大涨,美股IPO还有哪些可以期待?
go
lg
...
的股权,但未有相关进展信息 云计算公司
Databricks
Databricks
成立于2013年,创始人来自Apache Spark的创始团队,以及加州大学的部分学者。
Databricks
是一家人工智能(AI) 驱动的数据分析公司,以Apache Spark开源技术为基础,支持用于对数据湖中的大型原始数据集运行查询,创建了一系列的开源项目,包括AI生命周期管理/MLOps (MLFlow)、数据仓库(Delta Lake)、数据可视化(Redash) 以及BI和分析工具 (
Databricks
SQL)。
Databricks
构建了一体化的Lakehouse 架构,为客户提供数据分析、数据工程、数据科学和人工智能方面的服务。与采用AmazonS3打造了云端数据仓库的竞争对手Snowflake不同,
Databricks
推出了集数据湖和数据仓库为一体的Lakehouse,同时发力机器学习,增加业务的人工智能属性。 在收费方式上,不同于Snowflake的打包式收费,
Databricks
采取的是将常规的底层云厂商服务器租赁费用和基于服务器的功能费用分开收取。
Databricks
在一级市场累计进行了9轮融资,其中最后一轮融资于2021年完成,融资规模达16亿美元,公司估值达380亿美元。由于公司每年收入增长率长期保持在30%+,吸引了亚马逊、微软、Salesforce等云计算巨头的投资. 游戏公司Epic Games Epic Games成立于1991年,是一家游戏产业公司,以《堡垒之夜》发行商的身份为大家所知,但公司业务涵盖游戏开发、游戏开发引擎(Unreal Engine)、游戏发行等多个环节,先后推出了Epic Games Store、Epic Online Services,并收购了社交视频应用 Houseparty。 2021年,Epic Games的收入为57亿美元,主要收入构成为: 通过游戏赚取收入,其中大部分收入来自免费游戏Fortnite的虚拟货币 V-bucks内购商品; Epic Games向采用虚幻引擎Unreal Engine运行的游戏,收取其一定比例游戏收入; Epic Games Store 在游戏销售中抽取12%左右的佣金,虽然比Steam低 2.5倍,但仍有50%的利润率。 作为游戏行业的独角兽,Epic Games在一级市场也是吸引了Fidelity、Baillie Gifford、迪士尼、KKR等众多知名机构的投资,而腾讯更是拿下了公司40%的股权。 2022年上半年,Epic Games完成了最近一轮融资,融资规模为20亿美元,投资方为索尼集团以及乐高集团背后的家族控股和投资公司KIRKBI,融资后的估值为315亿美元,而2021年,Epic Games的估值为287亿美元 农业服务电商公司Farmers Business Network Farmers Business Network成立于2014年,通过数据和技术支持,提供直接面向农场的服务平台,减少因农业上游产业高集中度带来的信息不对称和买家较弱的议价能力,具体包括: (1)电商平台:FBN Direct:包括扩大作物保护产品组合、推出作物投入计划工具Acre Pack、扩展物流、新品种研发等。 (2)金融平台:FBN Finance:包括数字贷款平台、农作物和牲畜数字保险平台、谷物营销等。 此外,FBN还向客户提供市场营销服务(市场咨询、作物营销、经纪服务等)、分析(种子选择、作物保护选择、农艺分析等)、社区(农民交流等),以及探索农业相关的碳排放市场。 目前,FBN业务覆盖美国、加拿大和澳大利亚三大农业生产国超过43000家农场,面积超过2.8亿英亩。 FBN在一级市场完成了9轮融资,吸引了淡马锡、谷歌、富达、ADM、贝莱德、凯鹏华盈等知名投资机构和企业,估值已达40亿美元。
lg
...
老虎证券
2023-09-20
美股收盘:道指涨超300点科技股多数走高 Arm上市首日涨24%市值超650亿美元
go
lg
...
资了一家“最有潜力IPO的AI公司”:
Databricks
数据分析和人工智能软件制造商
Databricks
完成了超过5亿美元的I轮融资,对该公司估值达430亿美元,俨然跻身人工智能领域“最当红的炸子鸡”行列。 值得注意的是,在很多科技初创公司估值被大幅削减的当下,
Databricks
不仅股票售价仍为每股73.50美元,大致相当于两年前上一轮融资时的定价,估值还比2021年8月融资16亿美元时的估值380亿美元多出了50亿美元,或溢价13%。员工数约为6000人,较上次融资轮时翻倍。 电动汽车拼不过特斯拉怎么办?大众的难题来了:据称将裁员数百人 由于欧洲市场的电动汽车需求低迷,德国老牌汽车制造商大众集团正考虑裁减德国东部茨维考工厂的员工。 据悉,该工厂共有约1.07万名员工,其中有2000多人签有固定期限合同。消息人士透露,大众考虑裁减部分临时合同工。近300名员工的合同将于10月底到期,届时大众将可能通知他们离开,不再续签。 媒体称,大众汽车计划当地时间周四(9月14日)在德国茨维考工厂召开员工会议,但并未告知会议具体细节。此外,德国萨克森州州长迈克尔·克雷奇默(Michael Kretschmer)的声明也暗示了大众茨威考工厂裁员的消息。
lg
...
金融界
2023-09-15
规模高达520亿美元!关于年内全球最大IPO你需要知道的一切
go
lg
...
在本月晚些时候测试市场。Stripe和
DataBricks
等其他知名公司也将密切关注。因此我们相信,Arm成功走出IPO大门将为这些观望者证明市场潜力。”
lg
...
金融界
2023-09-06
Filecoin:深入探讨分布式数据计算的重要性和商业潜力
go
lg
...
Adobe Spark、Hadoop、
Databricks
、Kubernetes、Kafka、Ray 等计算框架结合起来使用,形成一个连接到集中式 API 服务器的集群系统网络。然而,这些系统无法有效解决网络违规问题以及其他有关数据移动性的监管问题。 这在一定程度上导致机构因数据泄露而遭受数十亿美元的管理罚款和处罚。 自行构建 另一种方法是让开发人员建设定制的协调系统,该系统应具备机构所需的认知度和稳健性。这种方法很新颖,但由于过度依赖少数人来维护和运行系统,往往面临失败风险。 无所作为 令人惊讶的是,大多数情况下,机构对其数据无所作为。例如,一个城市每天可以从监控录像中收集大量数据,但由于成本高昂,这些数据仅支持在本地机器上查看,既不能归档,也不能处理。 构建真正的分布式计算 数据处理痛点主要有两种解决方案。 解决方案一:构建在开源数据计算平台之上 解决方案一:开源数据计算平台 开发人员可以使用开源分布式数据平台进行计算,而不是使用前文提到的定制协调系统。因为该平台开源且可扩展,机构只需构建所需的组件即可。这种设置可满足多云、多计算、非数据中心的应用场景,并能驾驭复杂的监管环境。重要的是,开源社区的访问权限不再依赖于一个或多个开发人员进行系统维护,从而降低了发生故障的可能性。 解决方案二:构建在分布式数据协议之上 在 Bacalhau 和 Lilypad 等先进计算项目的帮助下,开发人员可以更进一步,不仅在解决方案一中提到的开源数据平台上构建系统,还可以在 Filecoin 网络等真正的分布式数据协议上构建系统。 解决方案二:分布式数据计算协议 这意味着机构可以使用分布式协议,这些协议懂得如何以更精细的方式协调和描述用户问题,从而解锁紧邻数据生成和存储位置的计算区域。这种从数据中心到分布式协议的转换可以在理想情况下进行,且仅需对数据科学家的经验做出少量改动。 分布式意味着选择最大化 通过在 Filecoin 网络等分布式协议上进行部署,我们的愿景是用户可以访问同一网络上分布在不同地区的数百(或数千台)机器,并遵循与其他机器相同的协议规则。这本质上为数据科学家打开了一个充满选择的海洋,因为他们可以请求网络: 选择世界上任何地方的数据集。 遵循任何治理结构,无论是 HIPAA、GDPR 还是 FISMA。 尽可能以最低廉的价格运行。 胡安三角|解码缩略语:FHE(完全同态加密),MPC(多方计算),TEE(可信执行环境),ZKP(零知识证明) 说起选择最大化的概念,就不得不提“胡安三角(Juans triangle)”,该术语是在 Protocol Labs 的创始人Juan Benet 解释为何不同用例(在未来)会有不同的分布式计算网络来支持时创造的。 胡安三角提出,计算网络通常需要在隐私、可验证性和性能这三者之间进行权衡,传统的“一刀切”方法很难适用于每种使用情况。相反,分布式协议的模块化特性使不同的分布式网络(或子网络)能够满足不同的用户需求——无论是隐私、可验证性还是性能。最终,我们将根据自己认为重要的因素进行优化。届时,将有许多方服务提供者(如三角形内方框所示)填补这些空白,并使分布式计算成为现实。 总而言之,数据处理是一个复杂的问题,需要开箱即用的解决方案。利用开源数据计算来替代传统的集中式系统是很好的第一步。最终,在 Filecoin 网络等分布式协议上部署计算平台,可以根据用户的个性化需求自由配置计算资源,这在大数据和人工智能时代至关重要。 来源:金色财经
lg
...
金色财经
2023-09-02
Databricks
正在洽谈新一轮融资 估值将达430亿美元
go
lg
...
知情人士透露,美国大数据及人工智能公司
Databricks
Inc.正与T. Rowe Price洽谈新一轮融资事宜,该公司的估值将因此达到430亿美元。知情人士说,谈判是初步的,可能会破裂。如果本轮融资成功,
Databricks
的估值将大大高于在两年前由Counterpoint Global领投的那轮融资中获得的380亿美元的估值。
lg
...
金融界
2023-08-26
详解Web3原生数据管道的意义、挑战以及对行业的影响
go
lg
...
解决方案(如 Snowflake 和
Databricks
)正在迅速发展,拥有庞大的客户群体,通过在管道中运营各个层次进行垂直整合,并引领行业发展。 5.2 数据源市场中的机遇 当数据变得更易获取且处理过程改进时,成功的用例开始出现。这会产生一个正循环效应,即数据源和收集工具会爆发性地出现——自 2010 年以来,由于构建数据管道的技术取得了巨大进展,每年收集的数字数据的类型和数量呈指数增长。将这一背景应用于 Web3 市场,未来可以在链上递归生成许多数据源。这也意味着区块链将扩展到各种业务领域。在这一点上,我们可以预期通过 Ocean Protocol 等数据市场或 Helium 和 XNET 等 DeWi(去中心化无线)解决方案以及存储解决方案来推进数据采集。 5.3 重要的是有意义的数据和分析 然而,最重要的是不断询问应准备哪些数据以提取真正需要的见解。没有什么比为了构建数据管道而没有明确的假设来验证而构建数据管道更浪费的了。现有市场通过构建数据管道实现了众多创新,但也通过反复的无意义失败付出了无数的代价。对于技术堆栈的发展进行建设性讨论也是很好的,但行业需要时间来思考和讨论更基本的问题,例如应该将哪些数据存储在区块空间中,或者数据应该用于何种目的。“目标”应该是通过可操作的情报和用例实现 Web3 的价值,而在这个过程中,开发多个基本组件并完成管道是实现这一目标的“手段”。 来源:金色财经
lg
...
金色财经
2023-08-13
福布斯发布2023云计算100强榜单,OpenAI位列第一,人工智能正在改变云计算
go
lg
...
,也是首次上榜,排名第二的是大数据巨头
Databricks
。 福布斯分析,人工智能正在改变我们所熟知的云计算,今年,人工智能无处不在:新晋第一名OpenAI和第二名
Databricks
提供工具,帮助企业构建人工智能功能。第三名的Stripe是一家金融科技公司,采用了这项技术来打击欺诈;第四名的Canva将人工智能功能嵌入了其设计软件中;第七名的Grammarly推出了一款利用人工智能几乎瞬间生成段落文本的写作助手。
lg
...
金融界
2023-08-10
成立2年 每名员工价值2100万美元 MosaicML凭什么卖出13亿美元?
go
lg
...
cML以约13亿美元的价格被大数据巨头
Databricks
收购,其估值在本次交易中翻了六倍,成为了今年上半年最大的收购案。仅成立2年时间,拥有60多名员工,是什么撑起了MosaicML的高估值? 近期,AI领域掀起了一股投资收购热潮。全球知名企业Salesforce向Anthropic注资4.5亿美元,而Runway则成功筹集到了1.41亿美元的资金。此外,雪花公司也宣布完成了对Neeva的收购,而中国国内巨头美团则以20.65亿收购了AI公司光年之外。 然而,最引人瞩目的交易无疑是初创公司MosaicML的收购案。据了解,MosaicML以约13亿美元的价格被大数据巨头
Databricks
收购,其估值在本次交易中翻了六倍,成为了今年上半年最大的收购案。仅成立2年时间,拥有60多名员工,是什么撑起了MosaicML的高估值?
Databricks
收购MosaicML,加速生成式AI技术民主化
Databricks
近期正式宣布,以约13亿美元(约93亿元人民币)收购生成式人工智能初创公司MosaicML,以提供为企业构建类ChatGPT工具的服务。 该收购之后,MosaicML 将成为
Databricks
Lakehouse 平台的一部分,MosaicML 的整个团队和技术都将纳入
Databricks
旗下,为企业提供统一的平台来管理数据资产,并且能够使用自己的专有数据来构建、拥有和保护自己的生成式 AI 模型。 MosaicML是一家非常年轻的生成式AI公司,它于2021年成立于旧金山,目前只公开披露过一轮融资,员工仅62人。在上一轮的融资中,其估值为2.2亿美元,也就是说,此次收购MosaicML的估值直接跃升了6倍。此笔交易是截至目前今年生成式AI领域内所公布的最大一笔收购案。就在不久前,云计算巨头Snowflake刚刚宣布收购了另一家生成式AI公司Neeva。在经历了几个月的投资热之后,大型企业对生成式AI初创公司的大规模并购潮似乎正在开启。
Databricks
起源于UC伯克利,曾参与Apache Spark项目开发。作为数据存储和分析巨头,截至2022年估值310亿美元,帮助AT&T、壳牌、Walgreens等大型公司处理数据。前段时间,刚开源了自己大模型Dolly,旨在以更少参数实现与ChatGPT类似的效果。而在云计算更加普及后,Spark提出的“湖仓一体”理念,深深影响了一批大数据初创企业。自2013年成立后,
Databricks
火速成长为全球最火的Data Infra公司。去年,
Databricks
公布的年收入超过10亿美元,而在2021年8月完成最新一轮融资后,其最新估值达到380亿美金。 MosaicML MPT系列模型的优势 MosaicML的MPT系列模型是从HuggingFace PretrainedModel基类中子类化的,与HuggingFace生态系统完全兼容。MPT-7B模型是MosaicML最受欢迎的模型之一,拥有数十亿个参数,可以处理超过2,000种自然语言处理任务。其中,MPT-7B的优化层包括FlashAttention和低精度层范数等,可以让该模型比传统训练方法快2-7倍,资源的近线性可伸缩性确保了具有数十亿参数的模型可以在几小时内训练,而不是过去的几天。MosaicML还发布了新的可商用的开源大语言模型MPT-30B,拥有300亿参数,并且性能优于GPT-3。 数据来源:MT-Bench对MosaicML主流模型进行的评估 MPT系列模型的优势在于它们的高效性和低成本。使用大量数据进行“训练”的人工智能模型的复杂度急剧上升,训练一个模型现在至少要花费数百万美元,除了大公司之外,其他中小型企业普遍都无法承受。而MosaicML的MPT系列模型可以让企业以更低的成本和更高的效率训练自己的语言模型,从而可以更轻松地应用生成式AI技术,实现更好的业务表现。大多数开源语言模型只能处理最多具有几千个tokens的序列(参见图 1)。但是,借助 MosaicML 平台和 8xA100-40GB 的单个节点,用户可以轻松微调 MPT-7B 以处理高达 65k 的上下文长度。处理这种极端上下文长度适应的能力来自ALiBi,这是MPT-7B中的关键架构选择之一。 例如,《了不起的盖茨比》的全文不到68k个Token。在一个测试中,模型StoryWriter阅读了《了不起的盖茨比》并生成了一个尾声。模型生成的尾声之一如图 2 所示。StoryWriter在大约20秒内(每分钟约15万字)读完了《了不起的盖茨比》。由于序列长度较长,其“打字”速度比其他MPT-7B型号慢,每分钟约105个单词。尽管 StoryWriter 的上下文长度为 65k 进行了微调,但 ALiBi 使模型能够推断出比训练更长的输入:在《了不起的盖茨比》的情况下为 68k 个Token,在测试中高达 84k 个标记。 图2:MPT-7B-StoryWriter-65k+ 为《了不起的盖茨比》写了尾声。尾声的结果是提供《了不起的盖茨比》的全文(大约 68k 个Token)作为模型的输入,后跟“尾声”一词,并允许模型继续生成。 生成式AI技术的普及 生成式AI技术是人工智能的一种分支,它利用大量的数据和深度学习算法,能够自动生成原始文本、图像和计算机代码等内容。这种技术的出现,让人们可以更加便捷地处理数据、分析数据,更好地服务于人类的需求。随着大数据和人工智能技术的快速发展,生成式AI技术已经被广泛应用于自然语言处理、图像识别和虚拟现实等领域。例如,在自然语言处理领域中,GPT-4已经成为了最受欢迎的生成式AI模型之一,可以用于生成文章、翻译语言和回答问题等任务。在图像识别领域,StyleGAN2能够生成高质量的图像,可以用于游戏开发、影视制作和虚拟现实等领域。 MosaicML的CEO Naveen Rao此前曾表示,自 2018 年以来,使用大量数据进行“训练”的人工智能模型的复杂度急剧上升,训练一个模型现在至少要花费数百万美元,除了大公司之外,其他中小型企业普遍都无法承受。而此次收购之后,
Databricks
的Lakehouse 平台和 MosaicML 技术的联合产品将能够让企业可以使用自己的专有数据来简单、快速、低成本进行生成式AI模型的训练和构建,在让用户拥有数据的控制权和所有权的情况下,可以进行自定义 AI 模型开发。根据
Databricks
的相关说法,在
Databricks
和 MosaicML的平台和技术支持下,企业训练和使用 LLMs 的成本将显著降低,预计可以降至数千美元左右。这为生成式AI的普及提供了便利。
Databricks
收购MosaicML的意义
Databricks
收购MosaicML的主要目的是加速生成式AI技术的发展和民主化。通过将两家公司的技术和资源整合起来,
Databricks
可以更好地满足客户的需求,提供更高效、更便捷的解决方案。具体而言,该收购将带来以下几个方面的改变: 1. 更高效的大语言模型
Databricks
收购MosaicML后,可以将MPT系列模型集成到其Lakehouse平台中,为客户提供更高效、更低成本的大语言模型。这将有助于企业更好地处理自然语言处理任务,提高业务效率和准确性。 2.更快的模型训练速度 MosaicML的MPT系列模型具有快速训练的特点,这将有助于
Databricks
提供更快速的模型训练服务。这对于需要快速响应市场需求的企业来说尤为重要,可以帮助他们更好地满足客户的需求。 3. 更高的民主化程度
Databricks
收购MosaicML也意味着生成式AI技术的民主化程度将会进一步提高。MosaicML的MPT系列模型可以让中小型企业更轻松地训练自己的语言模型,从而可以更好地应用生成式AI技术,实现更好的业务表现。这将有助于推动生成式AI技术的发展和应用,促进人工智能技术的普及和发展。 总结 生成式人工智能应用程序旨在根据用户的自然语言提示生成原始文本、图像和计算机代码。自去年11月人工智能初创公司OpenAI推出在线生成AI聊天机器人ChatGPT以来,人们对这项技术的兴趣激增。“每个组织都应该能够从人工智能革命中受益,并对其数据的使用方式有更多的控制。
Databricks
和 MosaicML 有一个难以置信的机会来实现人工智能的民主化,并使 Lakehouse 成为构建生成式人工智能的最佳场所。”
Databricks
联合创始人兼首席执行官 Ali Ghodsi表示。
Databricks
收购MosaicML的意义不仅在于加速生成式AI技术的发展和民主化,更在于将两家公司的技术和资源整合起来,为客户提供更高效、更便捷的解决方案。随着人工智能技术的快速发展和应用,生成式AI技术将扮演着越来越重要的角色,
Databricks
收购MosaicML的举动也体现了各企业对于这个方向的重视和投资。像Anthropic和OpenAI这样的公司将现成的语言模型授权给企业,然后企业在其上构建生成AI应用程序。在对这些模型的强劲商业需求的推动下,为像MosaicML这样的初创公司创造了机会。从Snowflake和
Databricks
接连的收购步伐中我们可以看到,大型科技公司对于生成式AI技术正在从自主研发、战略投资逐步迈向兼并收购阶段。 参考来源: https://www.
databricks
.com/company/newsroom/press-releases/
databricks-signs-definitive-agreement-acquire-mosaicml-leading-generative-ai-platform
https://mattturck.com/mosaic/ https://twitter.com/lmsysorg/status/1672077353533730817/photo/1 https://www.mosaicml.com/blog/mpt-7b#appendix-eval https://www.mosaicml.com/blog/mpt-30b 来源:金色财经
lg
...
金色财经
2023-08-06
成立2年每名员工价值2100万美元 MosaicML凭什么卖出13亿美元?
go
lg
...
cML以约13亿美元的价格被大数据巨头
Databricks
收购,其估值在本次交易中翻了六倍,成为了今年上半年最大的收购案。仅成立2年时间,拥有60多名员工,是什么撑起了MosaicML的高估值? 近期,AI领域掀起了一股投资收购热潮。全球知名企业Salesforce向Anthropic注资4.5亿美元,而Runway则成功筹集到了1.41亿美元的资金。此外,雪花公司也宣布完成了对Neeva的收购,而中国国内巨头美团则以20.65亿收购了AI公司光年之外。 然而,最引人瞩目的交易无疑是初创公司MosaicML的收购案。据了解,MosaicML以约13亿美元的价格被大数据巨头
Databricks
收购,其估值在本次交易中翻了六倍,成为了今年上半年最大的收购案。仅成立2年时间,拥有60多名员工,是什么撑起了MosaicML的高估值?
Databricks
收购MosaicML,加速生成式AI技术民主化
Databricks
近期正式宣布,以约13亿美元(约93亿元人民币)收购生成式人工智能初创公司MosaicML,以提供为企业构建类ChatGPT工具的服务。 该收购之后,MosaicML 将成为
Databricks
Lakehouse 平台的一部分,MosaicML 的整个团队和技术都将纳入
Databricks
旗下,为企业提供统一的平台来管理数据资产,并且能够使用自己的专有数据来构建、拥有和保护自己的生成式 AI 模型。 MosaicML是一家非常年轻的生成式AI公司,它于2021年成立于旧金山,目前只公开披露过一轮融资,员工仅62人。在上一轮的融资中,其估值为2.2亿美元,也就是说,此次收购MosaicML的估值直接跃升了6倍。此笔交易是截至目前今年生成式AI领域内所公布的最大一笔收购案。就在不久前,云计算巨头Snowflake刚刚宣布收购了另一家生成式AI公司Neeva。在经历了几个月的投资热之后,大型企业对生成式AI初创公司的大规模并购潮似乎正在开启。
Databricks
起源于UC伯克利,曾参与Apache Spark项目开发。作为数据存储和分析巨头,截至2022年估值310亿美元,帮助AT&T、壳牌、Walgreens等大型公司处理数据。前段时间,刚开源了自己大模型Dolly,旨在以更少参数实现与ChatGPT类似的效果。而在云计算更加普及后,Spark提出的“湖仓一体”理念,深深影响了一批大数据初创企业。自2013年成立后,
Databricks
火速成长为全球最火的Data Infra公司。去年,
Databricks
公布的年收入超过10亿美元,而在2021年8月完成最新一轮融资后,其最新估值达到380亿美金。 MosaicML MPT系列模型的优势 MosaicML的MPT系列模型是从HuggingFace PretrainedModel基类中子类化的,与HuggingFace生态系统完全兼容。MPT-7B模型是MosaicML最受欢迎的模型之一,拥有数十亿个参数,可以处理超过2,000种自然语言处理任务。其中,MPT-7B的优化层包括FlashAttention和低精度层范数等,可以让该模型比传统训练方法快2-7倍,资源的近线性可伸缩性确保了具有数十亿参数的模型可以在几小时内训练,而不是过去的几天。MosaicML还发布了新的可商用的开源大语言模型MPT-30B,拥有300亿参数,并且性能优于GPT-3。 数据来源:MT-Bench对MosaicML主流模型进行的评估 MPT系列模型的优势在于它们的高效性和低成本。使用大量数据进行“训练”的人工智能模型的复杂度急剧上升,训练一个模型现在至少要花费数百万美元,除了大公司之外,其他中小型企业普遍都无法承受。而MosaicML的MPT系列模型可以让企业以更低的成本和更高的效率训练自己的语言模型,从而可以更轻松地应用生成式AI技术,实现更好的业务表现。大多数开源语言模型只能处理最多具有几千个tokens的序列(参见图 1)。但是,借助 MosaicML 平台和 8xA100-40GB 的单个节点,用户可以轻松微调 MPT-7B 以处理高达 65k 的上下文长度。处理这种极端上下文长度适应的能力来自ALiBi,这是MPT-7B中的关键架构选择之一。 例如,《了不起的盖茨比》的全文不到68k个Token。在一个测试中,模型StoryWriter阅读了《了不起的盖茨比》并生成了一个尾声。模型生成的尾声之一如图 2 所示。StoryWriter在大约20秒内(每分钟约15万字)读完了《了不起的盖茨比》。由于序列长度较长,其“打字”速度比其他MPT-7B型号慢,每分钟约105个单词。尽管 StoryWriter 的上下文长度为 65k 进行了微调,但 ALiBi 使模型能够推断出比训练更长的输入:在《了不起的盖茨比》的情况下为 68k 个Token,在测试中高达 84k 个标记。 图2:MPT-7B-StoryWriter-65k+ 为《了不起的盖茨比》写了尾声。尾声的结果是提供《了不起的盖茨比》的全文(大约 68k 个Token)作为模型的输入,后跟“尾声”一词,并允许模型继续生成。 生成式AI技术的普及 生成式AI技术是人工智能的一种分支,它利用大量的数据和深度学习算法,能够自动生成原始文本、图像和计算机代码等内容。这种技术的出现,让人们可以更加便捷地处理数据、分析数据,更好地服务于人类的需求。随着大数据和人工智能技术的快速发展,生成式AI技术已经被广泛应用于自然语言处理、图像识别和虚拟现实等领域。例如,在自然语言处理领域中,GPT-4已经成为了最受欢迎的生成式AI模型之一,可以用于生成文章、翻译语言和回答问题等任务。在图像识别领域,StyleGAN2能够生成高质量的图像,可以用于游戏开发、影视制作和虚拟现实等领域。 MosaicML的CEO Naveen Rao此前曾表示,自 2018 年以来,使用大量数据进行“训练”的人工智能模型的复杂度急剧上升,训练一个模型现在至少要花费数百万美元,除了大公司之外,其他中小型企业普遍都无法承受。而此次收购之后,
Databricks
的Lakehouse 平台和 MosaicML 技术的联合产品将能够让企业可以使用自己的专有数据来简单、快速、低成本进行生成式AI模型的训练和构建,在让用户拥有数据的控制权和所有权的情况下,可以进行自定义 AI 模型开发。根据
Databricks
的相关说法,在
Databricks
和 MosaicML的平台和技术支持下,企业训练和使用 LLMs 的成本将显著降低,预计可以降至数千美元左右。这为生成式AI的普及提供了便利。
Databricks
收购MosaicML的意义
Databricks
收购MosaicML的主要目的是加速生成式AI技术的发展和民主化。通过将两家公司的技术和资源整合起来,
Databricks
可以更好地满足客户的需求,提供更高效、更便捷的解决方案。具体而言,该收购将带来以下几个方面的改变: 1. 更高效的大语言模型
Databricks
收购MosaicML后,可以将MPT系列模型集成到其Lakehouse平台中,为客户提供更高效、更低成本的大语言模型。这将有助于企业更好地处理自然语言处理任务,提高业务效率和准确性。 2.更快的模型训练速度 MosaicML的MPT系列模型具有快速训练的特点,这将有助于
Databricks
提供更快速的模型训练服务。这对于需要快速响应市场需求的企业来说尤为重要,可以帮助他们更好地满足客户的需求。 3. 更高的民主化程度
Databricks
收购MosaicML也意味着生成式AI技术的民主化程度将会进一步提高。MosaicML的MPT系列模型可以让中小型企业更轻松地训练自己的语言模型,从而可以更好地应用生成式AI技术,实现更好的业务表现。这将有助于推动生成式AI技术的发展和应用,促进人工智能技术的普及和发展。 总结 生成式人工智能应用程序旨在根据用户的自然语言提示生成原始文本、图像和计算机代码。自去年11月人工智能初创公司OpenAI推出在线生成AI聊天机器人ChatGPT以来,人们对这项技术的兴趣激增。“每个组织都应该能够从人工智能革命中受益,并对其数据的使用方式有更多的控制。
Databricks
和 MosaicML 有一个难以置信的机会来实现人工智能的民主化,并使 Lakehouse 成为构建生成式人工智能的最佳场所。”
Databricks
联合创始人兼首席执行官 Ali Ghodsi表示。
Databricks
收购MosaicML的意义不仅在于加速生成式AI技术的发展和民主化,更在于将两家公司的技术和资源整合起来,为客户提供更高效、更便捷的解决方案。随着人工智能技术的快速发展和应用,生成式AI技术将扮演着越来越重要的角色,
Databricks
收购MosaicML的举动也体现了各企业对于这个方向的重视和投资。像Anthropic和OpenAI这样的公司将现成的语言模型授权给企业,然后企业在其上构建生成AI应用程序。在对这些模型的强劲商业需求的推动下,为像MosaicML这样的初创公司创造了机会。从Snowflake和
Databricks
接连的收购步伐中我们可以看到,大型科技公司对于生成式AI技术正在从自主研发、战略投资逐步迈向兼并收购阶段。 参考来源: https://www.
databricks
.com/company/newsroom/press-releases/
databricks-signs-definitive-agreement-acquire-mosaicml-leading-generative-ai-platform
https://mattturck.com/mosaic/ https://twitter.com/lmsysorg/status/1672077353533730817/photo/1 https://www.mosaicml.com/blog/mpt-7b#appendix-eval https://www.mosaicml.com/blog/mpt-30b 来源:金色财经
lg
...
金色财经
2023-08-04
上一页
1
•••
4
5
6
7
8
下一页
24小时热点
中美突发重磅!特朗普称可能对中国征收新的关税 究竟怎么回事?
lg
...
中国房市重大信号!曾准确预警恒大爆雷的分析师 突然改变对房市复苏的看法
lg
...
中国突传重磅!南华早报:中国化解地方政府债务行动取得首个重大胜利
lg
...
眼下,做空几乎不合常理!特朗普突然加大关税攻势、美联储降息火焰再升高
lg
...
特朗普突然下狠手!特朗普调高对印度商品关税至50% 美印关系陷入严重对峙
lg
...
最新话题
更多
#Web3项目情报站#
lg
...
6讨论
#SFFE2030--FX168“可持续发展金融企业”评选#
lg
...
36讨论
#链上风云#
lg
...
111讨论
#VIP会员尊享#
lg
...
1989讨论
#CES 2025国际消费电子展#
lg
...
21讨论