全球数字财富领导者
财富汇
|
美股投研
|
客户端
|
旧版
|
北美站
|
FX168 全球视野 中文财经
首页
资讯
速递
行情
日历
数据
社区
视频
直播
点评旗舰店
商品
SFFE2030
外汇开户
登录 / 注册
搜 索
综合
行情
速递
日历
话题
168人气号
文章
AI 赋予文字无限力量:“由文本生成一切”的一年
go
lg
...
会觉得一点也不酷,有些人会觉得一般般。
创业
公司
都建立在新的最大的模型上,新闻和学术文章都在赞扬和批评新模型,美国以外的国家也在发展自己的大语言模型参与竞争。 2021年1月,OpenAI 推出了一个名为CLIP的新人工智能模型,它拥有与GPT-3类似的zero-shot能力。CLIP向连接文本和其他形态迈出了一步,它提出了一种简单、优雅的方法来训练图像和文本模型,当有人进行查询时,整个系统可以在可能的标题选择中,把图像与相应的标题相匹配。 DALL-E可能是第一个“善于”从文本产生图像的系统,与CLIP在同一天发布。CLIP在第一代DALL-E中没有使用,但在其后续版本中发挥了重要作用。由于能够根据文字提示生成合理的图像,DALL-E上了多个新闻头条。 扩散模型(diffusion model)登场 虽然一些人工智能先驱感叹,如果我们想实现“真正的”通用智能,深度学习不是办法,但“文本到图像”模型无疑适合运用深度神经网络的力量。深度学习模型中的一些互补性进展,使得“文本到图像”模型取得了进一步的飞跃:扩散模型被发现,实现了极高的生成图像质量。(参见论文Diffusion Models Beat GANs on Image Synthesis)。 DALL-E 2的发布时间距离DALL-E约一年多,利用扩散模型的技术进步,创造出比DALL-E更逼真的图像。而DALL-E 2的风头很快就被Imagen和Parti抢去——前者使用扩散模型展现了惊艳的水准,后者则摸索出了一种补充性的自回归方法来生成图像。 故事并没有到此结束。Midjourney是一个用于图像生成的商业扩散模型,由同名实验室发布。稳定扩散(Stable Diffusion)模型借鉴了对潜在扩散模型的新研究,可以用有限的计算资源进行训练,因为Stability AI公司选择公开该模型及其权重,Stable Diffusion的发布受到了万众瞩目。 神经网络架构的创新并不是促成以上改进的唯一原因。雅虎在2015年发布了Yahoo Flickr Creative Commons 100 Million Dataset(YFCC100M),在当时是有史以来最大的公共多媒体数据集合。最近,Large-scale Artificial Intelligence Open Network(LAION)发布的数据集更在规模上令YFCC100M黯然失色。2021年发布的LAION-400M包含4亿个图像-文本对,然后是2022年发布的LAION-5B包含50亿个图像-文本对。 值得注意的是,虽然这些数据集能够大规模地训练图像-文本模型,但它们并非没有问题。The Decoder的报告曾发现LAION的数据集包含未经同意发布的病人图像,研究人员也评论说,该数据集的质量并不纯正。如此庞大的数据集必然会有其他的伦理问题出现,OpenReview上的作者和审稿人似乎就这些问题进行了颇有见地的意见交流。 从文本到一切! 如果人工智能模型可以将文本转换为图像,那么它们可以将文本转换为视频吗?当然可以!10月份,一批从文本到视频的生成软件面市。Meta公司的Make-a-Video可以根据文本和静止图像生成视频,而谷歌大脑的Phenaki可以根据一系列构成故事的提示词生成一个连续视频。 也许更有用,或者说更令人担忧的是,这些生成模型也能胜任代码的编写。当用户注意到GPT-3可以写出像样的代码时,GPT-3开始登上新闻头条,声名鹊起。从那时起,代码生成语言模型的能力有了很大的进步。OpenAI的Codex能将自然语言转化为代码,并且许多其他类似的模型也在纷纷效仿。DeepMind的AlphaCode也能以合理的水平解决编程问题。 这些技术进步彼此追赶的速度令人印象深刻,正如Kevin Roose等人所评论的那样:“AI的发展速度如此惊人,怎么强调都不为过。我刚写完一篇关于AI惊人发展速度的文章,市场上就有了一些重大发布,包括OpenAI的Whisper(语音到文字的转录软件)和文字到视频的生成软件。” 而且AI还可以更进一步:文本也可以转化为其他媒介,包括音频、动作和3D。 而且,正如我们的同伴Jacky Liang博士所展示的,语言模型甚至可以根据自然语言指令编写机器人政策代码。 看起来生成式AI的可能性是无穷无尽的。我们只是看到了人工智能模型创造力的雏形。我预计,随着越来越强大的模型开发出来,文本将能够指导大量的发明创新。红杉资本最近发布的《生成式AI应用格局》,已经展示了许多不同的细分赛道。 在一个特定的生成赛道内,有许多可能性和商业领域可以应用这种类型的生成工具。文本生成不仅可以承担文章的写作,还可以承担平台的后期语言调整;图像生成和文本转3D工具可以为游戏、信息应用和市场营销创造各种工艺品;其他应用提供了生成文档的能力。而且,正如上图所指出的,音乐、音频和生物/化学方面的应用还没有到来。 ChatGPT和更多的“文字到文字” 即使是在“文本到文本”领域,也有海量的事情可以做:最近推出的ChatGPT在互联网上炸开了锅,基本上是因为该模型有能力以对话的形式全面回答问题。你可以要求它为你制定一个简单的锻炼计划,写一个课程大纲,建议你做什么,向你某位哲学家的作品,以及其他很多事情。 不够值得注意的是,ChatGPT的知识有严重的局限性。 事实上,如果你要求ChatGPT提供关于某个特定主题的更多细节(例如普鲁斯特关于时间性质的想法),它就会开始自己绕圈子——挺符合你对一篇高中生作文的期望。事实上,ChatGPT的存在可能会改变我们对写作技巧的某些方面的理解。 > 也许有理由感到乐观,如果你把这一切放在一边。也许每个学生现在都能立即进入更高的写作层次,每个学生都可以直接进入写作事业的更精细的方面,任何难以模仿的东西都将变得更明显。逗号连接、主谓不一致、冗长的修饰语等令人头痛的机械性问题都不复存在,写作的基础技能已经直接给定了。 正如我所提到的,ChatGPT似乎还只能对它所阐述的主题作比较浅层次的描述,无法太深入。它可以写得足够流畅,并给你一些所需要的细节,但如果你能提供它所缺乏的深入分析和深刻理解,它就还不能替代你的工作。 文本能超越自己吗? 通过在多模态数据集上训练模型,我们可以理解文字、语言中编码的信息如何映射到图像、三维图像和我们周围世界的其他表现形式。“文本到图像”表明,生成的图像可以反映精确的文字描述。但是生成式AI还不能做到尽善尽美,Stable Diffusion模型在其生成的图像中明显存在着赋予人类正确手指数量的问题。 但值得注意的是,在“文本到图像”系统中,仅仅通过扩大语言模型就能实现改进。Imagen使用仅在文本上训练的T5编码器(110亿个参数),产生的图像比DALL-E 2更逼真,后者的文本编码器已被训练为产生类似于匹配图像嵌入的文本嵌入。 也就是说,将文本转化为其他模态的可能性(我们可以做什么,以及我们用目前的方法能走多远)并不明显。对那些看到真正发展限制的观点,我感同身受:尽管“文本到图像”数据集可以告诉我们这个世界的很多景象,但它们不存在于物质世界中,缺乏像我们一样能够与物体、与其他人类互动的能力,并通过互动从周围世界中收集视觉和非视觉信息。 但是显然,有很多事情可以做。谷歌最近的RT-1(变形机器人)展示了如何利用自然语言来解决机器人任务。 “ChatGPT可以为你策划一场主题派对,但它能帮你在派对结束后打扫屋子吗?很可惜不能。我在谷歌机器人的朋友刚刚公布了RT-1,一款带有眼睛、手臂和轮子的变形机器人!” 正如François Chollet在一次采访中向我指出的那样,在“文本到图像”这个领域,神经网络的能力可以大放异彩。我也对潜在的二级应用场景感到兴奋,比如在文本指导下的分子设计和其他并不显而易见的创意。 然而,我认为要真正发掘“文本到X”模型的潜能,着实需要有更好的界面:我们需要以更好的方式,向模型表达我们的意思、概念和想法。提示工程作为一门学科出现,可以反映出我们目前与GPT-3等模型的交流方式是低效的。 展望未来,我认为在我们使“文本到一切”成为现实的过程中,我们需要解决两个驱动发展的问题: 1. 我们如何构建界面,使我们能够更好地将我们的意图传达给AI模型? 2. 这些模型能够为我们带来哪些有用的生成结果或行动? 但是在实际问题之外,我认为另一个问题更有意思:文本到{文本、图像、视频等}的模型并不完美,但非常好用。在将想法以图像或视频的形式呈现出来这一方面,这些模型远比普通人,甚至是本身颇有艺术造诣的人类要好得多。正如Daniel Herman关于ChatGPT提出的问题:对从事艺术、从事视频制作而言,文本到一切意味着什么?我们是否会进入这样一个时期:艺术的基础知识变得更加商品化,任何人都可以通过不同的媒介,以更精细的艺术手法传递自己的思想?在那里,水彩画的技巧被简化为提示中的文字,剩下的就是人类和AI系统之间的共舞互动? 一如既往,我们不应该夸大这些AI系统的能力——它们经常会出现显而易见的错误。但是,当遇到正确的问题时,AI可以表现得很出色,为人类提供更多空间去做更有趣的事情,并追寻写作、艺术的更高层次。 而且,除了这些直接的应用之外,“文本到X”模型及其基础技术还有哪些尚待探索的进一步应用?研究人员已经在考虑如何使用NLP模型来预测蛋白质的氨基酸序列,这是预测字母序列的一个明显的应用,离生成文本只有一步之遥。投资者和人工智能报告的作者Nathan Benaich,在我最近与他的谈话中提到,他对最先进的扩散模型如何应用于生物和化学领域感到兴奋。 今年是“从文本到一切”的一年,如果说从今年的惊人发展中可以学到什么的话,那就是文本作为一种“发出指令”的媒介,正变得更加强大。你不需要艺术培训,也不需要一套数字艺术软件或绘画工具,也能来把“漂浮的城市”这一想法变成视觉现实。你可以把它说出来或打出来,让它存在。 你将用你的文字创造什么? 来源:DeFi之道 作者:Daniel Bashir 来源:金色财经
lg
...
金色财经
2023-02-26
ChatGPT在一线城市火 元宇宙在二三线城市热
go
lg
...
观论调在行业中盛传,但是,中小型元宇宙
创业
公司
已经将元宇宙概念在二三线城市落地并迅速展开。由此可见,ChatGPT的这把火还并不能扑灭元宇宙的前路。 01 元宇宙中小公司:业务暂未受影响 事实上,发生在一线城市的大厂动荡寒流并未传导到中小型元宇宙公司上。 方糖星球是杭州一家专注于元宇宙空间解决方案的公司,其主要业务线之一就是为线上会议提供各种虚拟场所服务。据方糖星球介绍,尽管今年元宇宙行业面临疫情平稳、概念降温等因素的影响,但公司整体的业务量并未受到波及,甚至还有不少客户主动联系洽谈合作。 “大家普遍认为,随着疫情的消退,日常生活回归正轨。在元宇宙打造线上办公空间的需求就会随之退出历史舞台。”不过,令方糖星球没有想到的是,近期对线上办公空间的需求量不降反增。“我们最近接到好几个客户需求,非常明确告诉我们想要做线上办公空间。” 方糖星球对剁主解释道,客户在不同阶段对线上办公空间的诉求也不同。现阶段,客户打造线上办公空间并不仅仅是为了提升效率,而是通过提供更好的虚拟办公体验来提升员工管理质量。 “首先是提升员工的归属感。很多公司的员工构成比较复杂,因此,员工之间的交流和沟通机会也比较少。打造元宇宙虚拟办公空间后,就可以在元宇宙实现随意走动,四处和同事交流。”同时,在方糖星球和一家外企客户的合作中,客户希望通过线上虚拟空间,更快帮助新员工融入,线上线下一起来推动员工互动,这也成为客户的重要诉求。 持续的探索不仅发生在元宇宙空间赛道,在VR内容方面同样如此,Pinta Studios就是案例之一。作为一家VR内容
创业
公司
,其重点打造的VR游戏《方寸幻镜》在去年刚刚登陆PICO。Pinta Studios CEO雷峥蒙对剁主坦言,现在跟PICO的对接事宜一切如常,除此之外,其他平台也将会陆续上线《方寸幻镜》。 图源:PICO VR微博 “除了VR游戏以外,我们公司还在发力动画电影、VR广告等业务。整体而言,并未受到这次元宇宙退潮言论的冲击。”雷峥蒙认为,这次的舆论影响波及最大的应该是资本市场以及即将在元宇宙领域创业的创业者。因为在虚火褪去之后,他们需要重新考虑是否依然躬身入局。当然,一些用户需求量比较小的元宇宙社交类产品也将会在这轮波动中遭遇到严峻挑战。 不过,多位元宇宙行业人士都对剁主表示,元宇宙和AIGC并非二元对立的关系,AIGC的爆火并不意味着元宇宙的发展就会受阻。实际上,元宇宙和AIGC的发展更应该是相辅相成、互相融合。 “在元宇宙细分赛道的分类中,VR/AR是人机交互从二维平面到三维空间的升级;区块链是改变生产关系、从中心化到去中心化;AIGC是解决生产力的问题。这些技术并不是互斥的,他们会共同并行发展最终带我们走向下一个大时代。”VeeR VR联合创始人陈婧姝表示。 以虚拟人为例,一位元宇宙领域投资人在接触了ChatGPT后,就在朋友圈兴奋地表示,虚拟人的下一步在AIGC领域最先实现了突破,这将会将虚拟人带入至更受期待的发展前景。 同时,在一些元宇宙创业者看来,大厂在元宇宙业务方面的调整并不意味着元宇宙赛道出现了问题,“而是应该思考公司是否适合这个赛道。” 一位VR内容创业者举例解释了这个结论,“比如,短视频爆火的时候,腾讯跟风推出了微视。社交赛道爆火的时候,擅长电商领域的阿里也开始做起了社交。”此前,大厂对元宇宙赛道的相继入局也离不开跟风心理。 “只不过,在大环境不太好的情况下,每个大厂都会去抓自己更有优势的赛道。” 另一位创业者则对剁主表示,元宇宙更像是未来的终极社会形态,最终实现需要长期主义者的坚持,这远比AIGC要难得多。 02 投资方:还会继续看元宇宙赛道但以应用为主 纵观2022年,元宇宙称得上是资本眼中少有的风口。根据IT橘子发布的《2022年全球元宇宙投融资报告》,去年,国内元宇宙融资125起,融资总额为127亿,尤其是数字人领域受到了资本狂热追捧。 而当时间轴来到2023年,随着ChatGPT的跃进式突破,AIGC领域又成为投资圈的新贵。 杭州西湖心辰创始人蓝振忠最近在朋友圈公开拒绝了美团前合伙人王慧文的高价收购意向,并下定决心打造中国的OpenAI;此前,屡次提出上市计划未果的科技公司出门问问,也因旗下的AIGC产品重新回到大众视野。 但是,资本对AIGC的疯狂押注并不意味着完全放弃了元宇宙赛道。投资人认为,在一定阶段内,资本总会有一个重点关注方向。当AIGC领域进入稳定发展后,资本可能会将目光再次投向元宇宙。 “我们还是会继续看一些应用层的东西。资本对元宇宙领域冷淡,并不是它本身不行了,而是AIGC太火了。”盛景嘉成董事总经理刘迪表示,他认为,资本依然在持续关注元宇宙在应用层面的突破和创新。 “国内大厂的收缩只是意味在C端对于元宇宙仍然停留在游戏和视频层面,短时间快速上量的消费者教育仍需时日。但不代表在应用软件层面的收缩不前。前期元宇宙大厂的预期和应用发展两者之间存在脱节。” 整体来看,还是元宇宙C端生态没有成熟,并不是说没有投资机会。 由于国内在XR设备方面的研发进展并不顺利,迟迟没有找到合适的切口。从投资角度来看,研发瓶颈意味着投资回报周期将会被拉长。因此,资本对元宇宙硬件设备的耐心越来越少。唯一的破局之法被押注在八月份苹果上线的XR设备上。 图源:Bloomberg “短期内,应该不会有人投硬件设备,尤其是VR头显。比较靠谱的做法是等今年8月苹果的新产品出来之后再看。可能苹果的新设备出来之后,又会带动一波元宇宙投资热潮。”上述投资人表示。 相应地,这意味着硬件设备的公司在融资之路可能会变得艰辛,VR/AR公司的融资神话可能要在2023年被打破。 一位业内人士预测,XR将会处于长期增长乏力状态,因为,XR没有“市场肩膀”可站。 “这些年,科技的发展速度影响着大家对XR行业的期待。要不然就是觉得明天会爆发,反之也会觉得即将步入消亡的阶段。虽然很多互联网领域在当下依然可以实现快速成功,但互联网思维并不适合XR行业。即便在Quest推出之后,XR领域也远没有实现真正的从0到1。因此,行业不能将高速增长的期望寄托在现阶段XR行业上。” 03 泛元宇宙项目在二三线城市加速落地 与元宇宙赛道退潮的论调截然不同的是,元宇宙的疆域正在从一线城市向外延伸,在新一线、二三线城市加速落地。 以超级队长的发展路径为例,目前,超级队长不光在北京、上海等一二线城市进行了布局,更是深入三四线城市,产品终端覆盖了中国超200个城市。 其CEO王磊认为,在产业建立起杀手级的内容生态和硬软件专业性能之前盲目对C端进行规模化应用,是一种操之过急的行为。“如果用户只是因为好奇心而买单,那么复购便会是个核心问题。” 近三年,超级队长主要发力B端,“VR设备需要深耕垂直场景,通过解决实际问题找到行业突破口。”在这一思路的指引之下,超级队长选择了泛科普领域,解决展览展示和培训的需求,包括中小学的教育安全课程、党建类红色知识的学习等。在王磊看来,这一领域对应的是普惠性场景,覆盖了学校、党建等场景的需求。“不光大城市有需求,乡村基层同样也有需求。” 王磊介绍,超级队长将多款原创VR内容、自研系统控制、独立硬件开发成一款一体化部署产品,省去冗杂的操作步骤,能快速进入场景,最快实现产品能力的突破。 在产品走向二三线乃至更大需求场景时,使用门槛和成本成为影响最终能否落地的重要因素。“体验用户如果很难上手,产品就会失去核心竞争力。”同样,高昂的成本也很难在中小城市实现覆盖。因此,超级队长在产品设计时坚持操作便捷、降低成本的思路,借此实现应用场景的突围。 “目前,以科普为例,十万元以内就能打造小型的学习体验中心,涵盖了近百部标准VR内容,同时支持30人进行体验。” 多位行业人士对剁主表示,2023年,元宇宙将在培训行业、教育行业迎来新的转折点。王磊补充分析,传统的多人被动式培训有物理场景等多种因素的限制,难以进行场景模拟,而这正是VR设备的优势所在,核心要能进入实际场景,解决实际问题,为社会创造价值,这是商业的本质,也是VR赛道的新机遇。 除了VR产品,数字人行业也在二三线城市实现了落地应用。在这一方面,无论是一线台还是二线台,都表现出了极强的积极性,将数字人与新闻报道相结合,刷新融媒报道形式。 1月13日,山东广电推出了首个超写实数字主持人——“海蓝”。在制作方面,海蓝结合了当下最先进时域扫描系统、表情捕捉及表情迁移系统和数字人体征数据库等技术,为数字人进行赋能。在此基础之上,海蓝不仅“腹有诗书”,而且还多才多艺,精通琴棋书画,能够轻松驾驭多种报道内容和报道形式。 从山东广电释出的消息来看,除了节目报道之外,海蓝还将赋能山东省内的实体企业,将数字人和产业转型实现深度结合。 其实,元宇宙项目能够在二三线城市顺利落地延伸,也离不开地方政府的积极助力。王磊就对剁主透露,不少地方政府会主动联系合作。 元宇宙是高科技发展的方向和趋势,而这正是各省市想要突出强调的产业概念,借此展现城市的开放和发展。同时,在二十大和“十四五”规划中,数字经济也被多次提起,自上而下形成了驱动力。可以预见的是,各级省市将会在元宇宙方面投入更多的资金,元宇宙和产业的结合也将发展出更多落地方案。 来源:“剁椒娱投”(ID:ylwanjia),DeFi之道 作者:西西弗 不空 来源:金色财经
lg
...
金色财经
2023-02-25
王慧文无心与李彦宏「斗法」
go
lg
...
它只有375个人,是一个100%的小型
创业
公司
。 但为什么微软和谷歌内部没有孵化出这些项目?人们偏向认为,OpenAI的人才密度一定比微软、谷歌更高,大企业在创新上天生存在弊端和不足,加上资本的加持,这样小企业才会做出颠覆式的技术。 ChatGPT只是OpenAI的产品之一,公司多个创始人曾联合发文:“我们正致力于利用物理机器人完成基本家务。更远一些,OpenAl的目标是制造‘一种高度自主,且在大多数具有经济价值的工作上超越人类的系统’。” 做中国的ChatGPT和做中国的OpenAl,是完全不同的两件事。前者贴近为了流量追一个风口,后者的格局大得多得多。在OpenAI 官网可以看到它的纲领和章程,其中有一条反竞争条款: 这种情况在国内其实是非常罕见的。 如果说“狂热相信AI改变世界”是王慧文再创业的初衷,那么他后来发的续里,“不清晰、很渺茫、不明确”,更像是对自己这一举措的概括。 有分析人士指出,处于早期阶段的
创业
公司
,要想获得投资人的垂青,要么技术和工程化能力得特别强,要么对C端用户或者B端场景有特别深刻的洞察,能够把这些和AI技术结合,打造出能落地的产品。“国内创业,不先走场景而走技术驱动非常艰难。可能正是因为这样,慧文这样的动作才更有价值。” OpenAI能以很少的收入支撑很高的估值,获得长久的资金支持,除了技术信仰,还有资本和产业的支持,在国内,很难有VC拿钱冒险做技术驱动创新的环境,王慧文可能正在充当后者的角色。如果这是一次理想主义的试水,当所有的目标和过程坚定而明确,那么成败其实并不完全由结果判定。 来源:“新眸”(ID:xinmouls),DeFi之道 作者:鹿尧,编辑:桑明强 来源:金色财经
lg
...
金色财经
2023-02-25
2023 年 1 月区块链操作系统的开发回顾
go
lg
...
距。 Cartesi 正在引领数百万新
创业
公司
及其开发人员加入并使用区块链操作系统,同时将 Linux 应用程序纳入其中。 凭借开创性的虚拟机、Rollups和侧链,Cartesi 为所有开发人员铺平了道路,以帮助他们进入区块链的世界并构建下一代区块链应用程序。 Cartesi在此诚挚的邀请所有人,请和我们一起来到区块链操作系统的世界,一起探索未来。 来源:金色财经
lg
...
金色财经
2023-02-22
深度解析对比中国和硅谷的AIGC赛道
go
lg
...
场营销领域的文字生成类产品已经有数十家
创业
公司
在做了。图像生成类的产品在Stable Diffusion和DALLE-2出现之后也迅速开始卷了起来。 然而,中国的AIGC产业大多还是一片蓝海。两张市场地图对比不难看出中国的AIGC公司要比西方少得多,有些领域甚至还没有出现很多初创公司。 中国的AIGC市场地图 西方的AIGC产业是不是比国内要拥挤很多? 这一方面是由于中国的底层技术要比美国落后几年,还不足以支持商业化落地。就在几年前,李开复老师在《AI Superpowers》一书里指出,中国虽然在AI技术层面不及美国,但是在应用端却走在了美国的前面。或许这一说法适用于预测型AI(“predictive AI”,比如人脸识别、推荐算法)的时代,但是在生成型AI(“generative AI”)的时代,应用和底层技术结合得更紧密,中国在应用方面也可能要追赶美国的步伐。 中国在应用层的滞后也是由国内B2B产业的特性决定的。西方的文字和图像生成类产品主要都是面向2B的市场的,而中国的B2B市场要比西方小很多,中国企业往往不愿意在软件上花钱,而更愿意去购买服务。这就极大地降低了初创公司想要进入2B类文字、图像生成SaaS赛道的意愿。我们未来在国内可能看到企业打着卖服务的旗号卖软件--用户的体验和买服务无异,而后端的服务却是由AI软件提供的。 另外,与美国横向SaaS模式不同,中国的AIGC的SaaS很有可能会采取纵向的发展模式。这种模式的特点在于,聚焦于特定的应用领域,比如电商、短视频、金融,而不是追求产品的通用化。这种发展模式弥补了中国在模型通用能力上的不足,也利用了在垂直领域积累的大量的专业数据。 同一个科技,不同的垂直应用 中国市场的独特性也决定了中国会发展出和西方不一样的AIGC生态系统和不一样的垂直应用。 这意味着中国的AIGC应用虽然比美国慢了一步,但是简单粗暴的“复制到中国”(“copy-to-China”)模式并行不通。还是拿文字生成领域来讲,中国高质量的数据集少、市场营销以视频形式为主、企业不愿意在软件上花钱,这就意味着类似于美国的Jasper.ai和copy.ai这样的文字生成的通用SaaS,在中国就很难获得很大的2B市场。 中国文字生成产品主要在做2C的业务,并且业务的性质也和美国很不一样。学术类写作、英文写作还有翻译成了中国文字类AIGC产品的重点。众多产品都提供这种服务,比如火龙果写作、秘塔科技还有写作狐。 在2B领域,中国的初创公司选择了专攻垂直领域,而不是追究产品的通用性。一个典型的例子就是澜舟科技。在研发出了孟子大模型之后,澜舟科技并没有继续追求模型的通用性,而是专攻金融领域的NLP分析服务。 中国的AIGC的另一个独特之处就是在AI视频领域有着比较强的竞争力。特别是虚拟人和短视频方面,中国的公司更加懂得结合实用性和娱乐性,而西方的公司的产品往往只有实用性。 我们就拿中国的小冰和英国的Synthethia虚拟人公司来做个对比。Synthethia做出来的虚拟人跟普通公司白领无异,而小冰生成的万科虚拟员工崔筱盼却长着一副明星脸。 中国的虚拟人产业近几年逐渐人们的视野。不论是清华大学首位虚拟学生“华智冰”,还是冬奥会上谷爱凌的虚拟分身,每次虚拟人的亮相都能够引起舆论关注。比起专注于2B赛道的西方公司,中国的AIGC公司因为要做2C的业务,所以特别懂得吸睛引流。 咪咕的谷爱凌虚拟人分身在2022年冬奥会上首秀 虽然目这个产业的商业模式还不成熟,但是技术上一旦有了突破,中国公司的市场营销能力将成为其强大的国际竞争力。 但与此同时,中国在AIGC开发工具领域的初创公司甚少,比如在AI代码生成,还有零代码、少代码的工具领域基本上没有什么
创业
公司
。这可能是因为开发工具领域语言、文化隔阂小、政策约束少,像GitHub这样的西方公司可以比较容易进入中国市场。而中国企业在B2B、B2D产品制作能力上的不足也让中国的开发工具产品很难和西方大厂竞争。 中国的AIGC将何去何从? 说了这么多,我们在最后想对中国的AIGC产业做出三大预测,供大家参考。 一是,中国会重点发展AIGC的底层技术,形成自主的模型和基础设施。近些年美国政府对华的一系列科技制裁,让国内的各大公司担忧自己哪一天会不会也成为美国的打击对象。想要维持AIGC领域的发展,中国的企业和学术研究院必须要投入更多的研发费用,投入到真正的核心技术研发上,形成独立的产业链。 二是,由于中国国内市场的局限性,出海是很多2B的AIGC企业的必然之选。在AIGC领域,已经有一些初创公司打造出了国际化的企业形象,进入了东南亚、欧洲、北美等海外市场。AI语音助手
创业
公司
赛舵科技研发出了多语种的AI语音生成系统,涵盖了超过20种东南亚语言和方言。而高领资本和GGV投的AI模特公司ZMO.ai在中国成立,相继在美国和加拿大成立了办公室,打入北美市场。 ZMO.ai生成的AI模特 ZMO.ai生成的AI模特 ZMO.ai生成的AI模特 三是,政策监管和法律伦理问题将成为AIGC发展的一个重要挑战。去年12月,国家互联网办公室发布《互联网信息服务深度合成管理规定》,进一步规范AIGC产出的文字、图像和视频内容,规范了个人信息在深度合成中的应用。此前,不少AIGC公司都陷入了侵犯产权、个人信息和产出虚假内容的尴尬境地,包括OpenAI的代码生成软件Codex也因为抄袭GitHub开发者的代码而被告上法庭。如何能在发展技术的同时,遵守法律法规、伦理原则,成为AIGC企业面对的一大难题。 写在最后 硅谷之外,中国的AIGC产业已经开始崛起。不论是从技术发展还是投资创业的角度来看,中国的AIGC产业相当活跃。中国的AIGC公司面临着和西方公司同样的挑战,比如寻找成熟的商业模式、发展下一代AIGC技术,还有遵循法规伦理。与此同时,中国的AIGC也要面对额外的压力,比如美国政策的打击还有技术层面的不足。 跟互联网和移动手机时代一样,中国的AIGC生态必定和西方不一样。当美国的AIGC公司重点发展B2B业务的同时,中国公司很有可能会首先进入电商、物流还有大消费市场,并且很有可能在国际市场上和西方企业一争高下。 中国的AIGC还处于萌芽期。未来,AIGC产业必将改变我们的生活,中国企业也一定能够加入这股浪潮。 注:本文作者为硅谷Leonis Capital风险投资基金Jenny Xiao (肖文泉) 和Jay Zhao 来源:金色财经
lg
...
金色财经
2023-02-22
涨停复盘 | 汉王科技尾盘“核按钮”,资金深挖MOSS概念股!特斯拉新动作,毫米波雷达走红
go
lg
...
股价大涨,另外资金挖掘出参股该项目教授
创业
公司
的恒宝股份。不过周二人工智能及ChatGPT概念整体是调整的态势,龙头海天瑞声跌近10%,汉王科技尾盘遭遇“核按钮”一度触及跌停。 涨停梯队:元隆雅图(2连板)、网达软件(首板)、奥拓电子(首板) 六、市场情绪
lg
...
金融界
2023-02-21
困扰传统票务市场的那些疑难杂症 「NFT+票务」会是良药吗?
go
lg
...
初的统计,这条赛道已经至少有 20 家
创业
公司
在专攻 NFT 票务。 上一轮市场周期的代表:GUTS Tickets 最近闯入 Web3 世界的新手可能无法想象 2017 年的区块链世界有多疯狂。在那个被称为 1C0(首次代币发行)狂潮的时代,任何项目都可以轻易发行自己的代币来募集到大量资金——当然这也是很快产生乱象并招致监管打压的原因。 来自荷兰的区块链公司 GUTS Tickets(以下简称 GUTS)就创立于那个牛市,他们幸运地在 1C0 时发行了自己的代币 $GET,募集到了一万多个 ETH,从而可以在后来的熊市中安然度过。值得一提的是,GUTS 是真心希望在票务领域做出一番事业的,所以他们在 1C0 成功之后特地聘请了律所来确保自家代币不会被美国 SEC 认定为证券(通过豪威测试),从而招致严厉措施,这在当时的 1C0 环境中属实是一股清流。 $GET 不仅是一种代币,也是一种全称为 Guaranteed Entrance Token 的协议,它意味着一整套方案。如果你是需要销售门票的机构,GUTS 提供完整的白标方案(即不凸显 GUTS 品牌,一切 UI 在外界看来完全是机构自己的品牌),你只需要设定门票定价和转售规则(比如只能原价转售)等自定义规则,就可以开始销售门票了,丝毫不用提及区块链、NFT 等加密行业术语。 而对于买票的用户,则只需要在 APP 上找到需要的票就可以直接购买,或者从二级市场(如果规则允许并有人转让的话)购买即可。在入场时,用户唯一需要出示的就是手机上的动态二维码——这同时也是 GUTS 防止作弊的手段。 在 GUTS 的购票系统中,票价总是以法币定价的,但是在支付环节可以选择信用卡、PayPal、加密货币等各种方式。GUTS 尽其所能把加密货币和区块链的逻辑隐藏起来,不向普通用户呈现。实际上,他们颇费脑筋地设计了一套用于打通链上/链下的方案,兼顾了数据上链和大规模售票的性能问题,而且可以实现在任何公链上。在 2020 年转向 NFT 方案之前,$GET 代币是悄悄在背后把链上、链下数据打通的唯一方式;而在 2021 年 DAO 化之后,$GET 还对应着投票权。 创立于阿姆斯特丹的 GUTS 首先在荷兰国内取得了成功。2018 年 9 月,他们在三个小时内为荷兰喜剧演员 Jochem Myjer 的演出售出了 5 万张门票,一度成为荷兰最受欢迎的移动 App。2021 年,荷兰著名歌手 Guus Meeuwis 的演出因为疫情缘故在开演前不得不转移场地。根据以往纸质门票的经验,由于不透明的转售情况存在,票务商几乎不可能逐一通知到用户,而用户拿着印有错误时间、地点的门票一定会造成混乱。但是这次,票务承办商使用了 GUTS 的方案,他们“只需要点击按钮就可以更新演出信息并通知到每个客户端 App”,从而轻松化解了危机。这样的经验使得 GUTS 拥有了遍布欧美的客户,而且不仅是演出,还拓展到了体育活动等场景。 伴随 NFT 崛起的新贵:YellowHeart 与此同时,大洋彼岸也有一些聪明的脑袋正在打同样的主意,比如美国的 YellowHeart。 不同于上文提到的团队低调的 GUTS,YellowHeart 的背后有着强烈的个人主义印记。它的创始人 Josh Katz 是 1990 年代就入行唱片业的老兵。从为高管跑腿买三明治开始,Josh 花了近 10 年时间在唱片行业里摸爬滚打,小有成就之后开始了自己的创业之旅。2016 年,他把业绩不错的
创业
公司
卖掉,大赚了一笔,转身进入了加密货币和区块链的世界。那个时候以太坊还不到一美元,抱着试试看的 Josh 买了不少比特币和以太坊,然后,他很快见证了以太坊的爆发,开始着迷于区块链的魔力,也转型成了一位区块链投资人。 而他真正开始考虑将区块链与票务相结合完全是出于一个意外。2017 年的一天,Josh 想去看一场 Phish 乐队的现场演出,辗转从黄牛手中花了数千美元才买到两张票,一看票面价格只有 70 美元。Josh 感到很憋屈,并不是因为他不想付钱,而是他多付的这么多钱完全流向了黄牛的腰包,这对他曾经付出多年心血的音乐行业一点好处也没有,他钟爱的乐队一分钱也得不到。冷静之后,Josh 发现了机会——票务这个领域太需要革新了,区块链技术正适合来解决这个问题,于是,他创立了 YellowHeart。 身兼区块链投资人和音乐行业从业背景的 Josh 很快找到了志同道合的人,那就是著名的 DJ 组合 Chainsmokers。后者是世界顶级 DJ 之一,而且他们还有个不太为人知的身份——投资人。双方一拍即合。Chainsmokers 和他们的经纪人都非常认同用区块链技术来解决票务市场顽疾的做法,而且还寄厚望于开拓艺术家与粉丝关系的新模式。 有了明星助力,已经对产品颇有规划的 YellowHeart 从 2019 年开始不遗余力地进行宣传。那时,他们的目标是在 2020 年推出与主流票务平台合作的产品,并且与 Live Nation 已经达成了协议。然而随着疫情的到来,这一计划不得不暂时搁置。 但是这并不能阻止 YellowHeart 进军票务市场的决心,甚至还给了他们另辟蹊径的契机。疫情期间整个票务市场都几乎不存在了,但是音乐行业的需求反而增加了,只不过主阵地被搬到了网络上。有明星资源优势的 Josh 很快在知名音乐人群体中找到了新的合作对象。 获得过格莱美奖的著名乐队 Kings Of Leon 就是其中一员。2021 年 3 月,已经 4 年未发行过新专辑的 Kings Of Leon 宣布其下一张专辑即将通过 YellowHeart 以 NFT 形式发售,使之成为史上第一支以 NFT 形式发布专辑的乐队。虽然粉丝们还是可以在 Spotify 等平台听到这些歌曲,但是只有收藏了 NFT 的粉丝才能享有演唱会前排座位等 VIP 体验。为此,YellowHeart 特地准备了三种不同权益、不同价格的 NFT,其中的一些只能通过拍卖获得。YellowHeart 希望把这些 NFT 打造成真正的艺术收藏品,使其在二级市场中也为收藏者和 Kings Of Leon 继续来带收益。 “在过去的二十年里,我们已经看到了音乐的贬值,”Josh 对《滚石》杂志表示,从前人们支持音乐的形式就是去购买它,而后来流媒体的盛行以及基于订阅数的比例分成模式其实很大程度上损害了艺术。“我认为这才是未来人们应该发售音乐的形式”。 紧接着,YellowHeart 趁热打铁,在 2021 年 6 月又为当红乐队 Maroon 5 推出了史上第一个粉丝专属的 DAO(去中心化自治组织),同样是通过发行 NFT 的方式召集粉丝并募集资金。NFT 收藏者有权参加专属的线下音乐会,听到未发行的额外曲目,获得艺术品,或者是投票决定乐队的慈善行为。 这是 YellowHeart 和 Maroon 5 共同对重建粉丝经济的探索。 NFT 票务能革 TicketMaster 的命吗? 除了上述的两个平台案例,还有越来越多的创业者涌入 NFT 票务赛道以及 Web3 粉丝社区领域。这会成为众望所归,改变票务市场,给 TicketMaster 和 Live Nation 带来致命的影响吗?目前还尚未可知。至少,在答案浮现之前,恐怕还有相当长的一段路要走。区块链作为新兴的技术,其自身还不是尽善尽美。而 TicketMaster 能取得今天的地位,也并非一无是处。 在 Taylor Swift 票务事件之后,音乐研究机构 Water&Music 的 Discord 频道里曾经有过广泛讨论。有票务行业人士指出,从技术层面来说,虽然票务平台众多,但是迄今为止能提供完善后台系统的寥寥无几,能让项目方登录系统,使用各种图表查看售票数据,甚至提供 API 接口的,可能依然只有 TicketMaster 一家。即使是竞争对手如 AXS,也需要依赖 TicketMaster 的系统。在这一点上,后来者也许可以凭借良好设计的产品切入,上述 GUTS 的白标方案就有着一定优势。 图:Taylor Swift 的粉丝上街抗议,要求分拆 TicketMaster 和 Live Nation 其次,在面对大规模售票需求时,虽然 TicketMaster 屡屡陷入窘境,但是其它的传统竞争对手如 SeatGeek、AXS、Eventbrite 等更加不堪。例如,此次 Taylor Swift 的 The Era Tour 共由 52 场演出组成,SeatGeek 仅仅承办了其中 5 场的售票,然而招致的投诉已经不比 TicketMaster 少。有一些大牌艺人如 Pear Jam 也不是没有尝试过别的票务平台,只不过最终不得不用回 TicketMaster。抛去场馆关系等因素不谈,单从技术角度来看,就鲜有售票系统能应对得了大流量考验。 TicketMaster 披露称此次 Taylor 演唱会预售期的访问请求一度到达数亿次/天,其中热点时段的访问量可能达到数万甚至数十万次/秒。对于中国的用户而言,这已经接近我们熟悉的极端用例——12306 铁路售票系统。如果考虑区块链解决方案,可能会沮丧的发现,除非仔细地选择必要数据设计上链机制,否则并没有一条公链能够顺利处理这样的流量——想想看标榜吞吐量的 Solana 自己有过多少次宕机事故。 如果再把竞争的因素扩展到非技术部分,情况可能对创业者更加不利。比如,至少在美国,大部分场馆都与 TicketMaster 或其背后的 Live Nation 有长期合同。在付款方面,场馆方一向是对 TicketMaster 感到满意的。 更深层次的原因还有定价和对黄牛的看法。TicketMaster 经常被人诟病的一点是其热门票种的动态定价机制,这导致需求旺盛的门票会被系统抬至数千美元。尽管许多明星都表示过要照顾粉丝,反对把票价卖得太贵,但是这种“圈钱”机制也不乏拥护者。美国著名的蓝领摇滚教父 Bruce Springsteen 最近就公开表示“愿者买单”很合理,甚至“汗流浃背排队三个小时”的黄牛也值得赚钱(他自己也因此招致许多非议);而反例是,数年前 Pearl Jam 曾坚持低定价并成功地杜绝了黄牛倒卖。这两者都使用了 TicketMaster,这也说明,艺术家的意愿会起到作用。 面对这样错综复杂的利益纠葛,NFT 票务的路途显然还有许多艰难险阻。但不管怎样,在 Web3 大旗下成长起来的 NFT 票务商已经在各显其能,TicketMaster 当然也不会坐以待毙。但是,如果最终受惠者是广大艺术家和粉丝,那么一切都是值得的。 风险提示: 根据央行等部门发布的《关于进一步防范和处置虚拟货币交易炒作风险的通知》,本文内容仅用于信息分享,不对任何经营与投资行为进行推广与背书,请读者严格遵守所在地区法律法规,不参与任何非法金融行为。 来源:金色财经
lg
...
金色财经
2023-02-21
OpenAI与AIGC:改变人类生产范式 通往“万物的摩尔定律”
go
lg
...
IGC 模型,未来会有一类基于大模型的
创业
公司
,把预训练完成的 AIGC 模型针对每个子领域进行调优。不只需要模型参数优化,更要基于行业落地场景、产品交互方式、后续服务等,帮助某个行业真正用上大模型。 正如 AI 的 bitter lesson 一样矛盾,投资者需要短期投资回报率、研究者需要短期投稿成功率,尽管OpenAI 走在通往 AGI 正确的路上,这条路道阻且长,短期很难看到极大的突破。而 Sam Altman 展望的大模型应用层公司很有可能有更高的高投资回报,让我们来介绍下主要的分类与创业者。 百家争鸣的 AIGC 大模型应用层 对应 OpenAI 大模型发布的顺序,模型应用层相对最成熟的是文本生成领域,其次是图片生成领域,其他领域由于还未出现统治级的大模型相对落后。 文本领域天然应用场景丰富,且 GPT-3 开放 api 很久,细分赛道很多。大致可以根据生成内容不同分为两类:机器编程语言生成、人类自然语言生成。前者主要有代码和软件行为的生成等,后者主要有新闻撰写、文案创作、聊天机器人等。 而图片领域当前还专注于图片自身内容的生成,预期随着未来3D、视频相关内容生成能力的增强,会有更多结合不同业务场景如游戏、影视这样细分领域的
创业
公司
。 以下是海外各子领域
创业
公司
的梳理,接下来将针对几个领域的重要公司进行介绍。 1、编程语言 文本领域最成熟的应用暂时不在人类自然语言,而是在代码等机器语言的生成领域。因为机器语言相对更结构化,易学习;比如鲜有长文本的上下文关系、基于语境的不同含义等情况。 (1)代码生成:Github Copilot 代表公司是微软出品的 Github Copilot,编程中的副驾驶。该产品基于 OpenAI 专门用 GPT-3 为编程场景定制的AI模型 Codex。使用者文字输入代码逻辑,它能快速理解,根据海量开源代码生成造好的轮子供开发者使用。提高一家科技公司 10% 的 coding 效率能带来很大收益,微软内部已进行推广使用。 相比低代码工具,Copilot 的目标群体是代码工作者。未来的低代码可能是两者结合:低代码 UI 界面实现代码框架搭建,代码子模块通过 Copilot 自动生成。 正如 Copilot 的 slogan:Don’t fly solo,没有 Copilot 的帮助 coder 的工作会变得繁冗,没有 coder 的指引 Copilot 生成的内容可能会出现纰漏。也有用户报告了一些侵犯代码版权、或代码泄露的案例,当前技术进步快于版权法规产生了一定的空白。 (2)软件行为生成:Adept.ai Adept.ai 是一家明星
创业
公司
。创始团队中有两人是Transformer 模型论文作者,CEO 是谷歌大脑中大模型的技术负责人,已经获得 Greylock 等公司 6500 万美元的 A 轮融资。 他们的主要产品是大模型 ACT-1,让算法理解人类语言并使机器自动执行任务。目前产品形态是个 chrome 插件,用户输入一句话,能实现单击、输入、滚动屏幕行文。在展示 demo中,一位客服让浏览器中自动记录下与某位顾客的电话,正在考虑买 100 个产品。这个任务需要点击 10 次以上,但通过 ACT-1 一句话就能完成。 软件行为生成颠覆的是当下的人机交互形式,使用文字或语音的自然语言形式来代替当下人与机器的图形交互模式(GUI)。大模型成熟后,人们使用搜索引擎、生产力工具的方式都将变得截然不同。 2、自然语言 自然语言下还有多个应用型文本生成领域值得关注:新闻撰写、文案创作、对话机器人等。 (1)新闻撰写 最著名的是 Automated Inights。他们的结构化数据新闻撰写工具叫做 wordsmith,通过输入相应数据和优先级排序,能产出一篇基于数据的新闻报道。该工具已在为美联社每季度自动化产出 300 余篇财报相关报道,在雅虎体育新闻中也已经崭露头角。据分析师评价,由 AI 完成的新闻初稿已接近人类记者在 30 分钟内完成的报道水准。 Narrative Science是另一家新闻撰写生成公司,其创始人甚至曾预测,到 2030 年,90%以上的新闻将由机器人完成。 (2)文案创作 该领域竞争较为激烈,有copy.ai、Jasper、copysmith 等公司。他们基于 GPT-3 的能力加入了文案领域的人工模板与结构,为商家和个人创作者提供了快速为自己的商品、内容进行宣传的能力。以copysmith 为例: (3)对话机器人 前面提到的 Adept.ai 由Transformer 模型的一作和三作联合创立;而二作也创业了,他创办的 Character.ai 是当前对话机器人中使用效果最逼真的。 该对话机器人可以自定义或使用模板来定义角色的家庭、职业、年龄等,在此基础上保持一贯的设定和符合设定的对话风格。经常能体现出一定的共情对话能力带给人惊喜,并且支持多语言互通。 比如他们有已训练好的马斯克等名人和一些动漫角色,与他们对话会有很棒的代入感。 而商业化的对话机器人,在客服、销售等行业有巨大的市场空间,但如今还为成熟。 主要出现的问题有二: 其一,客服、销售行业遇到的客户往往情绪状态不稳定,AI 难以对情绪进行适应并调整对话内容; 其二,AI 的多轮对话能力较弱,无法保证持续有效的跟进问题。 (4)创作性文本 AI 对于长文本创作有一定困难,难以保持1000字以上的文本创作后仍能进行上下文的联系。 但基于短文本创作仍有一些有趣的应用,例如基于GPT-3的 AI Dungeon,可以引导 AI 创造一个虚拟游戏世界观。该领域进一步的成长需要期待未来 3-5 年,有成熟的能产出千字内容的 AI 出现。 3、多模态图片 DALL·E2 是极具突破性的 AIGC 大模型,但距离丰富生产力和创造力的成熟产品还有差距。因此有研究者顺着 DALL·E 和 CLIP 的思路开发了开源版本的扩散模型,就像当年的 Hugging Face 那样,并将其根据创作者社区的反馈转变为更成熟易用的商业产品。接下来就介绍几个主要出圈的模型: (1)Disco Diffusion 最早出圈的 AI 绘图工具是开源模型Disco Diffusion。发布时间比 DALL·E 2 稍晚,同样也是 CLIP + Diffusion Model 的结构,生成效果让许多插画师担心起了失业。 尽管很多插画师和 AI 工具爱好者的推荐都认可了该工具的易用性和生成效果的出众,但其生成时间略长有待优化,可以认为是大家对图片生成大模型的初体验。 (2)MidJourney 该模型发布后不久,Disco Diffusion 的开发者 Somnai 加入了 MidJourney,和团队一起打造了一款产品化的 Disco Diffusion。 Midjourney 的创始人 David Holz 并不是以CV(计算机视觉)研究为主,更关注人机交互。产品公测和主要交流平台都基于Discord,使用 Discord Bot 进行交互,打造了相当良好的社区讨论环境。 使用中印象深刻的有几个重要功能:MidJourney 画廊中可以看到每时每刻创作者们用 MJ 创作出的作品,用户可以对作品进行打分,每周排名靠前的作品将得到额外的 fast GPU 时间奖励。 同时,MJ官方还为用户贴心的提供了引导语 prompt 集合和 AI 擅长的风格指南,指导用户如何最高效的生成出他们想要的图片。 基于良好的产品和社区体验,MidJourney 的付费用户量也是目前最大的。 目前收费模式采用了订阅制,个人用户有两个档位,每月最多 200 张图片(超额另收费)的 10 美元/月,以及”不限量“图片的 30 美元/月;对企业客户,单人一年收费仅有 600 美元,且生成的作品可以商用(当前法规尚不完善,仍可能存在一定版权问题)。 (3)Stable Diffusion 如果说 MidJourney 是一个勤勤恳恳的绩优生,那么 Stability.ai 则是天赋异禀技术力强、诞生之初就备受 VC 追捧的富二代,公司估值已达到十亿美元。产品 Stable Diffusion 首要目标是一个开源共创模型,与当年的 Hugging Face 神似。 创始人 Emad 之前是对冲基金经理,用自己充裕的资金联合 LMU 和 Runaway ML开发了开源的 Stable Diffusion,在 Twitter 上使用扎克伯格在 Oculus 发布会上的照片作为背景,号召SD会成为”人类图像知识的基础设施“,通过开源让所有人都能够使用和改进它,并让所有人更好地合作。 Stable Diffusion 可以认为是一个开源版本的DALL·E2,甚至不少使用者认为是当前生成模型可以使用的最佳选择。官方版本部署在官网 Dream Studio 上,开放给所有用户注册。 相比其他模型,有很多可以定制化的点。不过官网只有 200 张免费额度,超过需要付费使用,也可以自行使用开源 Colab 代码版无限次使用。此外,Stable Diffusion 在压缩模型容量,希望使该模型成为唯一能在本地而非云端部署使用的 AIGC 大模型。 05 AIGC大模型的未来展望 1、应用层:多模态内容生成更加智能,深入各行业应用场景 上述的多模态图片生成产品当前主要局限于创作画作的草图和提供灵感。在未来待版权问题完备后, AIGC 内容能进入商用后,必然会更深入地与业界的实际应用进行结合: 以游戏行业为例, AI 作画给了非美术专业工作者,如游戏策划快速通过视觉图像表达自己需求和想法的机会;而对美术画师来说,它能够在前期协助更高效、直接地尝试灵感方案草图,在后期节省画面细节补全等人力。 此外,在影视动画行业、视频特效领域,甚至是文物修复专业,AI 图片生成的能力都有很大想象空间。当然,这个领域 AI 的能力也有着不小的进步空间,在下面的未来展望部分进行阐发。 目前 AIGC 存在 Prompt Engineering 的现象,即输入某一些魔法词后生成效果更好。这是目前大模型对文本理解的一些缺陷,被用户通过反向工程进行优化的结果。未来随着语言模型和多模态匹配的不断优化,不会是常态,但中短期内预期Prompt Engineering 还是得到好的生成内容的必备流程之一。 2、模态层:3D生成、视频生成 AIGC 未来3-5年内有明显进步 多模态(multimodal)指不同信息媒介之间的转换。 当前 AI 作图过程中暴露的问题会成为视频生成模型的阿喀琉斯之踵。 例如:AI 作画的空间感和物理规则往往是缺失的,镜面反射、透视这类视觉规则时常有所扭曲;AI 对同一实体的刻画缺少连续性。根本原因可能是目前深度学习还难以基于样本实现一些客观规则泛化,需要等待模型结构的优化进行更新。 3D生成领域也有很大价值:3D 图纸草图、影视行业模拟运镜、体育赛场现场还原,都是 3D 内容生成的用武之地。这一技术突破也渐渐成为可能。 2020年,神经辐射场(NeRF)模型发布,可以很好的完成三维重建任务:一个场景下的不同视角图像提供给模型作为输入,然后优化 NeRF 以恢复该特定场景的几何形状。 基于该技术,谷歌在2022年发布了 Dream Fusion 模型,能根据一段话生成 360 度三维图片。这一领域当前的实现效果还有优化空间,预期在未来3-5年内会取得突破性进展,推动视频生成的进步。 3、模型层:大模型参数规模将逼近人脑神经元数量 近年的大模型并未对技术框架做颠覆性创新,文本和图像生成领域在大模型出现前,已有较成熟方案。但大模型以量变产生质变。 从神经网络角度看,大脑有约 100 万亿神经元, GPT-3 有 1750 亿参数,还相差了 1000 倍的数量级,随着算力进步可以发展的空间还很大。 神经网络本质是对高维数据进行复杂的非线性组合,从而逼近所观测数据分布的最优解,未来一定会有更强的算力、更精妙的参数堆叠结构,来刷新人们对AI生成能力的认知。 4、成本结构决定大模型市场的马太效应 大模型最直接的成本便是能源成本(energy cost),GPT-3 发布时的训练成本在千万美元级别。难以在短期内衡量 ROI ,大科技公司才能训练大模型。 但随着近年模型压缩、硬件应用的进步,GPT-3 量级的模型成本很可能已降至百万美元量级,Stable Diffusion 作为一个刚发布一个月的产品,已经把原本 7GB 的预训练模型优化压缩至 2GB 左右。 在这样的背景下,算力成本在未来必然会逐渐变得更合理,但 AIGC 领域的另一个成本项让笔者对市场结构的预测还是寡头垄断式的。 大模型有明显的先发优势,来自巨大的隐形成本:智能成本。前期快速积累用户反馈数据能帮助模型持续追新优化,甩开后发的竞争者,达到模型性能的规模效应。 AI 的进化来自于数据的积累和充分吸收。深度学习,乃至当前的所有机器学习都是基于历史预估未来,基于已有的数据给到最接近真实的可能。 正如前文讨论的,OpenAI 的目标从来不是留恋于某个局部行业的商业产品,而是通过模型规模经济,不断地降低人类社会全局的智能成本,逼近通用人工智能 AGI。规模经济正体现在智能成本上。 5、虚拟世界的 AGI 会先于现实世界诞生 从更宏观的视角上,虚拟世界 AI 技术的智能成本比现实世界中来得低得多。现实里 AI 应用最普遍的是无人驾驶、机器人等场景,都对 Corner Case 要求极高。 对于AI模型而言,一件事超过他们的经验范畴(统计上out of distribution),模型将立马化身人工智障,不具备推演能力。现实世界中 corner case 带来的生命威胁、商业资损,造成数据积累过程中极大的试错成本。 虚拟世界则不同,绘图时遇到错位扭曲的图片,大家会在 Discord 中交流一笑了之;游戏 AI 产生奇怪行为,还可能被玩家开发出搞怪玩法、造成病毒传播。 因此虚拟世界,尤其是泛娱乐场景下的 AIGC 积累数据成本低会成为优势。这个领域的 AI 如果节省人力、生成内容产生的商业价值能大于算力成本,能很顺畅地形成低成本的正向循环。 伴随着另一个重要的革新——长期 Web3.0元宇宙场景下新内容经济生态的形成,虚拟世界内容场景下的 AI 很可能更早触及到 AGI。 来源:金色财经
lg
...
金色财经
2023-02-21
风水轮流转!对中国投资热情降温 高盛加码押注印度等其他亚太市场
go
lg
...
万美元。 本周,其牵头了对印度金融科技
创业
公司
InsuranceDekho 1.5 亿美元的投资。这是一笔非同寻常的大手笔投资,将帮助公司瞄准资源匮乏的印度国内市场。高盛还投资了日本公司 Raputa Robotics,以及中国的一次性生物处理解决方案提供商 LePure。 Stephanie Hui 表示,除了印度,目前的亮点还有日本、韩国和澳大利亚。她指出,高盛去年从澳大利亚 Pacific Equity Partners 挖来了 David Grayce ,从TPG资本重新聘请了 SJ Lee 负责韩国业务,并将日本的增长型投资团队扩大到六人。 总体而言,高盛目前在亚洲的增长和收购团队拥有 35 名私人股本投资专业人士,为了加强在中国的业务,公司于 2022 年第四季度将合伙人Michael Hui 调至上海。 高盛还加强了筹资能力,招募了三位董事总经理,包括澳大利亚昆士兰投资的 Craig Balenzuela、日本古根海姆合伙公司的 Yugo Yamamoto 和锐盛投资中国分公司的张孟。2019 年底,Stuart Wrigley 调任亚洲另类资本市场与战略主管,并于11月被任命为合伙人。 去年,高盛为第三方替代平台筹集了 720 亿美元,包括房地产、私募股权和信贷平台,这是 CEO 大卫·所罗门(David Solomon)为减少资产负债表投资组合而进行的全面改革。根据最新收益报告,2022 年,高盛将其资产负债表上的另类投资削减了 90 亿美元至 590 亿美元。 去年年底,中国松绑了严格的防疫政策,目前经济正在好转,但美国明年大选前持续的地缘政治紧张局势和政治博弈意味着,两国关系可能继续紧张。Stephanie Hui 说:“两三年前,由于规模庞大,亚洲私募股权市场严重集中在中国。现在我们在地理上更加平衡。” Stephanie Hui 表示,高盛将在整个亚洲进一步构建其医疗保健网络,并将资金投入选定的企业软件业务和消费领域,同时对金融科技更加谨慎。在中国,团队也调整了重点,以应对更广泛的市场环境,同时保持“谨慎乐观”。
lg
...
IreneLim
2023-02-16
速速了解区块链新趋势,数家机构各施所长共同探索数据经济
go
lg
...
经济的持续增长,我们可以期待看到更多的
创业
公司
进入这个领域,以及更成熟的公司寻找方法来利用他们的数据资产。 然而,解决数据所有权和隐私问题仍然面临挑战。 数据标记化最大的问题之一是数据误用或滥用的可能性。敏感数据或个人数据都可能涉及,这一点尤为真实。 因此,对于初创公司来说,在继续开发平台时,优先考虑数据安全将非常重要。 另一个障碍是确保数据提供商能够从他们的数据中赚钱。 在标记数据时,确保数据提供者获得公平的报酬至关重要,需要透明的定价模型和明确的共享指南。 如前所述,冲突仍然存在。 遗留数据公司和初创公司:冲突还是合作? 谷歌、Meta和Amazon等传统数据公司可能会犹豫是否要放弃对其数据资产的控制,他们围绕数据收集和分析建立了自己的商业模式,这就有可能与寻求提供更大访问存储数据权限的初创公司发生冲突。 然而,这些传统公司和致力于创新数据解决方案的初创公司之间也有合作和伙伴关系的机会。 此外,这些公司拥有大量的数据和资源来收集、存储和分析这些数据,这对
创业
公司
来说是一个巨大的门槛。 然而,这些公司和初创公司之间也有合作和伙伴关系的机会。 初创公司或许能够为数据管理和货币化提供新的创新解决方案,而传统公司无法做到这一点。 反过来,传统公司可以提供有价值的数据资产,初创公司可以用来开发和测试他们的平台。 我们已经看到了这种合作的例子。例如,Ocean Protocol已经与梅赛德斯合作,为移动领域开发一个分散的数据市场。 这种类型的合作可以帮助弥合传统公司和初创公司之间的差距,并为数据所有权和货币化创造新的机会。 老牌企业可能会寻求对创新初创企业的投资,例如微软最近对OpenAI的100亿美元投资说明了这一趋势。 这可以帮助他们保持领先地位,并在快速发展的数据经济中保持竞争力。 传统数据公司和提供更大数据访问权限的初创公司之间存在潜在冲突,有合作的机会。 然而,在涉及到数万亿美元的潜在风险时,传统企业在分享数据方面犹豫不决。 总结 基于区块链的平台和通证化正在为安全的数据共享和货币化提供解决方案,使数据经济成为快速增长和有价值的部门。 这一领域的主要参与者,包括Ocean Protocol、Golem和Streamr,正在为数据所有权和货币化提供创新的解决方案。 尽管取得了这些进步,但数据经济仍然面临各种挑战。 比如数据滥用的风险,对数据提供者公平补偿的需要,以及遗留数据公司和初创公司之间的潜在冲突。 尽管如此,传统公司和初创公司之间还是有合作的机会。随着数据经济的不断发展,优先考虑数据安全和隐私将是至关重要的。 此外,促进创新和协作将是在数据所有权和货币化方面创造新机会的关键。 来源:金色财经
lg
...
金色财经
2023-02-16
上一页
1
•••
77
78
79
80
81
•••
88
下一页
24小时热点
【黄金收评】发生了什么!?金价巨震68美元 中国重磅消息一度引发金价暴跌
lg
...
白宫爆发激烈争论!美媒曝“一场被取消的谈判”:特朗普临时叫停英伟达对华芯片计划
lg
...
中俄突发重磅!中国国家主席习近平寻求促进投资 扩大与俄经济联系
lg
...
两大投行齐声警告:全球股市或将迎来“现实回调”、未来两年恐跌10%至20%
lg
...
【直击亚市】美联储官员最新信号吓坏市场!Palantir引爆不安,美元连涨5天
lg
...
最新话题
更多
#AI热潮:从芯片到资本的竞赛#
lg
...
17讨论
#SFFE2030--FX168“可持续发展金融企业”评选#
lg
...
36讨论
#VIP会员尊享#
lg
...
1989讨论
#比特日报#
lg
...
11讨论
#Web3项目情报站#
lg
...
6讨论