全球数字财富领导者
财富汇
|
美股投研
|
客户端
|
旧版
|
北美站
|
FX168 全球视野 中文财经
首页
资讯
速递
行情
日历
数据
社区
视频
直播
点评旗舰店
商品
SFFE2030
外汇开户
登录 / 注册
搜 索
综合
行情
速递
日历
话题
168人气号
文章
中国式ChatGPT“大跃进”
go
lg
...
Sutskever退出谷歌,与Sam
Altman
、Elon Musk等人一起创立OpenAI时,年薪曾大幅缩水。但他参与创立OpenAI的初衷是“确保强大的人工智能造福全人类”的大义和情怀。 OpenAI初创之时是一家非营利研究机构,从这点上来看,无论是否带着情怀加入这家公司的研究人员,还是给“非营利”事业烧钱的投资人,多少都有一点对技术的“信仰”,这种驱动力,可能是钱买不来的。 不过OpenAI给这些科技精英们提供的薪酬待遇并不低。据纽约时报报道,2016年,OpenAI向Ilya Sutskever支付了超过190万美元。另一位行业大佬级的研究员Ian Goodfellow(对抗式生成网络的提出者)2016年从OpenAI得到的报酬则超过80万美元,而他在这一年中只工作了9个月,不过Ian Goodfellow在OpenAI没有待很长时间就离开了。 一直以来,硅谷的AI研究员都是高收入人群。在谷歌发布的官方招聘信息中,在美国工作的全职“高级软件工程师,大型语言模型,应用机器学习”(Staff Software Engineer, Large Language Models, Applied ML)岗位基本工资范围为年薪17.4万-27.6万美元(约120万-190万元人民币)+奖金+股权+福利。 这份工作的主要职责是:为谷歌大型语言模型的关键冲刺做出贡献,将尖端的 LLM(Large Language Mode,大型语言模型) 引入下一代谷歌产品和应用程序,以及外部用户。在建模技术方面进行协作,以支持全方位的 LLM 调整,从提示工程、指令调整、基于人类反馈的强化学习 (RLHF)、参数高效调整到微调。 微软研究院的研究员岗位“博士后研究员-机器学习和强化学习”(Post Doc Researcher-Machine Learning and Reinforcement Learning)年薪则在9.4万-18.2万美元(约64万-125万元人民币)。工作职责是“与其他研究人员合作制定自己的研究议程,推动有效的基础、基础和应用研究计划。” ChatGPT团队中另一个有意思的点是团队中有9位华人成员,其中5人本科毕业于国内高校,美国学界对人才的虹吸效应也正是硅谷巨头以及“OpenAI”们强大人才竞争力的基础。 “中国的AI人才是从14亿人里挑,美国是从80亿人里挑,全世界优秀的人很多都到美国去了。”图灵联合创始人、原智源研究院副院长刘江表示,要承认差距确实存在,不过他也表示,“在这方面,我们也不用气馁。中国也有自己的优势,比如市场化、产品化的能力,近年来我们不比美国同行差了。” 国内大厂的实力如何? 除了人才问题,国内大模型研究落后美国另一个原因是在生成式AI和大模型研究方面起步略晚,而起步晚的原因,则还是与“钱”脱不开关系。 从技术角度看,生成式技术在Stable Diffusion和ChatGPT等网红产品出现之前,技术实现的效果并不理想,且需要消耗大量算力进行研究。所以大厂、资本很难斥以重资,投入到这种看上去不太赚钱,还要烧钱的业务。 中国的AI产业更注重应用场景,而非基础理论和技术创新。各家大厂在NLP的理解方面有很多成熟业务,比如听写、翻译,在视觉识别和AI大数据处理方面也有很多应用场景。所以这部分业务自然是AI研发的主力,一方面他们赚钱,另一方面在这些领域的技术积累,使研究人员能够“在规定跑道上赛跑”,而不是在未知领域探路。 这一点不只是限制了国内公司,更是很多全球巨头的创新桎梏。正如诺基亚做不出iPhone一样,巨头都不喜欢“破坏式创新”,谷歌发布的Bard只因一个小失误就牵动了母公司Alphabet的万亿市值,这也正是谷歌一直声称不愿发布LaMDA大模型的理由,害怕会因AI的失误影响自己的商誉。而OpenAI显然不太在乎ChatGPT在公测中会出什么问题,毕竟他发布ChatGPT时只是一家估值200亿美元的独角兽。 不过,在这波大模型的追赶赛中,国内大厂的团队也可以说是实力颇强。 百度在大模型方面走的最早,百度自2019年开始研发预训练模型,先后发布了知识增强文心(ERNIE)系列模型。文心大模型研发的带头人,百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰博士,是自然语言处理领域权威国际学术组织ACL(Association for Computational Linguistics)的首位华人主席、ACL亚太分会创始主席、ACL Fellow,还是IEEE Fellow、CAAI Fellow及国际欧亚科学院院士。他还兼任中国电子学会、中国中文信息学会、中国工程师联合体副理事长等。目前,王海峰在国内外期刊会议上发表的学术论文有200余篇,获得已授权专利170余项。 虽然没有像百度一样公布类ChatGPT产品的发布时间表,但腾讯、阿里和华为分别提出的“混元”、“通义”和“盘古”三个大模型,均已研发了很长时间。 据机器学习和自然语言处理著名学者Marek Rei教授在2022年4月发布的统计(2023年的统计尚未发布)显示,2012-2021年中,在ML(Machine Learning,机器学习)和NLP顶级期刊和会议发表论文数量最多的机构是谷歌,微软紧随其后。发文数量最多的中国机构是清华大学,第二是位列第16的腾讯,腾讯也是前32名中唯一的中国互联网厂商。不过,在2021年单年的统计中,阿里和华为也登上此榜,腾讯仍排在较靠前的位置。 Marek Rei发布的2021年ML、NLP顶会、期刊发文量统计 目前,腾讯官方并没有公布“混元”大模型研发团队的具体信息。不过,腾讯旗下AI研发团队“腾讯AI Lab”的专家构成,也显示出了腾讯在AI领域的一部分实力。腾讯AI Lab由100余位AI科学家和超过300名应用工程师组成,带头人张正友博士是腾讯首席科学家、腾讯 AI Lab 及 Robotics X 实验室主任,腾讯首位17级研究员、杰出科学家。他在美国斯坦福大学(Stanford University)发布的2022 年度“全球前2%顶尖科学家榜单”(World's Top 2% Scientists 2022)中,排名全球“终身科学影响力排行榜”第1002名,中国排名 Top 10。 阿里在LLM领域的研究主要由阿里巴巴达摩院负责,阿里巴巴集团资深副总裁,阿里云智能CTO、达摩院副院长周靖人主导,他是IEEE Fellow,多次担任VLDB,SIGMOD,ICDE等国际顶级会议程序委员会主编、主席,在顶尖国际期刊和会议上发表论文超百篇,并拥有几十项技术专利。 华为也未对“类ChatGPT产品”公开表态,但在大模型方面华为亦有“盘古”大模型正在研究。该项目由华为云人工智能领域首席科学家田奇博士领导,他是计算机视觉、多媒体信息检索专家,IEEE Fellow,国际欧亚科学院院士,教育部长江讲座教授,国家自然科学基金海外杰青,中国科学院海外评审专家,在国内多所高校任讲席教授及客座教授。 在自己组建团队投入研发的同时,百度、阿里、腾讯、华为等IT大厂,也与中科院计算所自然语言处理研究组、哈尔滨工业大学自然语言处理研究所、中国人民大学高瓴人工智能学院等高校研究有很多的技术合作。 “集中力量办大事”的科研机构 数据闭环是大模型研发的关键,用户越多,积累时间越长,就意味着可以用于迭代升级的数据和反馈也就越多。 在这方面OpenAI已经利用前两代的开源GPT模型和GPT-3积累了大量数据。ChatGPT虽然才推出了3个月,但用户量和访问量增长速度飞快,这些都为OpenAI在大模型研发方面积累了巨大的先发优势。 “AI大模型如果落后了,就会面临卡脖子的风险。”很多AI专家对此都有担心,由此国内也诞生了一些应对此种局面的非营利性AI科研机构。这些机构多数有高校研究实验室背景加持,以及地方政策支持,人才聚拢能力非常强劲。 北京智源人工智能研究院(以下简称“智源研究院”)是科技部和北京市政府共同支持,联合北京人工智能领域优势单位共建的非营利性创新性研发机构。智源研究院理事长张宏江,是美国国家工程院外籍院士,ACM Fellow和IEEE Fellow,同时也是微软亚洲研究院的创始人之一。 2021年,智源研究院发布了1.7万亿参数的超大模型“悟道”的1.0和2.0版本,这项工作由100余位科学家共同打造。其中包括清华大学计算机系自然语言处理与社会人文计算实验室(THUNLP)的孙茂松教授,清华大学知识工程研究室(KEG)的唐杰教授,清华大学交互式人工智能课题组(CoAI)的黄民烈教授。 目前“悟道”大模型已经与OPPO、好未来、淘宝、搜狗、美团等开展了落地合作。在与美团的合作中,大模型给搜索广告带来了2.7%的收入增长。 在南方的科技重镇也有一家相似的研究机构,粤港澳大湾区数字经济研究院(以下简称IDEA研究院),IDEA研究院是由深圳市政府大力支持的AI研究机构。与智源研究院有一个颇有趣的相似之处,IDEA研究院的创始人沈向洋博士同样出身微软亚洲研究院。沈向洋博士是美国国家工程院外籍院士和英国皇家工程院外籍院士,他参与创建了微软亚洲研究院,担任院长兼首席科学家,并曾担任微软公司全球执行副总裁,主管微软全球研究院和人工智能产品线,并负责推动公司中长期总体技术战略及前瞻性研究与开发工作。 IDEA研究院NLP研究中心负责人张家兴博士也来自微软亚洲研究院,他的团队推出的开源模型“太乙”,据称在中文文生图领域可以达到接近Stable Diffusion(一款开源文生图AI模型)的水平。 目前IDEA研究院正在持续迭代开发的预训练模型体系“封神榜”,已经开源了6个系列共10个模型,包含4种模型结构,模型参数最大为35亿。其中包括:以Encoder结构为主的双向语言系列模型的二郎神系列;面向医疗领域,拥有35亿参数的余元系列;与追一科技联合开发的新结构大模型周文王系列;以Decoder结构为主的单向语言模型闻仲系列;以Transformer结构为主的编解码语言模型,主要解决通用任务的大模型燃灯系列;以及主要面向各种纠错任务的比干系列。 2月20日晚,复旦大学自然语言处理实验室对媒体宣传邱锡鹏教授团队发布了“国内第一个对话式大型语言模型MOSS”,并在公开平台(https://moss.fastnlp.top/),邀请公众参与内测。然而就在外界都等着看MOSS表现如何惊艳之时。MOSS的内测网站却挂出了一则道歉公告。 目前MOSS的测试网站已经挂出了停止服务的公告。一位AI大模型专家对虎嗅表示,“邱锡鹏的实验室学术研究的氛围很浓。虽然这次的MOSS很少有人得到体验机会,但是从后边的公告来看,有可能是在工程优化,并发处理等方面的准备还没有那么充分。” 在近期举行的2023年世界人工智能开发者先锋大会上,邱锡鹏教授公开表示,如果优化顺利,MOSS计划在2023年3月底开源。 虽然,没能成功抢发“国产ChatGPT”,但AI业内人士对邱锡鹏教授团队仍然给出了肯定的评价,“邱锡鹏教授的团队比较偏重学术,这和早期的OpenAI在科研心态上是有共性的,非营利性的AI研究机构,没有那么多功利的考虑。” 创业公司都有“大佬”背书 AI技术属于计算机科学,虽然计算机技术已发展多年,但AI仍属于前沿科技,对LLM以及其他通用大模型的研究更是兴起不久,仍然需要依靠应用数据,持续迭代升级,不管MOSS是不是因为工程经验绊了跟头,要在AI、大模型这些领域实现突破,能推广到市场中,接地气的技术和产品才是王道。事实上,目前国内AI行业活跃的实验室大多已开始尝试商业化,在市场的磨砺中探索大模型未来的出路。 深言科技 深言科技源自清华大学计算机系自然语言处理与社会人文计算实验室(THUNLP)。THUNLP由清华大学人工智能研究院常务副院长孙茂松,以及刘洋、刘知远,三位教授带头。实验室在2017年推出的中文诗歌自动生成系统「九歌」则是最有影响的诗歌生成系统之一,「九歌」已经为用户创作了超过3000万首诗词。 孙茂松教授领衔研发的CPM模型是智源研究院的大模型「悟道·文源」的前身,也是国内最成熟的中文生成式大模型之一。深言科技的团队也是由CPM模型的部分研发团队成员所组成的,目前该公司产品包括可以根据意思搜索词语的“WantWords反向词典”,以及根据意思查询句子的“WantQuotes据意查句”。 智谱AI 智谱AI的前身是清华大学知识工程研究室(KEG),KEG专注研究网络环境下的知识工程,在知识图谱、图神经网络和认知智能领域已发表一系列国际领先的研究成果。2006年,智谱AI就启动了科技信息分析引擎ArnetMiner(以下简称AMiner)的相关研究,先后获得了国际顶级会议SIGKDD的十年最佳论文(Test-of-Time Award)、国家科学进步奖二等奖、北京市发明专利奖一等奖。 2022年8月,由KEG与智谱AI共同研发的千亿级模型参数的大规模中英文预训练语言模型GLM-130B正式发布,其在多个公开评测榜单上超过GPT-3 v1。此外,智谱AI还打造了认知大模型平台(BigModel.ai),形成AIGC产品矩阵,提供智能API服务。 聆心智能 2月17日,聆心智能宣布完成由无限基金SEE Fund领投的Pre-A轮融资。聆心智能的底层技术是超拟人大规模语言模型,基于大模型可控、可配置、可信的核心技术优势,聆心智能推出“AI乌托邦”,该系统允许用户快速定制 AI 角色。 聆心智能由清华大学交互式人工智能课题组(CoAI)黄民烈教授支持。CoAI是清华大学朱小燕教授及黄民烈教授领导的实验室。2020年,就已经开源了1200万对话数据和中文对话预训练模型CDial-GPT。黄民烈教授也曾参与了智源研究院的“悟道”大模型研发。 西湖心辰 西湖心辰背靠西湖大学深度学习实验室,创始人是西湖大学助理教授、博士生导师蓝振忠,主要研究大规模预训练模型的训练与应用。蓝振忠曾在谷歌担任研究科学家,也是轻量化大模型ALBERT的第一作者。 西湖大学在人工智能领域的研发实力很强,除了蓝振忠博士的深度学习实验室,西湖大学NLP实验室,在该领域的研究也非常领先。学术带头人张岳博士在Marek Rei教授的顶会、期刊发文量统计中,于2012-2021年期间排名全球第四。 “目前国内LLM领域的创业公司相对IT大厂来说主要有两个优势,技术和数据。”西湖心辰COO俞佳对虎嗅表示,国内大模型创业公司在技术方面普遍已有多年研究经验,构筑了一定的技术壁垒,这是很难短期超越的。同时,由于已经推出了相关产品,“数据飞轮”已经转起来了,这些数据的质量相比互联网数据质量要高很多,能够对产品迭代起到很大支撑作用。 对于国内大模型创业公司未来的发展趋势,俞佳认为可能性很多,“有些公司可能会走出自己的道路,也有的公司可能会像OpenAI一样与IT大厂开展深度合作,甚至像DeepMind直接并入其中。” 来源:金色财经
lg
...
金色财经
2023-03-03
人类生成 or 机器生成?ChatGPT 引发了一场真假辩论
go
lg
...
AI 首席执行官萨姆奥特曼 (Sam
Altman
) 去年 12 月警告说,ChatGPT“在某些方面足够出色,足以给人一种伟大的误导印象”。 我们在稳健性和真实性方面还有很多工作要做。” 该公司正在为其内容输出开发加密水印,这是一种机器可读的秘密标点符号、拼写和词序序列; 并且正在磨练一个“分类器”来区分合成文本和人工生成的文本,使用两者的例子来训练它。 斯坦福大学的研究生 Eric Mitchell 认为分类器需要大量的训练数据。 他与同事一起提出了 DetectGPT,这是一种发现差异的“零样本”方法,这意味着该方法不需要事先学习。 相反,该方法会自行启动聊天机器人,以嗅探出自己的输出。 它是这样工作的:DetectGPT 询问聊天机器人它对示例文本的“喜欢”程度,“喜欢”是示例与其自己的创作有多相似的简写。 DetectGPT 然后更进一步——它“扰乱”了文本,稍微改变了措辞。 假设是聊天机器人在“喜欢”更改后的人工生成文本方面比更改后的机器文本更具可变性。 研究人员声称,在早期测试中,该方法在 95% 的时间内正确地区分了人类和机器作者。 需要注意的是:这些结果尚未经过同行评审; 该方法虽然优于随机猜测,但在所有生成式 AI 模型中的工作可靠性并不相同。 对合成文本进行人为调整可能会愚弄 DetectGPT。 这一切对科学意味着什么? 科学出版是研究的命脉,将想法、假设、论据和证据注入全球科学经典。 一些人很快就将 ChatGPT 作为研究助理,一些有争议的论文将 AI 列为合著者。 Meta 甚至推出了一款名为 Galactica 的科学专用文本生成器。 三天后它被撤回了。 在它被使用的这段时间,构建了一段熊在太空旅行的虚构历史。 Tübingen 的马克斯普朗克智能系统研究所的迈克尔·布莱克教授当时在推特上表示,他对 Galactica 对有关他自己研究领域的多项询问的回答感到“困扰”,包括将虚假论文归咎于真正的研究人员。 “在所有情况下,[Galactica] 都是错误的或有偏见的,但听起来是正确和权威的。 我认为这很危险。” 危险来自于看似合理的文本滑入真正的科学提交,用虚假引用充斥文献并永远歪曲经典。 《科学》杂志现在完全禁止生成文本; 《自然》杂志则允许使用它,前提是必须对使用进行了声明,但禁止将其列为共同作者。 话又说回来,大多数人不会查阅高端期刊来指导他们的科学思维。 如果狡猾的人如此倾向,这些聊天机器人可以按需喷出大量引用伪科学,解释为什么疫苗不起作用,或者为什么全球变暖是个骗局。 在线发布的误导性材料可能会被未来的生成人工智能吞噬,产生新的谎言迭代,进一步污染公共话语。 贩卖怀疑的商人肯定已经摩拳擦掌,迫不及待了。 来源:金色财经
lg
...
金色财经
2023-03-01
AI可以为加密市场带来什么?有哪些机会值得关注?
go
lg
...
penAI创始人萨姆·奥特曼(Sam
Altman
)介绍,在短短两个月内,ChatGPT的用户就突破了1亿。这是Facebook用了4年半、Instagram用了2年半、Twitter用了5年才达成的成就。 人工智能释放巨大应用价值 2023年伊始,我们看到微软和谷歌正在争夺人工智能的主导地位。微软将AI聊天机器人引入iPhone和安卓版必应App,谷歌也开始展示新的人工智能聊天机器人搜索工具。 从目前来看,微软似乎处于领先地位。2019年,这家软件巨头向OpenAI投资10亿美元,从而获得了该公司46%的股份,并计划将ChatGPT整合到网络浏览器Edge和搜索引擎必应中。 仔细想想,微软最终可能凭借人工智能终结谷歌在搜索引擎领域的霸主地位。OpenAI预测,ChatGPT将在2023年实现2亿美元的创收,而到2024年底这一数值将达10亿美元。到2030年,人工智能很有可能成为创收和市值最高的行业。 未来,人工智能将无处不在并取代许多人类工作。在此背景之下,考虑如何使用这种强大的计算形式来使加密行业的机遇最大化是很有趣的。AI可以提高加密效率,区块链技术反过来也可以帮助解决机器学习特有的问题。 人工智能在加密领域的创新应用 1、有效监控动态头寸和实体风险 由于加密市场出现黑天鹅事件(具有潜在严重后果的不可预测的事件)的频率越来越高,传统的评估交易头寸风险的方法已经过时。在加密领域,分析师需要评估与跨协议的流动性变动有关的风险,鉴于需要分析的数据量很大,这几乎是人工不可能完成的。 人工智能可以再一次扩展人类的决策范围。结合其他一些常用的方法,人工智能可以监控所有协议中链上头寸的健康状况,并通过易于解读的信号针对潜在的风险进行提示。 此外,因为加密行业的协议越来越多,这使得分析工作变得愈加复杂,而人工智能可以给人类分析师提供了大量的帮助以减轻工作的难度。 2、强调流量分析、相关性和预测分析 在Celsius和FTX事件之后,加密行业急需制定相关方法以监测可能导致类似情况的事件和因素。为此,加密分析师和数据科学家探索了一系列方法,如代表性的基于钱包和实体的alerting signals,以及基于AI的资本流动汇总。 此外,AI技术还可以用于识别链上恶意操作。 有哪些代币值得关注? GRT-USD 跨多个系统的数据可访问性和可搜索性可能是区块链技术应用中需要改进的领域。 The Graph ( GRT-USD ) 是一个由 Yaniv Tal、Brandon Ramirez、Jannis Pohlmann 及其团队创建的平台,致力于简化这一过程。通过利用区块链数据,该系统使用户能够构建自定义数据图。 2020 年 12 月下旬,GRT 进入公开市场时的初始估值约为 0.12 美元。然而,在市场长期乐观的情况下,GRT 的价值大幅上涨,在 2021 年 2 月 21 日达到 2.88 美元的峰值。 尽管从高峰期有所下降,但 GRT 在 5 月下旬之前一直保持相当稳定,当时其价值跌破 1 美元并保持在这一水平,8 月和 11 月只有几次短暂的复苏。最终,GRT 以 0.6446 美元的价值结束了这一年。 尽管 The Graph 和加密货币市场在 2021 年都表现良好,但情况在 2022 年可能会更有利。最初,GRT 开局强劲,在 1 月 5 日达到 0.7287 美元的峰值。然而,它遭遇了大幅下跌,随着在俄罗斯入侵乌克兰后,其价值在 2 月 24 日跌至 0.3054 美元。 现在每个代币的交易价格低于 20 美分,The Graph 在加密 AI 生态系统中仍然是一个有趣的高价值游戏。值得注意的是,这个代币已经从底部翻了三倍多。因此,虽然有些人可能会关注 GRT 最近的下行趋势,但它在今年也一直是上行的重要推动者。 Fetch.ai Fetch.ai ( FET-USD )是一个利用智能合约促进点对点自治和人工智能解决方案生态系统的区块链平台,是我认为目前值得深入研究的人工智能加密货币之一。 这是因为该平台具有一系列自主经济代理人 (AEA) 应用程序,这些应用程序可以独立运行并相互通信,如Fetch.ai 网站所述。 FET 代币是提供 AI 解决方案的 Fetch.ai 生态系统的原生数字资产,在上个月经历了 90% 的大幅飙升。截至 2023 年 1 月 11 日,它的交易价格为 0.191 美元。FET 在撰写本文时已翻了一番以上,达到 43 美分,这一事实说明了一些问题。 根据CoinMarketCap 的数据,目前,FET 的市值为 3.56 亿美元,在最有价值的加密货币中排名第 113 位。 通过在 2019 年 2 月的私人销售中出售约 6.4% 的 FET 总供应量,该公司在 Binance Launchpad 上筹集了超过 6900 万美元。2021 年初,Fetch.ai 推出了 v2 主网,其中包括 30 个验证器。 也就是说,最近对 AI 加密货币的兴趣激增显然帮助了 Fetch。事实上,这个代币一直很火,在过去几周的几天里飙升了两位数。 因此,对于那些寻找动量代币的人来说,Fetch 提供了这一点。 小结 尽管我们距离真正的AGI(通用人工智能)或有感知能力的AI还很遥远,但不可否认,该领域在过去几年发展迅速。因此,我们有理由相信,在未来的某一天,人工智能将有能力管理我们的加密基金,并保障我们钱包的安全。 而与ChatGPT等大型语言模型整合将大大加快这一进程,届时,人人都可以轻松访问加密网络,加密行业也有潜力创造一个新的普惠的金融生态系统。 来源:金色财经
lg
...
金色财经
2023-03-01
OpenAI与AIGC:改变人类生产范式 通往“万物的摩尔定律”
go
lg
...
nAI CEO、YC 前主席 Sam
Altman
的图景中,AI 大模型发展的最终目标是 AGI(通用人工智能,Artificial General Intelligence),当这一目标实现的时候,人类经济社会将实现”万物的摩尔定律“,即万物的智能成本无限降低,人类的生产力与创造力得到解放。 归纳并演绎生成式 AI 是什么 AI 模型大致可以分为两类:决策式 AI 与生成式 AI。 根据机器学习教科书,决策式模型 (Discriminant Model)学习数据中的条件概率分布;生成式模型 (Generative Model)学习数据中的联合概率分布,两者的区别在于擅长解决问题的方式不同: 决策式 AI 擅长的是基于历史预估当下,有两大类主要的模型应用,一类是辅助决策,常用在推荐系统和风控系统中;第二类是决策智能体,常用于自动驾驶和机器人领域。 生成式 AI 擅长的是归纳后演绎创造,基于历史进行缝合式创作、模仿式创新——成为创作者飞船的大副。所谓 AIGC(AI Generated Content),便是使用生成式AI主导/辅助创作的艺术作品。 不过在10年代的机器学习教科书中,早已就有了这两类AI。为何 AIGC 在20年代初有了显著突破呢?答案是大模型的突破。 The Bitter Lesson大模型助 AIGC 进化 时间倒回到 19 年 3 月,强化学习之父 Richard Sutton 发布了名为 The Bitter Lesson(苦涩的教训)的博客,其中提到:”短期内要使AI能力有所进步,研究者应寻求在模型中利用人类先验知识;但之于AI的发展,唯一的关键点是对算力资源的充分利用。“ Seeking an improvement that makes a difference in the shorter term, researchers seek to leverage their human knowledge of the domain, but the only thing that matters in the long run is the leveraging of computation. 该文章在当时被不少 AI 研究者视为对自己工作的否定,极力辩护。但如果拉长时间线回看,会发现这位泰斗所言不虚: 机器学习模型可以从参数量级上分为两类:统计学习模型,如 SVM(支持向量机)、决策树等数学理论完备,算力运用克制的模型;和深度学习模型,以多层神经网络的深度堆叠为结构,来达到高维度暴力逼近似然解的效果,理论上不优雅但能高效的运用算力进行并行计算。 神经网络模型在上世纪 90 年代出现,但在 2010 年前,统计学习模型仍是主流;后来得益于 GPU 算力的高速进步,基于神经网络的深度学习模型逐渐成为主流。 深度学习充分利用了 GPU 擅长并行计算的能力,基于庞大的数据集、复杂的参数结构一次次实现出惊人的效果,刷新预期。大模型便是深度学习模型参数量达到一定量级,只有大型科技公司才能部署的深度学习模型。 2019年,OpenAI 从非营利组织变为营利性公司,接受微软 10 亿美金注资。这一合作奠定了他们有更多算力资源,并能依仗微软的云基础建设随时将大模型(Foundation Model)发布为商用 api。 与此同时,还有第三件事值得关注,大模型 AI 的研究方向出现了转变,从智能决策式 AI 转变为内容生成式 AI:原本主要大模型集中于游戏的智能决策体,如 DeepMind 开发的打败围棋冠军的 AlphaGo、OpenAI 开发的打败 Dota 职业选手的 OpenAI Five。 Transformer 模型(后文将详细介绍)的发布让 OpenAI 嗅到了更适合他们的机会——预训练语言模型。在那之后,他们开始在 AIGC 的方向上开枝散叶:沿着 2018 年时低调发布的 GPT 模型轨迹发布了一系列模型族,一次次刷新文本生成大模型的效果,印证 Sutton 提出的宗旨:充分运用海量算力让模型自由的进行探索和学习。 OpenAI的大模型发展之路 2019年2月:GPT-2 初版发布,1.2 亿参数量 2019年3月:OpenAI LP 成立 2019年7月:微软注资 10 亿美金 2019年11月:GPT-2 最终版发布,15 亿参数量,宣布暂时不开放使用为避免假信息伪造 2020年6月:GPT-3 发布,1750 亿参数量,后续开放 OpenAI API 作为商用 2021年1月:DALL·E 与 CLIP 发布 2021年10月:OpenAI Codex 发布,为 GPT-3 为 coding 场景的特化模型、Github Copilot 的上游模型 2022年4月:DALL·E2 发布 1、GPT-3,AI文本生成巅峰之作 深度学习兴起于计算机视觉领域的应用,而大模型的发展开始于 NLP 领域。在数据、算力充分发展的过程中,Transformer 模型以 attention 机制高度并行化的结构充分利用算力,成为 NLP 领域预训练模型的标杆。 著名的独角兽 Hugging Face 也是从对该模型的复现和开源起家。除了 attention 机制的高效之外,它还有两个重要特点:迁移学习(transfer learning)和自监督学习(self-supervised learning)。 顾名思义,迁移学习指在一个极庞大的数据集上充分学习历史上的各类文本,把经验迁移到其他文本上。 算法工程师会将第一步训练完成的模型存储下来,称为预训练模型。需要执行具体任务时,基于预训练版本,进行定制化微调(fine-tune)、或展示少许范例(few-shot/zero-shot)。 而自监督学习,得从机器学习中的监督学习讲起。前面提到若需要学习一匹马是否在奔跑,需要有一个完整标注好的大数据集。 自监督学习不需要,当 AI 拿到一个语料库,可以通过遮住一句话中的某个单词、遮住某句话的下一句话的方式,来模拟一个标注数据集,帮模型理解每个词的上下文语境,找到长文本之间的关联。该方案大幅提高了对数据集的使用效率。 谷歌发布的 BERT 是 Transformer 时代的先驱,OpenAI 发布的 GPT-2 以相似的结构、更胜一筹的算力后来居上。直到2020年6月,OpenAI 发布了 GPT-3,成为该模型族,甚至整个文本生成领域的标杆。 GPT-3 的成功在于量变产生质变:参数比 GPT-2 多了两个数量级(1750亿vs 15亿个参数),它用的最大数据集在处理前容量达到 45TB。 如此巨大的模型量级,效果也是史无前例的。给 GPT-3 输入新闻标题”联合卫理公会同意这一历史性分裂“和副标题”反对同性恋婚姻的人将创建自己的教派“,生成了一则以假乱真的新闻,评估人员判断出其为AI生成的准确率仅为 12%。以下是这则新闻的节选: 据《华盛顿邮报》报道,经过两天的激烈辩论,联合卫理公会同意了一次历史性的分裂:要么创立新教派,要么”保持神学和社会意义上的保守“。大部分参加五月教会年度会议的代表投票赞成进一步禁止 LGBTQ 神职人员的任命,并制定新的规则”规范“主持同性婚礼的神职人员。但是反对这些措施的人有一个新计划:于2020 年组成一个新教派”基督教卫理公会“。 要达到上述效果,成本不容小觑:从公开数据看,训练一个 BERT 模型租用云算力要花约 1.2 万美元,训练 GPT-2 每小时要花费 256 美元,但 OpenAI 并未公布总计时间成本。考虑到 GPT-3 需要的算力是 BERT 的 2000 多倍,预估发布当时的训练成本肯定是千万美元级别,以至于研究者在论文第九页说:我们发现了一个 bug,但没钱再去重新训练模型,就先这么算了吧。 2、背后DALL·E 2,从文本到图片 GPT-3杀青后,OpenAI 把大模型的思路迁移到了图片多模态(multimodal)生成领域,从文本到图片主要有两步:多模态匹配:将 AI 对文本的理解迁移至对图片的理解;图片生成:生成出最符合要求的高质量图片。 对于多模态学习模块,OpenAI 在 2021 年推出了 CLIP 模型,该模型以人类的方式浏览图像并总结为文本内容,也可以转置为浏览文本并总结为图像内容(DALL·E 2中的使用方式)。 CLIP (Contrastive Language-Image Pre-Training) 最初的核心思想比较简单:在一个图像-文本对数据集上训练一个比对模型,对来自同一样本对的图像和文本产生高相似性得分,而对不匹配的文本和图像产生低相似性分(用当前图像和训练集中的其他对的文本构成不匹配的样本对)。 对于内容生成模块,前面探讨了文本领域:10 年代末 NLP 领域生成模型的发展,是 GPT-3 暴力出奇迹的温床。而计算机视觉 CV 领域 10 年代最重要的生成模型是 2014 年发布的生成对抗网络(GAN),红极一时的 DeepFake 便是基于这个模型。GAN的全称是 Generative Adversarial Networks——生成对抗网络,显然”对抗“是其核心精神。 注:受博弈论启发,GAN 在训练一个子模型A的同时,训练另一个子模型B来判断它的同僚A生成的是真实图像还是伪造图像,两者在一个极小极大的博弈中不断变强。 当A生成足以”骗“过B的图像时,模型认为它比较好地拟合出了真实图像的数据分布,进而用于生成逼真的图像。当然,GAN方法也存在一个问题,博弈均衡点的不稳定性加上深度学习的黑盒特性使其生成。 不过 OpenAI 大模型生成图片使用的已不是 GAN 了,而是扩散模型。2021年,生成扩散模型(Diffusion Model)在学界开始受到关注,成为图片生成领域新贵。 它在发表之初其实并没有收到太多的关注,主要有两点原因: 其一灵感来自于热力学领域,理解成本稍高; 其二计算成本更高,对于大多高校学术实验室的显卡配置而言,训练时间比 GAN 更长更难接受。 该模型借鉴了热力学中扩散过程的条件概率传递方式,通过主动增加图片中的噪音破坏训练数据,然后模型反复训练找出如何逆转这种噪音过程恢复原始图像,训练完成后。扩散模型就可以应用去噪方法从随机输入中合成新颖的”干净“数据。该方法的生成效果和图片分辨率上都有显著提升。 不过,算力正是大模型研发公司的强项,很快扩散模型就在大公司的调试下成为生成模型新标杆,当前最先进的两个文本生成图像模型——OpenAI 的 DALL·E 2 和 Google 的 Imagen,都基于扩散模型。DALL·E 2 生成的图像分辨率达到了 1024 × 1024 像素。例如下图”生成一幅莫奈风格的日出时坐在田野里的狐狸的图像“: 除了图像生成质量高,DALL·E 2 最引以为傲的是 inpainting 功能:基于文本引导进行图像编辑,在考虑阴影、反射和纹理的同时添加和删除元素,其随机性很适合为画师基于现有画作提供创作的灵感。比如下图中加入一只符合该油画风格的柯基: DALL·E 2 发布才五个月,尚没有 OpenAI 的商业化api开放,但有 Stable Diffusion、MidJourney 等下游公司进行了复现乃至商业化,将在后文应用部分介绍。 3、OpenAI的使命——开拓通往 AGI 之路 AIGC 大模型取得突破,OpenAI 只开放了api和模型思路供大家借鉴和使用,没去做下游使用场景的商业产品,是为什么呢?因为 OpenAI 的目标从来不是商业产品,而是通用人工智能 AGI。 OpenAI 的创始人 Sam
Altman
是 YC 前总裁,投出过 Airbnb、Stripe、Reddit 等明星独角兽(另一位创始人 Elon Musk 在 18 年因为特斯拉与 OpenAI ”利益相关“离开)。 他在 21 年发布过一篇著名的博客《万物的摩尔定律》,其中提到 OpenAI,乃至整个 AI 行业的使命是通过实现 AGI 来降低所有人经济生活中的智能成本。这里所谓 AGI,指的是能完成平均水准人类各类任务的智能体。 因此,OpenAI 始终保持着学术型企业的姿态处于行业上游,成为学界与业界的桥梁。当学界涌现出最新的 state-of-art 模型,他们能抓住机会通过海量算力和数据集的堆叠扩大模型的规模,达到模型意义上的规模经济。 在此之后克制地开放商业化 api,一方面是为了打平能源成本,更主要是通过数据飞轮效应带来的模型进化收益:积累更富裕的数据优化迭代下一代大模型,在通往 AGI 的路上走得更坚实。 定位相似的另一家公司是 Deepmind——2010年成立,2014 年被谷歌收购。同样背靠科技巨头,也同样从强化学习智能决策领域起家,麾下的 AlphaGo 名声在外,Elon Musk 和 Sam
Altman
刚开始组局创办 OpenAI,首要的研究领域就是步 AlphaGo 后尘的游戏决策 AI。 不过 19 年后,两者的研究重心出现了分叉。DeepMind 转向使用 AI 解决基础科学如生物、数学等问题:AlphaFold 在预测蛋白质结构上取得了突破性的进展,另一个 AI 模型 AlphaTensor 自己探索出了一个 50 年悬而未决的数学问题:找到两个矩阵相乘的最快方法,两个研究都登上了 Nature 杂志的封面。而 OpenAI 则转向了日常应用的内容生成 AIGC 领域。 AIGC大模型是通往 AGI 路上极为重要、也有些出乎意料的一站。其重要性体现在 AI 对人类传达信息的载体有了更好的学习,在此基础上各个媒介之间的互通成为可能。 例如从自然语言生成编程语言,可以产生新的人机交互方式;从自然语言生成图片和视频,可以革新内容行业的生产范式。意外性则是,最先可能被替代的不是蓝领,而是创作者,DeepMind 甚至在协助科学家一起探索科研的边界。 OpenAI 的模式也给了下游创业者更多空间。可以类比当年预训练语言模型发展初期,Hugging Face把握机会成为大模型下游的模型开源平台,补足了模型规模膨胀下机器学习民主化的市场空间。 而对 AIGC 模型,未来会有一类基于大模型的创业公司,把预训练完成的 AIGC 模型针对每个子领域进行调优。不只需要模型参数优化,更要基于行业落地场景、产品交互方式、后续服务等,帮助某个行业真正用上大模型。 正如 AI 的 bitter lesson 一样矛盾,投资者需要短期投资回报率、研究者需要短期投稿成功率,尽管OpenAI 走在通往 AGI 正确的路上,这条路道阻且长,短期很难看到极大的突破。而 Sam
Altman
展望的大模型应用层公司很有可能有更高的高投资回报,让我们来介绍下主要的分类与创业者。 百家争鸣的 AIGC 大模型应用层 对应 OpenAI 大模型发布的顺序,模型应用层相对最成熟的是文本生成领域,其次是图片生成领域,其他领域由于还未出现统治级的大模型相对落后。 文本领域天然应用场景丰富,且 GPT-3 开放 api 很久,细分赛道很多。大致可以根据生成内容不同分为两类:机器编程语言生成、人类自然语言生成。前者主要有代码和软件行为的生成等,后者主要有新闻撰写、文案创作、聊天机器人等。 而图片领域当前还专注于图片自身内容的生成,预期随着未来3D、视频相关内容生成能力的增强,会有更多结合不同业务场景如游戏、影视这样细分领域的创业公司。 以下是海外各子领域创业公司的梳理,接下来将针对几个领域的重要公司进行介绍。 1、编程语言 文本领域最成熟的应用暂时不在人类自然语言,而是在代码等机器语言的生成领域。因为机器语言相对更结构化,易学习;比如鲜有长文本的上下文关系、基于语境的不同含义等情况。 (1)代码生成:Github Copilot 代表公司是微软出品的 Github Copilot,编程中的副驾驶。该产品基于 OpenAI 专门用 GPT-3 为编程场景定制的AI模型 Codex。使用者文字输入代码逻辑,它能快速理解,根据海量开源代码生成造好的轮子供开发者使用。提高一家科技公司 10% 的 coding 效率能带来很大收益,微软内部已进行推广使用。 相比低代码工具,Copilot 的目标群体是代码工作者。未来的低代码可能是两者结合:低代码 UI 界面实现代码框架搭建,代码子模块通过 Copilot 自动生成。 正如 Copilot 的 slogan:Don’t fly solo,没有 Copilot 的帮助 coder 的工作会变得繁冗,没有 coder 的指引 Copilot 生成的内容可能会出现纰漏。也有用户报告了一些侵犯代码版权、或代码泄露的案例,当前技术进步快于版权法规产生了一定的空白。 (2)软件行为生成:Adept.ai Adept.ai 是一家明星创业公司。创始团队中有两人是Transformer 模型论文作者,CEO 是谷歌大脑中大模型的技术负责人,已经获得 Greylock 等公司 6500 万美元的 A 轮融资。 他们的主要产品是大模型 ACT-1,让算法理解人类语言并使机器自动执行任务。目前产品形态是个 chrome 插件,用户输入一句话,能实现单击、输入、滚动屏幕行文。在展示 demo中,一位客服让浏览器中自动记录下与某位顾客的电话,正在考虑买 100 个产品。这个任务需要点击 10 次以上,但通过 ACT-1 一句话就能完成。 软件行为生成颠覆的是当下的人机交互形式,使用文字或语音的自然语言形式来代替当下人与机器的图形交互模式(GUI)。大模型成熟后,人们使用搜索引擎、生产力工具的方式都将变得截然不同。 2、自然语言 自然语言下还有多个应用型文本生成领域值得关注:新闻撰写、文案创作、对话机器人等。 (1)新闻撰写 最著名的是 Automated Inights。他们的结构化数据新闻撰写工具叫做 wordsmith,通过输入相应数据和优先级排序,能产出一篇基于数据的新闻报道。该工具已在为美联社每季度自动化产出 300 余篇财报相关报道,在雅虎体育新闻中也已经崭露头角。据分析师评价,由 AI 完成的新闻初稿已接近人类记者在 30 分钟内完成的报道水准。 Narrative Science是另一家新闻撰写生成公司,其创始人甚至曾预测,到 2030 年,90%以上的新闻将由机器人完成。 (2)文案创作 该领域竞争较为激烈,有copy.ai、Jasper、copysmith 等公司。他们基于 GPT-3 的能力加入了文案领域的人工模板与结构,为商家和个人创作者提供了快速为自己的商品、内容进行宣传的能力。以copysmith 为例: (3)对话机器人 前面提到的 Adept.ai 由Transformer 模型的一作和三作联合创立;而二作也创业了,他创办的 Character.ai 是当前对话机器人中使用效果最逼真的。 该对话机器人可以自定义或使用模板来定义角色的家庭、职业、年龄等,在此基础上保持一贯的设定和符合设定的对话风格。经常能体现出一定的共情对话能力带给人惊喜,并且支持多语言互通。 比如他们有已训练好的马斯克等名人和一些动漫角色,与他们对话会有很棒的代入感。 而商业化的对话机器人,在客服、销售等行业有巨大的市场空间,但如今还为成熟。 主要出现的问题有二: 其一,客服、销售行业遇到的客户往往情绪状态不稳定,AI 难以对情绪进行适应并调整对话内容; 其二,AI 的多轮对话能力较弱,无法保证持续有效的跟进问题。 (4)创作性文本 AI 对于长文本创作有一定困难,难以保持1000字以上的文本创作后仍能进行上下文的联系。 但基于短文本创作仍有一些有趣的应用,例如基于GPT-3的 AI Dungeon,可以引导 AI 创造一个虚拟游戏世界观。该领域进一步的成长需要期待未来 3-5 年,有成熟的能产出千字内容的 AI 出现。 3、多模态图片 DALL·E2 是极具突破性的 AIGC 大模型,但距离丰富生产力和创造力的成熟产品还有差距。因此有研究者顺着 DALL·E 和 CLIP 的思路开发了开源版本的扩散模型,就像当年的 Hugging Face 那样,并将其根据创作者社区的反馈转变为更成熟易用的商业产品。接下来就介绍几个主要出圈的模型: (1)Disco Diffusion 最早出圈的 AI 绘图工具是开源模型Disco Diffusion。发布时间比 DALL·E 2 稍晚,同样也是 CLIP + Diffusion Model 的结构,生成效果让许多插画师担心起了失业。 尽管很多插画师和 AI 工具爱好者的推荐都认可了该工具的易用性和生成效果的出众,但其生成时间略长有待优化,可以认为是大家对图片生成大模型的初体验。 (2)MidJourney 该模型发布后不久,Disco Diffusion 的开发者 Somnai 加入了 MidJourney,和团队一起打造了一款产品化的 Disco Diffusion。 Midjourney 的创始人 David Holz 并不是以CV(计算机视觉)研究为主,更关注人机交互。产品公测和主要交流平台都基于Discord,使用 Discord Bot 进行交互,打造了相当良好的社区讨论环境。 使用中印象深刻的有几个重要功能:MidJourney 画廊中可以看到每时每刻创作者们用 MJ 创作出的作品,用户可以对作品进行打分,每周排名靠前的作品将得到额外的 fast GPU 时间奖励。 同时,MJ官方还为用户贴心的提供了引导语 prompt 集合和 AI 擅长的风格指南,指导用户如何最高效的生成出他们想要的图片。 基于良好的产品和社区体验,MidJourney 的付费用户量也是目前最大的。 目前收费模式采用了订阅制,个人用户有两个档位,每月最多 200 张图片(超额另收费)的 10 美元/月,以及”不限量“图片的 30 美元/月;对企业客户,单人一年收费仅有 600 美元,且生成的作品可以商用(当前法规尚不完善,仍可能存在一定版权问题)。 (3)Stable Diffusion 如果说 MidJourney 是一个勤勤恳恳的绩优生,那么 Stability.ai 则是天赋异禀技术力强、诞生之初就备受 VC 追捧的富二代,公司估值已达到十亿美元。产品 Stable Diffusion 首要目标是一个开源共创模型,与当年的 Hugging Face 神似。 创始人 Emad 之前是对冲基金经理,用自己充裕的资金联合 LMU 和 Runaway ML开发了开源的 Stable Diffusion,在 Twitter 上使用扎克伯格在 Oculus 发布会上的照片作为背景,号召SD会成为”人类图像知识的基础设施“,通过开源让所有人都能够使用和改进它,并让所有人更好地合作。 Stable Diffusion 可以认为是一个开源版本的DALL·E2,甚至不少使用者认为是当前生成模型可以使用的最佳选择。官方版本部署在官网 Dream Studio 上,开放给所有用户注册。 相比其他模型,有很多可以定制化的点。不过官网只有 200 张免费额度,超过需要付费使用,也可以自行使用开源 Colab 代码版无限次使用。此外,Stable Diffusion 在压缩模型容量,希望使该模型成为唯一能在本地而非云端部署使用的 AIGC 大模型。 05 AIGC大模型的未来展望 1、应用层:多模态内容生成更加智能,深入各行业应用场景 上述的多模态图片生成产品当前主要局限于创作画作的草图和提供灵感。在未来待版权问题完备后, AIGC 内容能进入商用后,必然会更深入地与业界的实际应用进行结合: 以游戏行业为例, AI 作画给了非美术专业工作者,如游戏策划快速通过视觉图像表达自己需求和想法的机会;而对美术画师来说,它能够在前期协助更高效、直接地尝试灵感方案草图,在后期节省画面细节补全等人力。 此外,在影视动画行业、视频特效领域,甚至是文物修复专业,AI 图片生成的能力都有很大想象空间。当然,这个领域 AI 的能力也有着不小的进步空间,在下面的未来展望部分进行阐发。 目前 AIGC 存在 Prompt Engineering 的现象,即输入某一些魔法词后生成效果更好。这是目前大模型对文本理解的一些缺陷,被用户通过反向工程进行优化的结果。未来随着语言模型和多模态匹配的不断优化,不会是常态,但中短期内预期Prompt Engineering 还是得到好的生成内容的必备流程之一。 2、模态层:3D生成、视频生成 AIGC 未来3-5年内有明显进步 多模态(multimodal)指不同信息媒介之间的转换。 当前 AI 作图过程中暴露的问题会成为视频生成模型的阿喀琉斯之踵。 例如:AI 作画的空间感和物理规则往往是缺失的,镜面反射、透视这类视觉规则时常有所扭曲;AI 对同一实体的刻画缺少连续性。根本原因可能是目前深度学习还难以基于样本实现一些客观规则泛化,需要等待模型结构的优化进行更新。 3D生成领域也有很大价值:3D 图纸草图、影视行业模拟运镜、体育赛场现场还原,都是 3D 内容生成的用武之地。这一技术突破也渐渐成为可能。 2020年,神经辐射场(NeRF)模型发布,可以很好的完成三维重建任务:一个场景下的不同视角图像提供给模型作为输入,然后优化 NeRF 以恢复该特定场景的几何形状。 基于该技术,谷歌在2022年发布了 Dream Fusion 模型,能根据一段话生成 360 度三维图片。这一领域当前的实现效果还有优化空间,预期在未来3-5年内会取得突破性进展,推动视频生成的进步。 3、模型层:大模型参数规模将逼近人脑神经元数量 近年的大模型并未对技术框架做颠覆性创新,文本和图像生成领域在大模型出现前,已有较成熟方案。但大模型以量变产生质变。 从神经网络角度看,大脑有约 100 万亿神经元, GPT-3 有 1750 亿参数,还相差了 1000 倍的数量级,随着算力进步可以发展的空间还很大。 神经网络本质是对高维数据进行复杂的非线性组合,从而逼近所观测数据分布的最优解,未来一定会有更强的算力、更精妙的参数堆叠结构,来刷新人们对AI生成能力的认知。 4、成本结构决定大模型市场的马太效应 大模型最直接的成本便是能源成本(energy cost),GPT-3 发布时的训练成本在千万美元级别。难以在短期内衡量 ROI ,大科技公司才能训练大模型。 但随着近年模型压缩、硬件应用的进步,GPT-3 量级的模型成本很可能已降至百万美元量级,Stable Diffusion 作为一个刚发布一个月的产品,已经把原本 7GB 的预训练模型优化压缩至 2GB 左右。 在这样的背景下,算力成本在未来必然会逐渐变得更合理,但 AIGC 领域的另一个成本项让笔者对市场结构的预测还是寡头垄断式的。 大模型有明显的先发优势,来自巨大的隐形成本:智能成本。前期快速积累用户反馈数据能帮助模型持续追新优化,甩开后发的竞争者,达到模型性能的规模效应。 AI 的进化来自于数据的积累和充分吸收。深度学习,乃至当前的所有机器学习都是基于历史预估未来,基于已有的数据给到最接近真实的可能。 正如前文讨论的,OpenAI 的目标从来不是留恋于某个局部行业的商业产品,而是通过模型规模经济,不断地降低人类社会全局的智能成本,逼近通用人工智能 AGI。规模经济正体现在智能成本上。 5、虚拟世界的 AGI 会先于现实世界诞生 从更宏观的视角上,虚拟世界 AI 技术的智能成本比现实世界中来得低得多。现实里 AI 应用最普遍的是无人驾驶、机器人等场景,都对 Corner Case 要求极高。 对于AI模型而言,一件事超过他们的经验范畴(统计上out of distribution),模型将立马化身人工智障,不具备推演能力。现实世界中 corner case 带来的生命威胁、商业资损,造成数据积累过程中极大的试错成本。 虚拟世界则不同,绘图时遇到错位扭曲的图片,大家会在 Discord 中交流一笑了之;游戏 AI 产生奇怪行为,还可能被玩家开发出搞怪玩法、造成病毒传播。 因此虚拟世界,尤其是泛娱乐场景下的 AIGC 积累数据成本低会成为优势。这个领域的 AI 如果节省人力、生成内容产生的商业价值能大于算力成本,能很顺畅地形成低成本的正向循环。 伴随着另一个重要的革新——长期 Web3.0元宇宙场景下新内容经济生态的形成,虚拟世界内容场景下的 AI 很可能更早触及到 AGI。 来源:金色财经
lg
...
金色财经
2023-02-21
请停止炒作!ChatGPT其实没那么聪明,它更不是iPhone
go
lg
...
人员觉得冗长乏味的低级代码方面很有用。
Altman
自己说,他主要使用ChatGPT来总结和翻译长文档。 但从早期测试来看,ChatGPT仍是一个新奇事物。它还没有像一些人以及许多投资者所相信的那样改变人工智能的游戏规则。技术进步更多的是迭代而不是革命性的。它不是iPhone,至少现在还不是。
lg
...
金融界
2023-02-15
区块链行业大事件汇总:SeeleN 与 Shield 达成合作 聊天机器人ChatGPT火出圈
go
lg
...
元 OpenAI 首席执行官 Sam
Altman
创立的加密货币公司 Worldcoin 正在与包括主权财富基金在内的投资者讨论新一轮融资事宜。知情人士称 Worldcoin 希望以 30 亿美元的估值融资至多 1.2 亿美元,且本轮融资包括股权和 Token 融资。 此前报道,2022 年 3 月 23 日,Worldcoin 正寻求以 30 亿美元估值完成 1 亿美元融资,本轮融资将以 Token 出售的形式完成,该项目的原有投资者 a16z 和 Khosla Ventures 参与了本轮融资。 14、Web3 孵化器 ManesLAB 完成 180 万美元种子轮融资,YZB Investment 领投 Web3 孵化器、NFT 项目 Weirdo Ghost Gang 母公司 ManesLAB 宣布完成 180 万美元种子轮融资,YZB Investment 领投。 据了解,ManesLAB 是一家专注于 Web3 大规模采用的孵化器,未来将持续孵化更多 Web3 原生 IP 与区块链应用,助力 Web2 空间与 Web3 生态互融,打造新一代文化科技引擎 15、印度希望在 2023 年底之前在全国范围内推出 CBDC 知情人士表示,印度希望在 2023 年底之前在全国范围内推出其中央银行数字货币。 据悉,印度去年启动了两个 CBDC 试点。第一个是 CBDC-W,于 11 月 1 日开始,有 9 家银行参与。另一个是 CBDC-R,于 12 月 1 日在孟买、新德里、班加罗尔和布巴内斯瓦尔这四个城市启动。CBDC-R 适用于私营部门和印度公民,而 CBDC-W 仅限于金融机构,旨在提高银行间支付的效率。 另外,根据大西洋理事会的中央银行数字货币追踪系统,占全球 GDP 超过 95% 的 105 个国家正在探索 CBDC。 来源:金色财经
lg
...
金色财经
2023-02-14
AI战幔拉开 百度、微软、谷歌等科技企业拉响「红色警报」
go
lg
...
enAI的CEO山姆·奥特曼(Sam
Altman
)已经发布推文明确出席。 …… 几日内,AI概念再次爆火,各大科技企业纷纷拉响「红色警报」,是什么引起AI行业这么大波动? ChatGPT,对,就是这款去年年底马斯克站台,在科技圈火了一波的由OpenAI开发的聊天机器人。 受此影响,今日(2月7日)中午,A股市场AI相关概念股纷纷大涨,汉王科技今日已经是7连涨停,云从科技近5个交易日已上涨超过50%。 百度集团股价大幅上涨,今日最多飙17.96%,高见166.2元,创近一年高,成交额已突破65.04亿元。 ChatGPT是什么? 2022年12月1日,OpenAI公司低调推出GPT-3.5并邀请人们试用。GPT-3.5支持的通用聊天机器人原型ChatGPT,能回答一连串的问题、承认自己的错误、质疑不正确的假设,甚至是拒绝不合理的需求。 有了GPT-3.5的加持,ChatGPT经训练后提升了对答如流的能力。GPT-3只预测任何给定的单词串之后的文本,而ChatGPT则试图以一种更像人类的方式与用户发生互动。 ChatGPT的互动通常是非常流畅的,并且有能力参与各种对话主题。与几年前才面世的聊天机器人相比,ChatGPT有了巨大的改进。 OpenAI官方称,ChatGPT是在人类的帮助下创建并训练的,人类训练师对该AI早期版本回答查询的方式进行排名和评级。然后,这些信息被反馈到系统中,系统会根据训练师的偏好来调整答案。 有人对比了在谷歌的搜索结果和与ChatGPT的聊天结果之后,宣称谷歌已经“完蛋”了。 根据报道显示,ChatGPT已导入了至少1万个英伟达高端GPU。据花旗集团预估,ChatGPT使用量的快速增长,将可能使得英伟达相关产品在12个月内的销售额达到30亿至110亿美元。 瑞银报告数据显示,截至今年一月末,ChatGPT的月活用户已突破1亿,这距离它推出不过2个月时间,成为史上增长最快的消费者应用。 AI战幔已拉开 微软表示将在当地时间7日发布自家的AI产品。 据路透社获取到的一份活动邀请,微软计划将AI融入到所有产品之中,并将在7日具体介绍其发展情况。 OpenAI的CEO山姆·奥特曼(Sam
Altman
)已经发布推文明确出席。此前,微软已于1月23日确认将扩大投资ChatGPT开发商OpenAI。 据外媒此前报道,微软可能会将OpenAI的ChatGPT整合到Word、PowerPoint、Outlook和其他应用程序中,以便客户可以使用简单的提示自动生成文本,此举可能会改变超过10亿人编写文档、演示文稿和电子邮件的方式。 此外,微软还正在使用ChatGPT背后的人工智能来推出一款新版搜索引擎必应(Bing),基于此,微软可能在搜索引擎中提供自然语言搜索结果,而不是链接列表。 与此同时,谷歌母公司Alphabet宣布将推出名为“Bard”的AI(人工智能)聊天机器人服务以及更多的人工智能项目,以应对竞争对手微软所引领的新计算浪潮。 谷歌CEO桑达尔·皮查伊(Sundar Pichai)6日在其博客中发文介绍,Bard是基于对话应用语言模型(LaMDA)的实验性人工智能程序,目前已经开展测试,并在几周内向公众开放。 皮查伊写道:“Bard寻求将世界知识的广度与谷歌大型语言模型的力量、智慧和创造力相结合。它利用来自网络的信息提供最新的、高质量的回复。”他还强调,他希望谷歌的人工智能服务“大胆而负责”,但没有详细说明如何阻止Bard分享有害或滥用内容。 《华尔街日报》称,这是谷歌努力追赶诸如OpenAI等挑战者的一部分,OpenAI是流行聊天机器人ChatGPT的创造者。 当地时间2月6日,彭博社记者Mark Gurman在社交网络上发帖称,苹果将于下周举行年度内部AI峰会。它就像AI届的苹果全球开发者大会,但仅限于苹果员工。 2月7日,澎湃新闻获悉,百度内部类似于聊天机器人ChatGPT的项目名字确定为“文心一言”,英文名ERNIE Bot,将在三月份完成内测,面向公众开放。 目前,文心一言在做上线前的冲刺,联系去年9月,百度CEO李彦宏判断人工智能发展在“技术层面和商业应用层面,都有方向性改变”。 据推测,百度那时候就开始做文心一言,另按照谷歌和微软节奏,文心一言开放内测还有可能提前。 Web3领域值得关注的AI项目 Web3领域有很多AI概念的项目,2023年同样值得关注。如: Fetch.ai **Fetch.AI是一个点对点的AI驱动协议,也是 Binance 第二期 Launchpad 项目。**该项目的目标是,创建 AI 平台和服务,让任何人都可以随时随地大规模构建和部署 AI 服务。 Alethea AI **Alethea AI 是一个去中心化协议,用于创建使用 AI 与人互动的智能化身。**该平台催生了一个新的 NFT 标准,称为智能 NFT (iNFT),它可以创建嵌入 AI 动画、语音合成和生成 AI 功能的 NFT。 Hooked Protocol Hooked Protocol 是币安第 29 个 Launchpad 项目,旨在为 Web3 构建入口,为用户和企业提供量身定制的 Learn&Earn 产品体验和基础设施以进入 Web3 世界。 今年 1 月,Hooked 宣布推出由 Hooked AI 打造的 Avatar NFT,随后 Binance 创始人 CZ 转发了通过由 Hooked AI 生成的自己的头像,获得广泛传播。 小结 生成人工智能背后的计算机科学发展如此之快,以至于每个月都会出现创新。 ChatGPT 一经发布就在互联网上掀起了一场风暴,并受到包括作家、程序员、营销人员在内的使用者称赞欢迎。给谷歌和苹果等科技公司带来了很大压力。 2月6日,据《福布斯》报道,盖茨在接受专访时表示,聊天机器人ChatGPT以及AI领域的进展令人激动,AI将是“2023年最热门的话题”。 但盖茨也提到:“AI将变得有争议,这无疑是‘2023年最热门的话题’,它也将在一定程度上改变就业市场。这让我们不禁思考,边界在哪里?它显然并不会搞科学发明,但考虑到我们目前所见,未来5-10年内,这件事情就有可能发生了。” AI战幔已拉开,未来在教育、医疗等方面,AI都将彰显其价值。 来源:bress 来源:金色财经
lg
...
金色财经
2023-02-12
金色观察 | ChatGPT之父疯狂三部曲和加密项目WorldCoin
go
lg
...
的产品ChatGPT莫属。 而Sam
Altman
也因为作为OpenAI和ChatGPT的创始人一夜之间走到前台,名声大噪,被普通人所知。如果再细扒一下,你会发现Sam
Altman
的履历可谓极其耀眼。 Sam
Altman
履历 Sam
Altman
生于1985年,曾就读世界顶尖学府斯坦福大学计算机系,2005年从斯坦福辍学,2013年28岁时被Y Combinator创始人选中成为Y Combinator CEO。Y Combinator的投资版图中,拥有110家估值超1亿美元的公司和25家估值超10亿美元的公司,Airbnb、Dropbox、Coinbase、Reddit等顶级互联网公司都有YC背书。 据媒体报道,多年前,Sam
Altman
列出了一份他想涉足的技术清单,人工智能和能源位居榜首。2015年Sam
Altman
与马斯克等人一起创办了OpenAI。此外,Sam
Altman
还是商业核聚变公司Helion最大投资者之一。Helion是第一家将等离子体加热到1亿摄氏度的私营公司。Sam
Altman
经常亲自为Helion站台、招人。 Sam
Altman
还是全民基本收入UBI的大力支持者。为此,他还发起了极其疯狂和乌托邦的加密项目WorldCoin。2021年6月29日,Sam
Altman
和Alex Blania、Max Novendstern共同创立加密项目Worldcoin,获得2500万美元融资,得到a16z、Coinbase、1nfirmation、DCG、SBF、三箭资本、Multicoin、Variant Fund等硅谷大VC的支持(注:那时DCG、SBF、三箭资本都还如日中天),项目估值达到10亿美元。(参看金色财经此前报道“疯狂项目Worldcoin”) 其传奇或许与特斯拉创始人马斯克不相上下,也由此可见美国科技创新人才之辈出! Sam
Altman
眼中的三部曲 Helion、OpenAI、WorldCoin这三个项目正反映了Sam
Altman
眼中未来的社会景象。 1、商业核聚变提供几乎无线、低成本的丰富能源; 2、AI极大降低商品和服务成本; 进而让生产力指数级增长,而随着新技术进步可能会让许多工作被淘汰, 3、政府应该为每个公民提供基本生活工资,也即普遍基本收入UBI。而随着未来能源和AI等生产力的发展,商品和服务将极大丰富,足以让地球上每个人获得UBI满足基本生存,从而极大解放人类。 于是有了Worldcoin 据官网介绍,Worldcoin公司旨通过一种新颖的方法帮助经济体向加密代币过渡,并计划向全球每个人发行一种全球化的数字货币。用户可以通过其开发的一种球形装置(Orb)扫描眼球虹膜来形成特定的数字代码,并免费获得一定数量的加密货币(UBI),以加速全球加密技术的采用,同时通过零知识证明技术Semaphore保护用户隐私。任何人都可以创建账户,提交交易,并参与验证过程。 Worldcoin CEO Alex Blania解释说,其生态系统的包容性、免费代币的分发和对新注册用户的激励是推动加密采用的三个杠杆。注册Worldcoin不需要任何财务资源。Worldcoin通过使用名为Orb的定制硬件扫描用户眼球虹膜,来验证该用户的真实存在,是否已经获得了免费份额。全球各地的独立企业家将以“Orb运营商”的身份运营这些设备。这些运营商每注册一个Worldcoin用户就会获得奖励。 Worldcoin底层代币基于以太坊ERC-20标准,Worldcoin的可扩展性由以太坊上的乐观Rollup提供,乐观Rollup使用开源项目Hubble构建。 截止目前,Worldcoin官网显示已有117万用户,分布如下: 结语 目前来看,Helion、OpenAI、WorldCoin这三个项目,前两个可行性很高,OpenAI已经取得巨大成功。 而WorldCoin看起来非常的疯狂和乌托邦,其中UBI概念、隐私问题及其导致的社会政治形态等引发的争议也最大。 但不论争议如何,Sam
Altman
三部曲有其自己的内在逻辑。 正如乔布斯亲自撰写的经典广告《致疯狂的人》所说: “他们特立独行。他们桀骜不驯。他们惹是生非。他们格格不入。他们用与众不同的眼光看待事物。他们不喜欢墨守成规。他们也不愿安于现状。你可以认同他们,反对他们,颂扬或是诋毁他们。但唯独不能漠视他们。因为他们改变了寻常事物。他们推动人类向前迈进。或许他们是别人眼里的疯子,但他们却是我们眼中的天才。因为只有那些疯狂到以为自己能够改变世界的人……才能真正改变世界。” 来源:金色财经
lg
...
金色财经
2023-02-08
【小萧说币】别再追ChatGPT炒作!顶级风投证明一个事实:TA才是“有价”新独角兽
go
lg
...
那么大,其创始人山姆·奥特曼(Sam
Altman
)此前创办的加密项目Worldcoin才是真正有价值的新独角兽。 一句话形容现在的市场,就是全球都在炒AI。 微软的传奇还在烧,耗资百亿美元收购OpenAI,创始人比尔·盖茨再次缔造话题。 “人工智能AI的历史意义,完全不亚于互联网的诞生。” 就这样,ChatGPT已经成为历史上用户破亿速度最快的应用软件。 没错,它仅仅用了三个月时间完成壮举。 现在任何与AI能沾边的行业类股,在年初这波牛市行情下,股价基本都快速上涨。 但有一句话是这么说的,韭菜易当,真价难寻。 买在消息,卖在新闻的交易策略,从ChatGPT的炒作上显露无遗。这里需要强调的是,并不是说ChatGPT投资不理性,这种市场行为或许是理性的,但有一个矛盾点是,ChatGPT在这个时间点推出说明一个不争的事实:即聊天机器人的价值并没有那么大,至少目前形式的聊天机器人是这样。#ChatGPT火爆全网# 也就是说,如果我们将时间拉长到10年后,ChatGPT带给全球市场的影响力可能是即刻可见的,这比当前纯粹一个简单、易懂的软件所能带来的冲击更大、更明显。 实测ChatGPT的AI聊天功能随处可见,文章中就不再赘述。但软件归软件,即使谈了天花乱坠,甚至炒作起ChatGPT的硬技术,但都无法脱离它活在不对年代的观点。 (来源:ChatGPT网站) 也正因如此,顶级风投的一项投资行动,向金融市场证明一个事实:Worldcoin才是有价值的新独角兽。 随着ChatGPT的热烈回响,投资者现在也开始慢慢将目光转向同样为OpenAI创始人奥特曼所创办的“世界货币”(Worldcoin)。 它的宗旨很简单,就是推出一种新的、集体拥有的全球货币,公平地分配给尽可能多的人。 加密市场数据显示,2021年全球约有超过3亿加密货币用户,但加密货币平均拥有率仅为3.9%。 很多传统市场投资者不愿意将资金押注在比特币,乃至整个加密市场的核心原因,除了对其技术逻辑有歧义,再者就是“错过最佳买入行情,大量比特币掌握在少数巨鲸引发垄断”的恐惧中。 在此背景下,Worldcoin提出一个纯粹而又显得有些疯狂的愿景:“在一个人人共有的加密网路中,连接第一批10亿用户。” 将这个想法称为疯狂的主要原因是,比特币走过长达13年的崎岖,才艰难地使加密货币迈过3亿用户的里程碑。 但Worldcoin团队提出让人无法拒绝的理由:“区块链和密码学等革命性新技术,可以让我们共同做一些甚至政府都无法做到的事情,在全球范围内增加个人赋权和机会平等。” 没错,这听起来乌托邦,但这时候市场同样的叙述会将你重新相信它:当初互联网的爆发谁也没想过、比特币的出现令人意外。 投资者最想要得到的答案是:这样的叙述市场买单吗?果然买单! 2020年6月,Worldcoin以10亿美元的估值融资2500万美元,Digital Currency Group、Coinbase Ventures、a16z、Multicoin Capital,以及包括LinkedIn创始人Reid Hoffman在内的天使投资人参投。2021年3月底,Worldcoin再寻求以30亿美元估值筹集1亿美元融资,知名风险投资基金a16z继续加码。 Worldcoin实际上是一个运行在以太坊上的第二层(Layer 2)网路,Token代币供应上限为100亿枚。除了20亿枚将留给Worldcoin基金会和投资者,剩下的80亿枚都将在全球范围内免费分发。 从代币供给量能得知,这是一条漫长的路,团队需要不断增加市场需求,而这不免遇到一些阻碍,大规模分发的首要问题是:如何使代币分发到真正的人手中,而非程式码或机器?如何避免同一人的重复领取? 简单来说就是,如果要扩充市场“真”需求,就需要“真”人完成,但在没有KYC证明下的机制,Worldcoin被质疑很可能出现程式、代码输入以重复领取的情况。 为此,Worldcoin并没有停下脚步,而是选择展开币圈最声势庞大,同时也最引起争论的用户空投活动,即生物识别领空投。 轰动加密市场的一个实体产物就是出现:加密之眼Orb 回推历史一千年前,吉普赛人用水晶球预测未来,如今Worldcoin的营运商们用Orb为人们发放加密货币。 外观看似眼球的Orb,其实是一台虹膜识别设备,表面镀铬,约排球大小。由瑞典工业设计师Thomas Meyerhoffer设计,他此前曾就职于苹果和保时捷公司。 (来源:推特) Orb的主要功能是捕获人眼图像,并将其转换为唯一的Iris Hash。它首先扫描用户手机上的二维码,随后捕捉多个高分辨率的多光谱虹膜图像,并根据图像计算唯一的Iris Hash,最后由一组定制的安全传感器确保注册是合法的。 Worldcoin透过这种方式来验证这名用户是否真实存在,是否已经获得了免费份额。 (来源:CoinDesk) 尽管Orb不要求填写姓名、地址和电话号码等个人资讯,但生物识别的资讯采集显然更为敏感。在Worldcoin给出的方案中,采集眼部图像之后将其经过哈希函数生成唯一标识符,随后将永久删除眼部图像。最终,采用开源的Semaphore零知识证明系统来增强隐私保护。 (来源:Financial Times) Worldcoin联合创始人Alex Blania在2021年10月采访中表示,每个人收到的金额取决于他们在项目推出的早期阶段,随着加入的人越来越多,金额会逐渐减少,但金额大致在10美元到200美元之间。这笔钱将在两年内发放,其中10%可以立即在Orb生成的钱包应用程式中获得。 据该公司模型预测,到2023年将有超过10亿人凝视过Orb。 最难突破的一道关卡:法律规范 当前,很多国家都规定不允许商业公司将隐私数据转移到国外,Worldcoin显然触碰到了这条红线。以肯尼亚为例,这个非洲国家已透过一项数据保护法,禁止公司在未经新成立的数据保护专员办公室批准的情况下,将生物识别数据转移到国外。而根据数据同意书,Worldcoin目前在美国、英国、德国、日本和印度处理用户数据。 侵犯隐私的争议和法律问题,使得Worldcoin的发展之路受到不小的阻碍。据彭博社报导,在Orb营运商离去或被法规禁止开展业务后,Worldcoin已在至少七个国家停止了营运计划。 尽管被誉为新独角兽,甚至有着知名的VC风投愿意提供背书,但在诈欺质疑、侵犯隐私、违反隐私保护法规的多重困境下,Worldcoin最难突破的法律框架是法律规范问题。 Worldcoin新独角兽的默默前行 正当投资者都渐渐将Worldcoin剔除之际,仔细观察Worldcoin官方推特,并结合思考,却可以发现该项目其实在有序前行。 联合创始人Max Novendstern早在2021年项目初期就已经辞职独立创业,该时间点意味着离职与团队和项目本身的质量并无关系,且以奥特曼在硅谷的影响力,资金问题显然不是该项目的阻力。Worldcoin曾在一份声明中披露将公司转型为非营利性组织的设想,这很难不让人想到奥特曼在OpenAI上的操作,足够纯粹的初心,与切实落地的技术路线。 Worldcoin在最近官方进展中披露World ID的工作原理,并再次强调整个流程中,除非用户明确同意数据保管,否则图像永远不会离开Orb,且Iris Code和属于用户的钱包之间没有连结,协议完全保证了基于算法的单向隐私性。 (来源:推特) 这也就意味着,Worldcoin愿意主动接近法律规范,使其在传统市场上的接受度快速提高。 World ID可以看作是DID解决方案中截然不同的另一条路,旨在一劳永逸地解决隐私身份中的女巫攻击与人权问题,一旦成功将对整个公链生态与Web3社交产生深远影响。World ID曾在2022年10月宣布与Lens合作,将虹膜程式码引入其身份确实流程。同样的,虹膜程式码并不会泄露用户的身份,仅仅确保唯一性。 时间来到2023年1月27日,Worldcoin宣布历经三年推广,参与人数突破100万,并首度公开硬体Orb的设计与工作原理,为未来更大规模的开源做准备,似乎一切都在有序进行。 总结而言,ChatGPT的出现给投资者指明一条具体的路线,即OpenAI这家公司的初心,给科技带来真正的革新,这是牛市下迫切需要的题材。就像当年亿万富翁马斯克的崛起,人们需要故事。 但从战略发展上能看得出,ChatGPT还需要更多时间的验证,功能与价值似乎也未真正如炒作般高。转向Worldcoin加密项目,这似乎更值得受到投资者的关注,也更像是在近5年内,能够快速落地完成的“有价”新独角兽。#NFT与加密货币#
lg
...
小萧
2023-02-08
会员
揭秘“ChatGPT之父”的传奇人生:8岁会编程、从斯坦福辍学 囤积黄金枪支以防“世界末日”
go
lg
...
没有多少人谈论这一切背后的人:Sam
Altman
。
Altman
是ChatGPT母公司OpenAI的首席执行官,现年37岁。
Altman
的兄弟Jack
Altman
最近在推特上分享说,
Altman
的个人资料是“未知的领域”。 “我很高兴终于有人报道Sam了。在我看来,他实际上是在做一些有趣的事情,是时候让记者深入报道一下他了。这是未知的领域,”他写道。 据《纽约客》的一篇文章透露,
Altman
很小的时候就对科技感兴趣,在他八岁的时候就学会了编程。这篇文章追溯至2016年,向我们介绍了这位年轻CEO的世界。它还提到了
Altman
如何“为生存做准备”,并准备了枪支、黄金、水和其他物资,以防世界末日。 成长和创业经历
Altman
在美国密苏里州的圣路易斯市长大。据《纽约客》报道,早在八岁的时候,他就对学习如何编程产生了浓厚的兴趣,并弄清楚了如何为麦金塔电脑编程(Macintosh),这成为了他“在世界上的生命线”。 他进一步告诉该杂志,“作为同性恋,2000年代在中西部长大并不是最好的事情。”据报道,他在16岁时就向父母承认自己出柜。 他曾在斯坦福大学学习,在那里他学习计算机科学。然而,他和两位朋友辍学,三人开始开发一款名为Loopt的应用程序,其可以与朋友共享位置。2012年,该公司被所有者以4300万美元的估值出售。 在出售Loopt之后,
Altman
又成立了一家名为Hydrazine Capital的风险基金。快进到2014年,他被选为风险投资公司Y Combinator (YC)的首席执行官,接替Paul Graham。该公司成立于2005年,是AirBnb、Reddit、Quora和Twitch等多家公司的起步平台。 《纽约客》上的这篇文章还揭示了他对世界末日的信仰,以及他如何总是“为如果事情变糟而生存做好准备”。他说:“我为生存做准备。我的问题是,当我的朋友喝醉了,他们会谈论世界末日的方式。五年前,荷兰的一个实验室改造了H5N1禽流感病毒,使其具有超强的传染性,在接下来的20年里,一种致命的合成病毒被释放出来的可能性变得,嗯,不是零。另一个最受欢迎的场景是人工智能攻击我们,以及为了稀缺资源而用核武器战斗的国家。” 他补充说,“我尽量不去想太多。但我有枪、黄金、碘化钾、抗生素、电池、水、以色列国防军的防毒面具,还有大苏尔的一大片土地,我可以飞过去。”
Altman
的母亲在接受《纽约客》采访时重申了他对世界末日的信仰,她说他是一个“乐观主义者,但也是一个生存主义者,他认为事情总是会变得非常糟糕,世界上没有一个地方可以让他感到非常自在”。 她说:“Sam确实有很多事情要处理。他会打电话说他头疼,还会在谷歌上搜一下,所以也会有一些网络疑病症。我得让他放心,他没得脑膜炎或淋巴瘤,只是压力太大。” “Sam不是特别虔诚的教徒,但他在文化上是非常犹太的——他是一个乐观主义者,但也是一个生存主义者,他认为事情总是会严重恶化,世界上没有一个地方能让他感到非常自在。” 为什么要推出OpenAI? 据报道,OpenAI成立于2015年,旨在将人类从人工智能的潜在毁灭中拯救出来。该公司成立时是一家非营利性研究公司,致力于这项事业。Sam
Altman
和特斯拉CEO马斯克(Elon Musk)都是该公司的创始人之一。#ChatGPT火爆全网# 马斯克于2018年从OpenAI辞职,当时他的另外两家公司SpaceX和特斯拉也在研究人工智能技术。2019年,OpenAI宣布自己是一家“营利性”公司,并与微软和其他大公司合作。微软最近加强了与OpenAI的合作关系,并在一份新闻稿中透露了这一消息。 OpenAI自成立以来开发了几个人工智能工具,如ChatGPT和DALL.E。这两种语言在今天都很流行,在世界各地都在使用。
lg
...
夏洛特
2023-02-08
上一页
1
•••
96
97
98
99
100
下一页
24小时热点
小心非农修正值下调100万!法国政府垮台马克龙急了,黄金又创历史新高
lg
...
究竟发生了什么!?黄金惊现大跳水 金价创新高后暴跌近50美元 接下来如何走
lg
...
突发重磅!金融时报:特朗普要求欧盟对中国和印度征100%关税 以施压普京
lg
...
一天暴涨3000%、2000%!美股再现“买币即飞”疯狂场面
lg
...
三个月来首次:中国CPI跌入负值!经济今夏开始全面放缓?
lg
...
最新话题
更多
#Web3项目情报站#
lg
...
6讨论
#SFFE2030--FX168“可持续发展金融企业”评选#
lg
...
36讨论
#链界盛会#
lg
...
120讨论
#VIP会员尊享#
lg
...
1989讨论
#CES 2025国际消费电子展#
lg
...
21讨论