全球数字财富领导者
财富汇
|
美股投研
|
客户端
|
旧版
|
北美站
|
FX168 全球视野 中文财经
首页
资讯
速递
行情
日历
数据
社区
视频
直播
点评旗舰店
商品
SFFE2030
外汇开户
登录 / 注册
搜 索
综合
行情
速递
日历
话题
168人气号
文章
硬科技大票逆市大涨:龙头战法干死,产业打法盛行?
go
lg
...
注,幻方量化旗下新发布的国产AI大模型
DeepSeek-V3
性能匹敌GPT-4o,被网友称为“核动力镰刀”。这也验证了之前大家推测的量化私募通过模型训练,掌握了游资常用的短线操作手法,同时量化资金更加“快准狠”,加上拥有融券做空优势,所以量化完胜游资和散户也不足为怪。 盘面上看,最近一个多月以来,比较常见的是,市场强势股日内涨停以后会突然炸板下挫,或者一些连板强势股经常次日开盘就直接重挫甚至一字跌停,甚至会连续跌停好几个板,这种虐心走法连游资也是逃不出的,唯有融券做空者能赚钱。 既然在小票上,游资打不过量化,散户之前跟随游资响应的龙头战法也失效了,那资金就只能去找新共识方向了。每到跨年行情,一方面机构会做一波机构排名行情,另一方面也会提前布局来年的市场主线方向,像目前市场持续火热的算力链、AI眼镜端侧AI、芯片半导体等。 现阶段这些有硬科技产业逻辑和一定基本面的行业容量大票就成了相对亮眼的趋势方向了,有相关产业故事和机构资金加持的个股更成了年底最为活跃方向了,这些个股的盘面往往呈现机构主导、量化加速、散户跟风的新特征,被市场称之为“产业打法”。 这里简单梳理几个票的产业故事,不保真也不构成任何推荐。 ①中兴通讯:据传中兴微电子将推出自研大模型ASIC芯片,同时旗下努比亚手机旗舰款将深入植入大模型,把模型嵌入为手机内核,将手机转化为私人助理,同时将作为各种AI终端的核心控制平台,类小米米家。这些跟ZJ有合作关联。 ②上汽集团:市场有传闻公司与H高层领导近期接洽,将把飞凡系列放HW渠道销售,并且1月份公告与H汽车合作的具体事项和内容,另外之前也有传FSD入华合作但是被官方辟谣。 ③中芯国际:有消息称,中芯国际28纳米芯片的价格从原本的2500美元骤降至1500美元,降幅高达40%,另传W鹏芯旭,芯恩一起卖给SMIC,上海国资出钱,听说PB低于1x,先进制程1.5万片,还有28制程,合计11.5万片。 …… 那么哪些产业故事更为靠谱?接下来硬科技产业容量大票能否延续趋势? 量化占优背景下,游机共振行情能否存在?散户投资如何能避免“镰刀”找到更为稳健方向? 题材方向还有哪些的硬科技值得布局?跨年行情,中特估和科特估谁将更占优? …… 更专业详细的市场机会分享,欢迎加入《格隆汇研究院群英会》全天候直播:带你厘清真相,识别潜在风险,抓准真机会。 注意:文中所提个股和题材板块不构成任何推荐,仅为复盘和学习交流所用,投资决策需建立在自我独立理性思考和专业研判之上,市场有风险,投资需谨慎。
lg
...
格隆汇
2024-12-30
ETF盘中资讯|刚刚,深“V”逆转!创业板人工智能ETF华宝(159363)翻红走高持续吸金,博创科技涨超12%创新高
go
lg
...
吸金5200万元! 中信证券研报认为,
DeepSeek
新一代模型的发布意味着AI大模型的应用将逐步走向普惠,助力AI应用广泛落地;同时训练效率大幅提升,亦将助力推理算力需求高增。我们持续看好AI产业链的加速落地机遇,建议重点关注AI应用、AI Infra、AI算力三大主线。 作为2025年最主要投资方向,人工智能有望继续作为市场主线,引领跨年行情。从同类AI主题指数表现来看,创业板人工智能指数中长期业绩更优。数据显示,截至2024.12.27,创业板人工智能指数自2023年以来累计涨幅超117%,大幅跑赢中证人工智能、科创AI等同类主题指数! 来源:Wind,统计区间2023.1.1-2024.12.27。创业板人工智能指数2019-2023年年度涨跌幅分别为:51.87%、20.1%、17.57%、-34.52%、47.83%,指数成份股构成根据该指数编制规则适时调整,其回测历史业绩不预示指数未来表现。 全方位把握AI主题机会,建议重点关注全市场首只创业板人工智能ETF华宝(159363)。资料显示,创业板人工智能ETF华宝(159363)被动跟踪创业板人工智能指数,根据主题特征,指数一键布局AI产业三件套“硬件+软件+应用”,更高效地捕捉AI主题行情,成份股“光模块”龙头含量高,能充分享受全球AI产业链红利。 数据来源:沪深交易所、Wind、中证指数公司等。注:“全市场首只”是指首只跟踪创业板人工智能指数的ETF。 风险提示:创业板人工智能ETF被动跟踪创业板人工智能指数,该指数基日为2018.12.28,发布日期为2024.7.11。创业板人工智能指数2019-2023年年度涨跌幅分别为:51.87%、20.1%、17.57%、-34.52%、47.83%,指数成份股构成根据该指数编制规则适时调整,其回测历史业绩不预示指数未来表现。文中指数成份股仅作展示,个股描述不作为任何形式的投资建议,也不代表管理人旗下任何基金的持仓信息和交易动向。基金管理人评估的本基金风险等级为R4-中高风险,适宜积极型(C4)及以上的投资者,适当性匹配意见请以销售机构为准。任何在本文出现的信息(包括但不限于个股、评论、预测、图表、指标、理论、任何形式的表述等)均只作为参考,投资人须对任何自主决定的投资行为负责。另,本文中的任何观点、分析及预测不构成对阅读者任何形式的投资建议,亦不对因使用本文内容所引发的直接或间接损失负任何责任。基金投资有风险,基金的过往业绩并不代表其未来表现,基金管理人管理的其他基金的业绩并不构成基金业绩表现的保证,基金投资须谨慎。
lg
...
金融界
2024-12-30
“算力即国力”定调,
DeepSeek-v3
火爆全网!算力板块领跑市场
go
lg
...
周末期间,国内大模型
DeepSeek-v3
强势“出圈” ,算力即国力定调。 今日,算力板块表现活跃,领跑市场。 截至发稿,安诺其20CM涨停,中辰股份涨超16%,群兴玩具、云赛智联、电光科技涨停,奥飞数据涨超8%,朗科科技、并行科技涨超7%,协创数据、莲花控股涨超6%,铜牛信息涨超5%。 算力需求将下降? 周末,量化巨头幻方旗下、“AI界拼多多”深度求索(
DeepSeek
)自研的大模型
DeepSeek-v3
刷屏国内外,引发行业大讨论。 一方面,
DeepSeek-v3
的成本很低,在预训练阶段仅使用2048块GPU训练了2个月,且只花费557.6万美元。 另一方面,性能上,
DeepSeek-v3
多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型,并和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。 不过,需要注意的是,2048块H800并非全部训练算力投入。 其中,不包括
DeepSeek
R1模型(对标OpenAI o1)生成的高质量数据消耗的算力,以及模型架构的探索调试阶段消耗的算力。 据悉,
DeepSeek
之所以能用较少的算力就开发出性能强大的大模型,关键是在后训练的时候把一个叫R1的模型,它的推理能力蒸馏到了V3模型上,这样后训练部分就基本没有成本。
DeepSeek-v3
的成功引发了关于算力、大模型训练方式的大讨论,部分投资者担忧行业对算力的需求或大幅下降。 但分析来看,即使诸如
DeepSeek-v3
之类的大模型成功了,但字节、小米、理想等科技巨头在算力上的投资并不会减少,反而因为有了这些成功案例,让大家看到了行业潜力,有望进一步加码。 而且,
DeepSeek
的成功将给国内其他企业带来启发,如何更高效地利用算力资源,有望促使更多的中小型企业入局。 未来,随着开发成本的降低,AI应用及软件有望迎来大机遇。 官方定调:算力即国力 12月28日,由中央广播电视总台和国务院国资委联合制作的大型系列纪录片《大国基石》第三期推出《算力引擎》,明确提出算力即国力,它是数字经济时代的新质生产力。 截至2023年,中国算力总规模位列全球第二,累计建成国家级超算中心14个,全国在用超大型和大型数据中心达633个、智算中心达60个。 投资上,中信证券认为,
DeepSeek
新一代模型的发布意味着AI大模型的应用将逐步走向普惠,助力AI应用广泛落地;同时训练效率大幅提升,亦将助力推理算力需求高增。算力需求的指数级提升与模型训练推理成本的下降将构成产业飞轮,带动全产业链扩张,随着AI进一步普及到日常生活与产业当中,推理算力需求将仍然驱动AI算力产业链持续增长。 中信建投指出,当前随着AI算力需求提升,尤其是国内供给和需求两端都出现积极变化,对于数据中心的需求也将随之增加,尤其是高功率的超大型数据中心机房,也对电力、温控等环节提出了更高要求,建议重点关注IDC产业链,包括IDC服务商、电力设备、液冷温控等环节。
lg
...
格隆汇
2024-12-30
ETF早资讯|算力即国力!上海推进建立AI“模塑申城”,专注数据科技的大数据产业ETF(516700)或迎东风?
go
lg
...
赛持续加速,小米拟搭建GPU万卡集群;
DeepSeek-V3
发布,性能达到全球顶尖水平。算力侧投入加大,应用端或将迎来质变,建议持续关注AI产业链相关标的。 国金证券指出,AI的进步和数据管理解决方案相辅相成,AI的训练依赖于高质量、高效的数据处理。随着AI提效逐渐被企业认可,企业对IT或者AI方向的支出也会随之提升,而专注于这些高效的数据管理技术的平台和公司或将会受益。 数据安全为王,科技自立自强!布局工具上,信创含量近70%的大数据产业ETF(516700)被动跟踪中证大数据产业指数,重仓数据中心、云计算、大数据处理等细分领域,权重股汇聚中科曙光、科大讯飞、紫光股份、浪潮信息、中国长城、中国软件等龙头股,看好科技自主可控方向的投资者,或可重点关注这三方面的催化: ①高层号召“科技打头阵”,新质生产力方向有望突围; ②数字中国顶层设计,激活数字生产力,国产替代进程加快; ③乘风信创热潮,信创2.0有望加速,科技自主可控前景广阔。 本文图片、数据来源于iFinD、沪深交易所、华宝基金。 特别提醒:近期市场波动可能较大,短期涨跌幅不预示未来表现,基金投资可能产生亏损。请投资者务必根据自身的资金状况和风险承受能力理性投资,高度注意仓位和风险管理。 风险提示:大数据产业ETF(516700)被动跟踪中证大数据产业指数,该指数基日为2012.12.31,发布于2016.10.18,该指数近5年分年度涨跌幅为:2019年,44.95%;2020年,3.57%;2021年,-3.5%;2022年,-25.68%;2023年,1.4%,指数成份股构成根据该指数编制规则适时调整,其回测历史业绩不预示指数未来表现。本文中提及的指数成份股仅作展示,个股描述不作为任何形式的投资建议,也不代表管理人旗下任何基金的持仓信息和交易动向。基金管理人评估的该基金风险等级为R3-中风险,适宜平衡型(C3)及以上的投资者,适当性匹配意见请以销售机构为准。任何在本文出现的信息(包括但不限于个股、评论、预测、图表、指标、理论、任何形式的表述等)均只作为参考,投资人须对任何自主决定的投资行为负责。另,本文中的任何观点、分析及预测不构成对阅读者任何形式的投资建议,亦不对因使用本文内容所引发的直接或间接损失负任何责任。基金投资有风险,基金的过往业绩并不代表其未来表现,基金管理人管理的其他基金的业绩并不构成基金业绩表现的保证,基金投资须谨慎。
lg
...
金融界
2024-12-30
分红手续费减半!A股市场迎来多项重磅利好,国货航上市成年末焦点
go
lg
...
捉设备需求有望放量。 此外,国内大模型
DeepSeek-V3
的发布也引发市场热议。据最新技术报告,
DeepSeek-V3
在英语、代码、数学、汉语及多语言任务上表现出色,训练成本极低,市场认为这将对算力板块产生重要影响。 并购重组活跃,外延式增长拓宽市场空间 并购重组市场近期也呈现出活跃态势。中核科技宣布正在筹划通过发行股份购买资产的方式收购中核西仪71.9650%股权。这表明外延式增长仍然是A股市场的热点话题,并购活动频繁发生,每周都有重大案例涌现。为了促进高质量发展,政府出台了一系列支持政策,鼓励并购重组市场的活跃度,从而为市场带来了新的增长机遇。 国货航成功IPO,成为年内最大规模发行 国货航今日正式登陆A股市场,以每股2.3元的价格发行新股,募集资金达34.95亿元,成为2024年A股市场上最大规模的首次公开募股(IPO)。国货航的主要业务涵盖航空货运服务、航空货站服务及综合物流解决方案三个板块。此次募集的资金将主要用于飞机引进及备用发动机购置、综合物流能力提升建设和信息化与数字化建设等方面。公司预计2024年全年营收将达到204.2亿元,同比增长36.89%,归母净利润14.6亿元,同比增长26.47%。 值得注意的是,国货航背后有着强大的股东背景,包括中航集团在内的多家央国企参与了战略配售。此外,菜鸟、国泰货运等知名物流企业也是其重要股东之一。国货航的成功上市不仅标志着国内唯一一家载旗货运航空公司完成了IPO,也为中航系增添了一家新的上市公司,进一步巩固了其在航空运输领域的地位。
lg
...
金融界
2024-12-30
音频 | 格隆汇12.30盘前要点—港A美股你需要关注的大事都在这
go
lg
...
全技术保护体系; 8、幻方量化重磅发布
DeepSeek-V3
:性能媲美GPT-4,训练成本创新低; 9、证监会发布新《公司法》配套制度规则实施相关过渡期安排; 10、民政部鼓励有条件的地方在元旦春节前夕增发一次性生活补贴; 11、稳楼市,今年政策出台数量已达780余条; 12、香港二手楼价今年累跌近7%; 13、上海:搭建超大规模城市级的模拟应用场景 率先赋能具身智能、自动驾驶等大模型实训; 14、上海:到2025年底建成世界级人工智能产业生态 力争全市智能算力规模突破100EFLOPS; 15、贵州茅台:拟以30亿-60亿元回购股份; 16、国联证券:购买民生证券99.26%股份并募集配套资金获证监会批复; 17、年内最大规模IPO国货航12月30日上市交易; 18、荣耀据报完成股改 适时启动IPO; 19、今日港股英诺赛科、健康之路、讯飞医疗科技上市; 20、南下资金大肆加仓中芯国际、联想集团和小米; 21、公告精选︱一拖股份:终止重大资产出售事项;博创科技:拟以3.91亿元收购长芯盛18.16%股份; 22、公告精选(港股)︱VESYNC(02148.HK):Victory III Co., Ltd拟溢价约33.33%将公司私有化 30日复牌; 23、A股投资避雷针︱康希通信:股东盐城半导体和共青城康晟拟减持不超过3%股份。
lg
...
格隆汇
2024-12-30
估值2000亿!荣耀IPO进程渐近
go
lg
...
的关注。 02 幻方量化发布AI大模型
DeepSeek-V3
,引发对算力需求的担忧 12月26日晚,国产AI大模型
DeepSeek-V3
版本正式发布,这一模型来自头部量化投资机构——幻方量化。 通过算法和工程上的创新,
DeepSeek-V3
的生成吐字速度从 20 TPS 大幅提高至 60 TPS,相比 V2.5 模型实现了3倍的提升,为用户带来更加迅速流畅的使用体验。当前版本的
DeepSeek-V3
暂不支持多模态输入输出。 在多项基准测试中,
DeepSeek-V3
的成绩超越了Qwen2.5-72 B和Llama-3.1-405 B等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。 在数学能力方面,
DeepSeek-V3
大幅超过了所有开源闭源模型。在Aider多语言测试排行榜中,
DeepSeek-V3
以48.4分排名第二,仅次于OpenAlo1的61分。而在LiveBench的测评中,
DeepSeek
v3是最强的开源大语言型,并在非推理模型中,排名第二。 来源:
DeepSeek
公众号 官方介绍,通过在算法、框架和硬件方面的协同优化,
DeepSeek
V3的训练成本变得非常经济。 值得注意的是,根据其技术报告,作为一个超过700B参数的大模型,他的GPU用量、GPU小时数都远远低于Meta的Llama-3-405B:GPU数量大约是1/8,GPU小时数量大约是1/11。 简单来说,相对于其它前沿大模型,
DeepSeek-V3
消耗的训练计算量较少,但其性能却能够比肩乃至更优;这一度引发了市场对算力需求的担忧,周五A股下午一点半中科曙光、澜起科技、龙芯中科、景嘉微等算力相关个股出现跳水。 广发证券报告表示,
DeepSeek-V3
算力成本降低的原因有两点。第一,
DeepSeek-V3
采用的
DeepSeek
MoE是通过参考了各类训练方法后优化得到的,避开了行业内AI大模型训练过程中的各类问题。第二,
DeepSeek-V3
采用的MLA架构可以降低推理过程中的kv缓存开销,其训练方法在特定方向的选择也使得其算力成本有所降低。 不过,有业内人士表示,
DeepSeek-V3
本身是一个垂类的模型,并不是OpenAl、Gemini、豆包等通用大模型。是针对特定任务和设计进行的,旨在提高效率的同时保持高性能。 除此之外,它的训练时间减少和算力需求降低,主要得益于算法优化、硬件适配和模型架构改进。然而,这并不意味着 AI训练对算力的要求普遍降低,因为 AI领域的整体趋势仍然是模型规模和复杂性不断增加。
DeepSeek-V3
体验地址:chat.
deepseek
.com 论文链接:https://github.com/
deepseek-ai
/
DeepSeek-V3
/blob/main/
DeepSeek_V3.pdf
03 上海:到2025年底,建成世界级人工智能产业生态 12月27日,上海市印发《关于人工智能“模塑申城”的实施方案》。《实施方案》提出,到2025年底,建成世界级人工智能产业生态,力争全市智能算力规模突破100EFLOPS,形成50个左右具有显著成效的行业开放语料库示范应用成果,建设3-5个大模型创新加速孵化器,建成一批上下游协同的赋能中心和垂直模型训练场。 其中提到,打造超大规模自主智算集群。建设自主可控智算支撑底座,支撑全市人工智能创新应用的算力需求。加快通用图形处理器、专用集成电路、可编程门阵列等自主智算芯片攻关,强化分布式计算框架、并行训练框架等自主软件研发。建设自主智算软硬件适配中心,推进自主智算芯片测试和集群验证。培育智算云服务商,探索训推一体的服务模式。优化市级智能算力公共服务平台,提升算力资源统筹调度能力。提升绿电供给能力,降低全市各类智算中心用电成本。 其中还提到,依托头部企业和科研机构,打造虚实融合的超大型实训场,建设支撑实训场的高性能计算集群、高精度三维建模和高质量训练数据集,创建与物理实体对应的高精度仿真环境和仿真训练系统,搭建超大规模城市级的模拟应用场景,率先赋能具身智能、自动驾驶等大模型实训。
lg
...
格隆汇
2024-12-29
资金动向 | 北水大买港股近85亿港元,大肆加仓中芯国际近14亿港元
go
lg
...
领导。 另外,早前有传雷军亲身重金招聘
DeepSeek
开源大模式
DeepSeek-V2
的关键开发者之一罗福莉加入小米,预料或会负责领导小米大模型团队。 工商银行:消息面上,据香港联交所12月27日披露的文件,工商银行获中国平安人寿保险股份有限公司及关联方增持4,500万股H股股份,价值约2.19亿港元。 微盟集团:开源证券表示,微信交易电商逐步完善,微盟集团作为腾讯的龙头服务商有望率先受益。该行指,2024年公司持续降本增效及收缩亏损业务,2025年有望实现扭亏为盈,上调至“买入”评级。 中海油:消息面上,国资委近期出台指导意见,鼓励央企市值管理行动。光大证券指出,随着天然气旺季景气来临,以及中长期天然气需求向好、市场化改革持续推进,“三桶油”作为天然气龙头有望充分受益。另外,“三桶油”估值较海外巨头显著低估,长期增长能力有望持续兑现。 美团:据“美团Meituan”微信公众号,在此前七次算法公开的基础上,美团将设立算法公示专区,持续与各界沟通算法的基本原理、运行机制等,增加算法的透明度,推动算法更加公正、更加人性化。进一步完善骑手防疲劳机制。着重解决骑手超长时间跑单等问题,当前已在华东等地区进行试点。结合试点情况,征集各界意见后,美团近期将在全国全面落地“弹窗提醒和强制下线结合”的防疲劳措施,并在未来探讨更多举措,避免骑手过度劳动影响身心健康。
lg
...
格隆汇
2024-12-27
港股收评:恒生科技指数涨0.69%,芯片股、军工股大涨,小米股价逼近历史新高
go
lg
...
正式通过大模型备案。据称,小米有意引进
DeepSeek
开源大模型
DeepSeek-V2
的关键开发者罗福莉,显示小米强攻AI领域的决心。 军工股上涨,中航科工涨超3%,中船防务涨超1%。 铁路及公路板块冲高,成都高速涨超7%,安徽皖通高速公路涨超5%,沧港铁路涨超3%,越秀交通基建涨超2%,四川成渝高速公路、湾区发展、深圳国际等涨超1%。 新能源车企板块表现活跃,理想汽车涨超6%,华晨中国涨超5%,小米集团涨超4%,零跑汽车、蔚来涨超3%,北京汽车涨超1%。 煤炭股多数上涨,中国神华、兖煤澳大利亚、首钢资源涨超1%。 医药外包概念多数走低,泰格医药、药明康德跌超3%,凯莱英、康龙化成跌超2%。 绿电概念股走弱,福莱特玻璃、金风科技、新特能源跌超4%,新奥能源跌超2%,华电国际电力股份、华润电力、华能国际电力股份跌超1%。 餐饮股下跌,小菜园跌超4%,九毛九、海底捞跌超3%,海伦司跌近2%。 今日,南下资金净买入84.93港元,其中港股通(沪)净买入39.18亿港元,港股通(深)净买入45.75亿港元。 展望未来,国泰君安香港认为,美联储将在2025年继续降息,港股估值中枢将继续边际改善,往前看港股将维持震荡向上,投资者需重视结构性的行业机会。其认为,港股市场以“N”型震荡向上行情为主,阶段内不乏弹性机会,但要重视积极寻找结构性行业机会。
lg
...
格隆汇
2024-12-27
中美重磅!华尔街日报:中国人工智能公司已找到变通途径 正快速追赶美国同行
go
lg
...
最成功的对冲基金经理之一投资的初创公司
DeepSeek
在11月发布了其最新大型语言模型的预览版。该公司表示,该程序的能力优于OpenAI的推理模型01,后者于9月以预览版形式推出。 最近几周,其他中国公司也发表了类似的声明。由中国互联网巨头阿里巴巴(Alibaba)和腾讯(Tencent)支持的初创公司Moonshot AI表示,它开发了一个专门研究数学的模型,其能力接近OpenAI 的 o1,而阿里巴巴表示,他们自己的一个实验研究模型在数学上优于OpenAI的o1预览版本。 这些公司还没有发表描述他们模型的论文,而且难以评估这些说法,因为对人工智能模型的能力没有一个公认的测试。不过,一些美国专家表示,他们对对这些模型“印象深刻”。 OpenAI前研究员、现任人工智能企业家Andrew Carr表示,中国正在“更快地追赶”。他说,
DeepSeek
的研究人员试图复制OpenAI的推理模型,“在几个月内就弄清楚了,坦率地说,我的许多同事对此感到惊讶。” 一个用来做比较的测试是美国国际数学邀请赛(AIME),它是为了挑战最聪明的高中数学学生而设计的。
DeepSeek
表示,其模型在AIME上击败了OpenAI。但《华尔街日报》利用今年AIME的15个问题进行的一项实验发现,OpenAI的o1预览模型比
DeepSeek
、Moonshot和阿里巴巴的实验模型更快找到了答案。在一个假设的双人游戏中涉及策略的字谜中,OpenAI程序在10秒内给出了答案,而
DeepSeek
花了两分钟多时间。 在第一次尝试中获得正确答案仍然是一项壮举,因为文字问题经常难倒人工智能程序。 自2022年以来,中国人工智能开发人员一直面临美国对世界上最先进的人工智能芯片的限制,包括芯片领导者英伟达(Nvidia)的芯片。在12月,拜登政府再次收紧出口管制规定。 但《华尔街日报》称,开发人员已经找到了变通途径。在由阿里巴巴和腾讯支持的初创公司Moonshot,创始人杨植麟表示,该公司专注于强化学习,模仿人类的试错过程。这种方法可能在提高性能方面较少地使用计算能力。 自去年年底以来,人工智能开发人员越来越多使用一种名为“混合专家模型”(Mixture of Experts, MoE)的技术,这种技术能降低对芯片的需求。 腾讯表示,11月发布的MoE模型的性能堪比Facebook母公司Meta Platforms今年7月推出的Llama 3.1模型。审阅了两家公司发表的论文的研究人员表示,腾讯的模型可能是用Meta使用的大约十分之一的计算能力训练的。
DeepSeek
最初是High-Flyer的人工智能研究部门。High-Flyer是一家拥有80亿美元资产的量化对冲基金管理公司,以利用人工智能进行交易而闻名。2021年,
DeepSeek
将大约1万块英伟达的A100芯片连接起来,形成了一个用于人工智能训练的集群,该集群被称为Fire-Flyer 2。 在今年8月发表的一篇论文中,
DeepSeek
表示,Fire-Flyer 2的性能接近英伟达包含类似芯片的系统,但中国的系统成本更低,能耗更低。
DeepSeek
在5月份发表的关于其MoE模型的论文在业界引起了广泛关注,该模型采用了一种更有效地处理数据的技术。 人工智能初创公司Anthropic的联合创始人Jack Clark在他的博客中写道:“中国绕过出口管制的一种方法是,利用它可以访问的硬件建立非常好的软件和硬件培训。” Clark称:“‘中国制造’将成为人工智能模型的一部分,就像电动车、无人机和其他技术一样。” 《华尔街日报》指出,许多中国人工智能开发人员已经找到获取受限制的英伟达芯片的方法,包括通过与中间商和海外数据中心的交易。尽管如此,据中国高管称,缺乏尖端芯片对中国初创企业来说是痛苦的,而且差距还会扩大。英伟达的客户正准备大规模部署其最新的人工智能数据中心芯片Blackwell。 马斯克(Elon Musk)的xAI公司已经用10万块英伟达芯片建造了一个数据中心,最近还筹集了50亿美元来做更多的事情。亚马逊网络服务公司(Amazon Web Services)计划用数十万块本土芯片打造一台大型人工智能超级计算机。 专注于开源模型的
DeepSeek
强调数学和编码。Moonshot凭借其类似ChatGPT的聊天机器人Kimi在中国消费者中广受欢迎,并以其处理长文本的能力而闻名。
lg
...
tqttier
2024-12-27
上一页
1
•••
273
274
275
276
277
下一页
24小时热点
中美突发重磅表态!特朗普称不会降低对中国的关税以启动中美贸易谈判
lg
...
特朗普刚刚传出重大“关税”信号!中美贸易谈判前,美国总统罕见提起TA……
lg
...
市场老兵警告:台币突然飙升,预示美元“雪崩”风险!最大的脆弱点在中国
lg
...
【直击亚市】特朗普预告重大协议、知情人士提前爆料!盯紧中美瑞士会谈
lg
...
特朗普刚刚又发帖了!“兴奋的日子”刺激全球股市,美元强势重返100大关
lg
...
最新话题
更多
#Web3项目情报站#
lg
...
6讨论
#SFFE2030--FX168“可持续发展金融企业”评选#
lg
...
32讨论
#链上风云#
lg
...
92讨论
#VIP会员尊享#
lg
...
1942讨论
#CES 2025国际消费电子展#
lg
...
21讨论