DeepSeek低调升级，上下文窗口容量由64k扩展至128k，“深度思考（R1）”标识被简化为“深度思考”

2025-08-20 09:25:17

金融界

关注

获赞

粉丝

喜欢

— 分享 —

摘要：DeepSeek线上模型近日迎来重要升级，官方群于8月19日晚间宣布，其线上版本模型已迭代至DeepSeek V3.1，核心升级点在于上下文窗口容量从原有的64k扩展至128k，这一调整显著提升了模型处理长文本的能力。目前，用户可通过网页、App及小程序等渠道体验新模型。与此同时，App和

DeepSeek线上模型近日迎来重要升级，官方群于8月19日晚间宣布，其线上版本模型已迭代至DeepSeek V3.1，核心升级点在于上下文窗口容量从原有的64k扩展至128k，这一调整显著提升了模型处理长文本的能力。目前，用户可通过网页、App及小程序等渠道体验新模型。与此同时，App和网页端的“深度思考（R1）”标识被简化为“深度思考”，引发关于模型融合推理与非推理功能的猜测，但官方尚未对此作出正式说明。

新模型已上传至开源平台Hugging Face，不过当前仅开源了未经指令微调的Base版本，包含配置文件、脚本代码及模型权重，供开发者自由下载。与前代DeepSeek-V3-0324相比，V3.1在参数量和张量类型上未作明显调整，但在实际应用中展现出多维度能力提升。智东西第一时间对新模型进行了实测，覆盖编程、物理定律应用、创意写作、数学计算及交互体验等多个场景。

在编程领域，V3.1的前端开发能力进步显著。测试中，模型根据“设计一个美观且带科技感的个人博客网站”的指令，生成的代码长度增加，开发耗时略有延长，但最终成果在布局合理性、栏目规划及视觉效果上明显优化。例如，新版本网页增加了图片元素和动态特效，而前代模型生成的页面则相对简单。

小游戏开发测试中，V3.1复现了Chrome浏览器断网时的小恐龙游戏，仅用约2分钟完成开发。游戏在画风和基础规则上与原版接近，但存在小恐龙外观还原度不足、障碍生成逻辑单一及跳跃机制缺乏“二段跳”等问题，导致可玩性受限。不过，这一速度仍体现了模型在快速原型开发上的潜力。

针对小众历史问题的回答测试，V3.1展现出更强的信息准确性和语境丰富度。当被问及“布须曼人喝牛奶吗”这一涉及非洲南部少数民族的冷门问题时，新模型不仅提供了更多细节，且经核查后新增内容均有事实依据，避免了前代模型可能出现的虚构回答。此外，V3.1的回答语气更活泼温暖，采用口语化表达，先肯定问题价值再展开解释，并增加背景描述，使回答更具故事性。

在争议性话题处理上，V3.1表现出更强的平衡性。例如，针对“马斯克和阿尔特曼谁更牛”的问题，模型虽认为马斯克更突出，但未遵循指令仅输出一个名字，而是同时肯定了两位AI领域领袖的贡献，体现了避免非黑即白结论的倾向。

创意写作方面，V3.1的诗歌创作延续了前代的比喻风格，同时语言更流畅。数学能力测试中，模型在基础算术题（如9.8-9.11）上虽经历曲折过程，但最终能给出正确答案，反映出计算逻辑的优化。

物理定律应用测试中，用户反馈V3.1生成的小球弹跳效果更符合真实物理规律，支持重力、摩擦、旋转速度等参数调整，展现了模型在科学模拟领域的进步。此外，模型还能根据用户需求生成自画像等个性化内容。

目前，新模型已吸引大量开发者关注，部分网友推测，Hugging Face主页后续可能开源更多V3.1版本。此次升级标志着DeepSeek在长文本处理、多场景适应及交互体验上迈出重要一步，未来动态值得持续观察。

敬告读者：本文为转载发布，不代表本网站赞同其观点和对其真实性负责。FX168财经仅提供信息发布平台，文章或有细微删改。

DeepSeek低调升级，上下文窗口容量由64k扩展至128k，“深度思考（R1）”标识被简化为“深度思考”

24小时热点

交易商排行

DeepSeek低调升级，上下文窗口容量由64k扩展至128k，“深度思考（R1）”标识被简化为“深度思考”lg...

24小时热点

交易商排行

DeepSeek低调升级，上下文窗口容量由64k扩展至128k，“深度思考（R1）”标识被简化为“深度思考”