DataLearner 标志DataLearnerAI
AI技术博客
大模型评测排行
大模型评测基准
AI大模型大全
AI资源仓库
AI工具导航

加载中...

DataLearner 标志DataLearner AI

专注大模型评测、数据资源与实践教学的知识平台,持续更新可落地的 AI 能力图谱。

产品

  • 评测榜单
  • 模型对比
  • 数据资源

资源

  • 部署教程
  • 原创内容
  • 工具导航

关于

  • 关于我们
  • 隐私政策
  • 数据收集方法
  • 联系我们

© 2026 DataLearner AI. DataLearner 持续整合行业数据与案例,为科研、企业与开发者提供可靠的大模型情报与实践指南。

隐私政策服务条款
目录
目录
  1. 首页/
  2. 博客列表/
  3. 博客详情

DeepSeek V4没有等到,但是DeepSeekAI把DeepSeek V3升级到DeepSeek V3.1了,小幅更新,但核心架构和参数不变

2025/08/20 04:15:45
574 阅读
DeepSeekAIDeepSeekV3.1

就在几个小时前,DeepSeekAI宣布官方的聊天模型从DeepSeek-V3升级到了DeepSeek-V3.1,上下文拓展至128K。虽然,官方目前没有给出这个模型的详细信息,DataLearnerAI已经搜集到很多信息供大家参考。

这里说的支持128K应该是官网的聊天版本,模型本身此前的版本也是支持128K的。另外,官网DeepSeek-V3.1给出的解释是3.1版本的知识截止到2024年8月,而DeepSeek-V3是截止到2024年7月份。

  • DeepSeek-V3.1很可能是支持推理和非推理混合模式的模型
  • DeepSeek-V3.1更加擅长使用搜索工具
  • DeepSeek-V3.1代码逻辑和数学推理更强,但推理成本更低
  • DeepSeek-V3.1在大模型命令行编程得分接近Claude Opus 4

DeepSeek-V3.1很可能是支持推理和非推理混合模式的模型

此外,DeepSeekAI也在HuggingFace上上传了DeepSeek-V3.1-Base版本模型。从模型结构上来看,这个版本模型和3月24日发布的DeepSeek-V3-0324并无区别。主要是增加了4个不同的特殊tokens:

<|search_begin|>(id:128796)
<|search_end|>(id:128797)
<think>(id:128798)
</think>(id:129899)

这意味着这个版本的模型可能是一个类似Qwen3的混合架构模型,即同时支持非推理模式和推理模式。推特以及其它网络平台也出现了DeepSeek V3.1出现推理过程的截图。因此,这部分应该是没错的。

DeepSeek-V3.1更加擅长使用搜索工具

除了上面新增了search的token外,在官网的测试也能发现,即使你没有选择开启互联网搜索,DeepSeek依然可能使用搜索工具。

这意味着DeepSeek V3.1可能更加倾向于使用互联网工具。

DeepSeek-V3.1代码逻辑和数学推理更强,但推理成本更低

官网的DeepSeek-V3.1模型自己给出的解释是,V3.1 在复杂数学计算、逻辑推理和代码生成方面进行了优化,提高了准确性和推理深度,尤其是在多步推理任务上表现更好。同时,它增强了代码理解和生成能力,能够更好地处理复杂编程问题,并支持更多编程语言。

更重要的是,虽然DeepSeek-V3和DeepSeek-V3.1两者都支持 128K 超长上下文,但 V3.1 在长文本理解和信息提取方面更加精准,减少了冗余回答。特别是后者,推特上有人测试,相同的问题,DeepSeek-V3.1的回复更简短,但是答案更准确一丢丢!

DeepSeek-V3.1在大模型命令行编程得分接近Claude Opus 4

虽然官方没有给出更多信息,但是已经有人测出了DeepSeek V3.1在Aider上的测试(截止2025年8月份,Aider是测试大模型在命令行编程,类似Claude Code场景能力的评测基准),得分为71.6分!什么概念呢?就是非推理模型当前全球第一,分支接近Claude Opus 4(thinking)模式,超过了此前DeepSeek-R1。

数据来源DataLeaernerAI的Aider Benchmark排行榜:https://www.datalearner.com/benchmarks/aider-benchmark

这是网友用网页测试的结果,如果没有带搜索工具,这个提升是非常明显的,因为DeepSeek V3-0324才55.1分,提升接近30%!

参考:https://old.reddit.com/r/LocalLLaMA/comments/1muq72y/deepseek_v31_scores_716_on_aider_nonreasoning_sota/

此刻,童鞋们,虽然官方没有公布DeepSeek V3,但是你们看到这个文章后很短的时间可能就能看到官方公告,关于DeepSeek V3.1更多信息关注DataLearnerAI的模型信息卡:https://www.datalearner.com/ai-models/pretrained-models/deepseek-v-3_1

DataLearner 官方微信

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

DataLearner 官方微信二维码
返回博客列表

相关博客

  • DeepSeekAI开源第二代数学理论证明大模型DeepSeek-Prover-V2:让AI帮助数学家证明数学理论!
  • DeepSeekV3-0324发布:DeepSeek V3基础上大幅升级推理能力和前端网页的美观度,多项评测结果超过GPT-4.5
  • 20条关于DeepSeek的FAQ解释DeepSeek发布了什么样的模型?为什么大家如此关注这些发布的模型?他们真的绕过CUDA限制,打破了Nvidia的护城河了吗?
  • OpenAI的推理大模型o1模型的强有力竞争者!DeepSeekAI发布DeepSeek-R1-Lite-Preview~实测结果令人惊喜!
  • 开源多模态大模型新选择:DeepSeekAI(深度求索科技)开源全新多模态大模型DeepSeek-VL模型,包含可在手机端运行的13亿规模tiny多模态模型。

热门博客

  • 1Dirichlet Distribution(狄利克雷分布)与Dirichlet Process(狄利克雷过程)
  • 2回归模型中的交互项简介(Interactions in Regression)
  • 3贝塔分布(Beta Distribution)简介及其应用
  • 4矩母函数简介(Moment-generating function)
  • 5普通最小二乘法(Ordinary Least Squares,OLS)的详细推导过程
  • 6使用R语言进行K-means聚类并分析结果
  • 7深度学习技巧之Early Stopping(早停法)
  • 8H5文件简介和使用