DeepSeek V4没有等到,但是DeepSeekAI把DeepSeek V3升级到DeepSeek V3.1了,小幅更新,但核心架构和参数不变

标签:#DeepSeekAI##DeepSeekV3.1# 时间:2025/08/20 04:15:45 作者:小木

就在几个小时前,DeepSeekAI宣布官方的聊天模型从DeepSeek-V3升级到了DeepSeek-V3.1,上下文拓展至128K。虽然,官方目前没有给出这个模型的详细信息,DataLearnerAI已经搜集到很多信息供大家参考。


这里说的支持128K应该是官网的聊天版本,模型本身此前的版本也是支持128K的。另外,官网DeepSeek-V3.1给出的解释是3.1版本的知识截止到2024年8月,而DeepSeek-V3是截止到2024年7月份。

[TOC]

DeepSeek-V3.1很可能是支持推理和非推理混合模式的模型

此外,DeepSeekAI也在HuggingFace上上传了DeepSeek-V3.1-Base版本模型。从模型结构上来看,这个版本模型和3月24日发布的DeepSeek-V3-0324并无区别。主要是增加了4个不同的特殊tokens:

<|search_begin|>(id:128796)
<|search_end|>(id:128797)
<think>(id:128798)
</think>(id:129899)

这意味着这个版本的模型可能是一个类似Qwen3的混合架构模型,即同时支持非推理模式和推理模式。推特以及其它网络平台也出现了DeepSeek V3.1出现推理过程的截图。因此,这部分应该是没错的。

DeepSeek-V3.1更加擅长使用搜索工具

除了上面新增了search的token外,在官网的测试也能发现,即使你没有选择开启互联网搜索,DeepSeek依然可能使用搜索工具。


这意味着DeepSeek V3.1可能更加倾向于使用互联网工具。

DeepSeek-V3.1代码逻辑和数学推理更强,但推理成本更低

官网的DeepSeek-V3.1模型自己给出的解释是,V3.1 在复杂数学计算、逻辑推理和代码生成方面进行了优化,提高了准确性和推理深度,尤其是在多步推理任务上表现更好。同时,它增强了代码理解和生成能力,能够更好地处理复杂编程问题,并支持更多编程语言。

更重要的是,虽然DeepSeek-V3和DeepSeek-V3.1两者都支持 128K 超长上下文,但 V3.1 在长文本理解和信息提取方面更加精准,减少了冗余回答。特别是后者,推特上有人测试,相同的问题,DeepSeek-V3.1的回复更简短,但是答案更准确一丢丢!

DeepSeek-V3.1在大模型命令行编程得分接近Claude Opus 4

虽然官方没有给出更多信息,但是已经有人测出了DeepSeek V3.1在Aider上的测试(截止2025年8月份,Aider是测试大模型在命令行编程,类似Claude Code场景能力的评测基准),得分为71.6分!什么概念呢?就是非推理模型当前全球第一,分支接近Claude Opus 4(thinking)模式,超过了此前DeepSeek-R1。


数据来源DataLeaernerAI的Aider Benchmark排行榜:https://www.datalearner.com/benchmarks/aider-benchmark

这是网友用网页测试的结果,如果没有带搜索工具,这个提升是非常明显的,因为DeepSeek V3-0324才55.1分,提升接近30%!

参考:https://old.reddit.com/r/LocalLLaMA/comments/1muq72y/deepseek_v31_scores_716_on_aider_nonreasoning_sota/

此刻,童鞋们,虽然官方没有公布DeepSeek V3,但是你们看到这个文章后很短的时间可能就能看到官方公告,关于DeepSeek V3.1更多信息关注DataLearnerAI的模型信息卡:https://www.datalearner.com/ai-models/pretrained-models/deepseek-v-3_1

欢迎大家关注DataLearner官方微信,接受最新的AI技术推送