DeepSeek-V3.1正式发布,官方详解迈向AIAgent时代的第一步
8月21日消息,深度求索官方今日正式对外发布DeepSeek-V3.1。本次升级包含以下主要变化:
混合推理架构:一个模型同时支持思考模式与非思考模式;
更高的思考效率:相比DeepSeek-R1-0528,DeepSeek-V3.1-Think能在更短时间内给出答案;
更强的Agent能力:通过Post-Training优化,新模型在工具使用与智能体任务中的表现有较大提升。
官方App与网页端模型已同步升级为DeepSeek-V3.1。用户可以通过“深度思考”按钮,实现思考模式与非思考模式的自由切换。
DeepSeekAPI也已同步升级,deepseek-chat对应非思考模式,deepseek-reasoner对应思考模式,且上下文均已扩展为128K。同时,APIBeta接口支持了strict模式的FunctionCalling,以确保输出的Function满足schema定义。
另外,深度求索增加了对AnthropicAPI格式的支持,让用户可以将DeepSeek-V3.1的能力接入ClaudeCode框架。
编程智能体测评(SWE使用内部框架测评,相比开源框架OpenHands所需轮数更少;TerminalBench使用官方Terminus1framework)
在代码修复测评SWE与命令行终端环境下的复杂任务(Terminal-Bench)测试中,DeepSeek-V3.1相比之前的DeepSeek系列模型有明显提高。
搜索智能体测评(测试结果调用商用搜索引擎API+网页过滤+128Kcontextwindow;R1-0528使用内部workflow模式测试;HLE测试同时使用python与search工具)
DeepSeek-V3.1在多项搜索评测指标上取得了较大提升。在需要多步推理的复杂搜索测试(browsecomp)与多学科专家级难题测试(HLE)上,DeepSeek-V3.1性能已大幅领先R1-0528。
深度求索官方的测试结果显示,经过思维链压缩训练后,V3.1-Think在输出token数减少20%-50%的情况下,各项任务的平均表现与R1-0528持平。
在各项评测指标得分基本持平的情况下(AIME2015:87.5/88.4,GPQA:81/80.1,liveCodeBench:73.3/74.8),R1-0528与V3.1-Think的token消耗量对比图
同时,V3.1在非思考模式下的输出长度也得到了有效控制,相比于DeepSeek-V3-0324,能够在输出长度明显减少的情况下保持相同的模型性能。
V3.1的Base模型在V3的基础上重新做了外扩训练,一共增加训练了840Btokens。Base模型与后训练模型均已在Huggingface与魔搭开源。附开源地址:
Base模型:
HuggingFace:
https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base
魔搭:
https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1-Base
后训练模型:
HuggingFace:
https://huggingface.co/deepseek-ai/DeepSeek-V3.1
魔搭:
https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1
需要注意的是,DeepSeek-V3.1使用了UE8M0FP8Scale的参数精度。另外,V3.1对分词器及chattemplate进行了较大调整,与DeepSeek-V3存在明显差异。建议有部署需求的用户仔细阅读新版说明文档。
深度求索将于北京时间2025年9月6日凌晨起,对DeepSeek开放平台API接口调用价格进行如下调整:
执行新版价格表(如下图所示,详见定价页面);
取消夜间时段优惠。
在9月6日前,所有API服务仍按原价格政策计费,用户可继续享受当前优惠。同时,为更好地满足用户的调用需求,深度求索已进一步扩容API服务资源。
相关阅读:
《DeepSeek开源新模型V3.1:约685B参数,上下文长度拓展至128K》
《DeepSeek通知线上模型版本升级至V3.1,上下文长度拓展至128k》
-
DeepSeek-V3.1正式发布,官方详解迈向AIAgent时代的第一步
官方App与网页端模型已同步升级为DeepSeek-V31。用户可以通过“深度思考”按钮,实现思考模式与非思考模式的自由切换。
2025-09-03 09:08:14 -
谷歌翻译转型“外语教练”:游戏化教学,AI定制课程帮你突击场景交流
科技媒体TechSpot昨日(8月20)发布博文,报道称谷歌翻译即将引入“练习”(Practice)功能,转型为具备交互式语言学习能力的平台。
2025-09-03 09:08:12 -
AI带娃,月入千万
睡眠预测+AI记录
2025-09-03 09:08:08 -
63次出手,超百亿资金,大厂们机器人赛道疯狂补短板
京东竟然是标的最少的那个?
2025-09-03 09:08:06 -
陶哲轩“断粮”后,25年首次绝望怒吼:美国科学命脉被砍断
这一刀,砍断了美国科学的命脉!
2025-09-02 09:09:19 -
悄悄火起来的“AI拉布布”
AI为玩具装上了灵魂,潮玩为AI赋予了温度
2025-09-02 09:09:15
-
OpenAI发布新版GPT-4 Turbo模型丨夸克上线大模型AI PPT产品丨百度美图WPS与三星达成Galaxy AI合作
【AI奇点网2024年1月26日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。
2025-02-18 10:51:08 -
微软Bing聊天机器人现已加入Chrome和Safari插件,但仍有字数与发送次数限制
微软的人工智能 Bing 聊天机器人现在可以在谷歌 Chrome 和苹果 Safari 浏览器上使用了,用户只需访问 Bing com 网站,就可以和该聊天机器人进行交流,但目前仍有字数与发送次数限制。
2025-04-09 15:08:19 -
字节跳动公测首个AI聊天机器人App“豆包”丨快手首个大语言模型“快意”亮相丨腾讯:下半年发布自研基础大模型
【AI奇点网2023年8月21日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。
2025-04-04 15:01:22 -
国内版 “苹果vision pro” 发布! 中兴通讯发布nubia Neo Air智能眼镜
中兴通讯在2023年上海世界移动通信大会上正式发布了nubia Neo Air智能眼镜,这款全球首款轻型双目屈光一体化GPT无线AR智能眼镜引入了与GPT同类AIGC算法,实现了语音指令、即时问答和智能交互等功能,为用户提供全场景的智能助理。
2025-04-15 14:05:26 -
苹果WWDC 2023开发者大会上只字未提“AI”,库克和他的伙伴有着自己的独特思考
最近科技圈最令媒体人“困惑”的一件事,莫过于全球科技领军巨头苹果公司,竟然对AI人工智能“不闻不问”。
2025-04-24 11:23:24 -
物理AI如何变革机器人产业?英伟达与宇树、银河通用创始人闭门会全实录
AI与机器人协同进化,迈向下一个科技时代
2025-08-17 07:05:32 -
AI正在掏空大脑,思想沦为残废,未来只分AI的「主人」和「奴隶」
AI分化:驾驶员主动驾驭,乘客思维退化
2025-08-18 09:06:03 -
AI绘画ComfyUI进阶教程丨插件IPAdapter的详细使用教程,风格模仿,换脸全靠它
哈咯大家好,本期正式给大家带来进阶部分的插件讲解教程,虽然很多朋友一直在用IPA但可能很多朋友还不太了解其结构,希望这期关于ipa用法的教程能对大家有所帮助吧!
2024-12-17 22:49:30 -
通义听悟如何管理我的记录_通义听悟管理我的记录使用方法
通义听悟支持创建文件夹,分类管理记录;可以对记录进行收藏、移动、重命名等操作。
2024-12-27 12:45:31 -
OpenAI奥特曼预测:「智能时代」即将到来丨字节即梦AI推出Loopy“对口型”功能丨钉钉推出365会员,强化AI付费服务
【AI奇点网2024年9月24日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。
2025-01-09 11:11:37








