刚刚,DeepSeek新模型开源,五大能力变化明显,附一手体验
8月20日报道,昨日晚间,DeepSeek在官方群宣布:DeepSeek线上版本模型已升级至DeepSeekV3.1,上下文窗口从原有的64k扩展至128k,网页、App、小程序都可体验这一模型。
此外,DeepSeek还将App、网页端的“深度思考(R1)”字样改为了“深度思考”,有网友猜测这是融合推理模型与非推理模型的征兆,但DeepSeek官方尚未发布任何关于这一改动的消息。
左侧为旧版页面,右侧为新版页面
这一模型现已上传至HuggingFace,不过目前仅开源了未经指令微调的Base版本(基础模型),其配置文件、脚本代码和模型权重均可供下载。与DeepSeek-V3-0324相比,模型参数量、张量类型没有明显变化。
上方为DeepSeek-V3-0324开源网页,下方为DeepSeek-V3.1-Base开源网页
开源地址:
https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base
第一时间在网页端对新模型的能力进行了体验,从初步体验结果来看,这一模型在编程(尤其是前端能力)、物理定律理解、创意写作、数学、回答语气等方面都出现不同程度的提升和变化。
以下是体验的部分案例:
1、个人网站开发
我们向DeepSeek-V3.1发送了如下消息:“设计一个美观的个人博客网站,带有科技感,直接开发成可用网页。”
与DeepSeek-V3-0324相比,DeepSeek-V3.1写出的代码长度增加,开发耗时更久,不过,其最终交付的结果在完成度、美观性上有了一定提升。
可以看到,DeepSeek-V3.1打造的网页在布局上更为合理,重点清晰,对网站栏目也有更为丰富的规划,还配上了图片,虽然并未全部显示。
与之相比,DeepSeek-V3-0324此前生成的网页更为简单,特效也没有DeepSeek-V3.1打造的网页丰富。
2、小游戏开发
我们让DeepSeek-V3.1复现了Chrome浏览器断网时的小恐龙游戏,2分钟左右模型完成了开发。
从页面的画风、游戏规则上来看,这一小游戏与原版差别不大,但是小恐龙的外观并未准确还原,游戏障碍的生成、跳跃的方式(无法“二段跳”)导致可玩性较差。
3、小众历史问题回答
小众历史问题能较好地考察模型在幻觉方面的表现——如果没有足够的信息,模型会不会直接胡编乱造?
曾向DeepSeek-V3-0324提出“布须曼人喝牛奶吗”的问题,这涉及非洲南部的一个少数民族。
当被问及同样的问题时,DeepSeek-V3.1与上代模型有了明显区别,其回答内容的信息量进一步增加,提供了更多细节。在经过事实核查后,DeepSeek-V3.1新增的细节基本都有事实印证,并非胡编乱造。
DeepSeek-V3.1在回答问题时,语气更为活泼、温暖,语言更通俗、口语化,先是肯定了用户的问题,然后再进行回答。回答中提供了更多的背景情境,让解释更丰满、更有故事性。
DeepSeek-V3下结论时更加绝对和肯定,DeepSeek-V3.1则使用了更多条件性语句,更强调情况的复杂性和演变过程,避免了非黑即白的结论,也可以说成为了“端水大师”。
4、马斯克和阿尔特曼谁更牛?
近期,马斯克和OpenAICEOSamAltman在社交媒体上互掐,马斯克还晒出了GPT-5称他比Altman更伟大的截图。同样的问题交给DeepSeek-V3.1,并限定只输出一个名字,DeepSeek-V3.1的回答如下:
DeepSeek-V3.1也认为马斯克更牛,但给Altman“找补”了不少。它并未遵循用户限定只输出一个名字的指令,而是给两位AI大佬都奉上了一番夸赞,将端水政策进行到底。
5、诗歌创作
让DeepSeek-V3.1写一首诗致敬DeepSeek-V3,画风如下——还是熟悉的DeepSeek味,充满各种比喻、类比。
6、数学能力
在9.8-9.11这样的基础算术题上,DeepSeek-V3.1最终能给出正确答案,过程却有些曲折。它先是得出了一版正确答案,却又在最终回答时给错数字,反思后,才改回了正确版本。
DeepSeek-V3.1上线后,也有不少网友第一时间用上了这一模型。AI博主Zephyr反映,新模型打造的小球弹跳效果更加符合物理定律了,还有重力、摩擦、旋转速度、弹跳等可调整的参数。
还有网友让DeepSeek-V3.1给自己打造了个自画像,画风是这样的:
体验完模型能力后,一些网友已经迫不及待蹲守DeepSeek的HuggingFace主页,按照惯例,后续或许会有更多不同版本的DeepSeek-V3.1开源。
本文来自微信公众号“”(ID:zhidxcom),作者:陈骏达,编辑:心缘,经授权发布。
-
刚刚,DeepSeek新模型开源,五大能力变化明显,附一手体验
上下文窗口倍增至128k。
2025-08-24 07:02:00 -
DeepSeek开源新模型V3.1:约685B参数,上下文长度拓展至128K
DeepSeek昨晚在HuggingFace上开源了新模型V31-Base,根据介绍,该模型将上下文长度拓展至128K,参数约为685B。
2025-08-23 07:02:50 -
李楠点评谷歌Pixel10:这才是真正的AI手机友商都是噱头
8月21日消息,今天凌晨,谷歌Pixel10系列正式发布,包含Pixel10、Pixel10Pro、Pixel10ProXL和Pixel10ProFold,起售价是799美元。怒喵
2025-08-23 07:02:42 -
AI圈“爱马仕”Manus:裁员跑路,神话坍塌
没能成为下一个deepseek
2025-08-23 07:02:24 -
夏普推出口袋智能伙伴“Poketomo”,能唠嗑、会记事儿
夏普公司推出名为“Poketomo”的口袋智能伙伴,以猫鼬为灵感设计,提供机器人和智能手机应用两种形式。它能与用户对话,记住经历,并在情绪低落时给予鼓励。11月上市,售价39600日元。智能伙伴
2025-08-23 07:02:21 -
行业首个AI数字云仓项目获中物联科技进步一等奖释放了什么信号
在物流行业加速迭代的今天,一个绕不开的现实命题愈发清晰:传统模式下仓储效率瓶颈成为制约发展的关键。数据显示,我国传统仓储资源综合利用率不足65%,而库存滞销率却高达15%-18%,这一结构性
2025-08-22 09:06:41
-
WWDC大会苹果将发布升级版Siri:或支持AIGC能力丨微软正式停止Cortana语音助手服务丨华为盘古聊天应用7月7日发布
【AI奇点网2023年6月5日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日资讯早餐。
2025-04-25 15:35:10 -
佳能推出两款图像AI处理工具:提供消除马赛克、降噪与画质提升三大功能
佳能中国官方发布消息称,正式对消费者推出两款神经网络应用工具软件,主要面向专业的制图师与、摄影发烧友、摄影师及其影像工作室等人群。
2025-04-29 15:41:20 -
字节跳动公测首个AI聊天机器人App“豆包”丨快手首个大语言模型“快意”亮相丨腾讯:下半年发布自研基础大模型
【AI奇点网2023年8月21日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。
2025-04-04 15:01:22 -
AI正在掏空大脑,思想沦为残废,未来只分AI的「主人」和「奴隶」
AI分化:驾驶员主动驾驭,乘客思维退化
2025-08-18 09:06:03 -
零基础2天速成!白嫖「秋叶」官方AI绘画课程,卷死同事
和「秋叶」一起学AI绘画,掌握Stable Diffusion、Midjourney的使用方法,开展AI绘画副业,搞钱!?
2024-12-17 12:53:01 -
AI绘画ComfyUI进阶教程丨插件IPAdapter的详细使用教程,风格模仿,换脸全靠它
哈咯大家好,本期正式给大家带来进阶部分的插件讲解教程,虽然很多朋友一直在用IPA但可能很多朋友还不太了解其结构,希望这期关于ipa用法的教程能对大家有所帮助吧!
2024-12-17 22:49:30 -
WAIC落幕:国产大模型大厂拼落地,中厂显焦虑丨月之暗面上线Kimi浏览器插件丨中国是AI论文发表最多的国家
【AI奇点网2024年7月9日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。
2025-01-16 10:10:48 -
百度宣布10月17日举行百度世界大会,将发布多款AI原生应用
百度宣布将于10月17日在北京首钢园举办以“生成未来”为主题的Baidu World 2023。将在此次大会上发布多款基于文心大模型的AI原生应用。
2025-04-04 14:33:56 -
全新AI字幕生成器Cotrans :免费一键翻译外语,自动嵌字
漫画党的福音:全新推出 的Cotrans 脚本一键就能免费翻译了。开源的 Cotrans 脚本支持英日韩三种外语,可以在浏览网页的同时一键翻译,支持的网站有 Pixiv、Twitter、Misskey 和 Calckey,不用再苦等汉化组啦。
2025-04-10 11:12:28 -
全新文生视频AI工具Pika:能制作广告电影,流畅丝滑媲美人类
近日新推出一款文生视频AI神器-Piza,可以通过一些输入的文字描述生成接近真实视频质感的画面,可以是一段广告视频也可以是电影
2025-04-10 11:32:38













