字节突然开源Seed-OSS,512K上下文碾压主流4倍长度,推理能力刷新纪录
字节跳动突发开源大模型,一出手就是360亿参数的Seed-OSS-36B。
这个Seed-OSS的命名方式,明显是在呼应OpenAI此前发布的GPT-OSS系列。
与OpenAI的开源策略也是一样,并没有直接开源核心商业模型豆包(Doubao),而是基于内部技术打造了一个专门面向开源社区的版本。
字节跳动Seed团队正式在HuggingFace和GitHub上发布了这个系列模型,采用Apache-2.0开源协议,可以免费用于学术研究和商业部署。
512K上下文窗口,还能灵活控制思考预算
要说Seed-OSS最让人眼前一亮的特性,那必须是原生512K的超长上下文。
目前主流的开源模型,比如DeepSeekV3.1的上下文窗口是128K,而Seed-OSS直接翻了4倍。
而且这个512K是在预训练阶段就构建好的,不是后期通过插值等方法硬撑上去的。
这意味着法律文档审查、长篇报告分析、复杂代码库理解等需要处理海量信息的专业场景,Seed-OSS都能轻松拿下。
此外,Seed-OSS还引入了“思考预算”(ThinkingBudget)机制。
通过设定一个token数量,你就能控制模型思考的深度。比如你设置512个token的预算,模型在推理过程中会这样工作:复制
好的,让我一步步来解决这个问题。题目说的是…我已经使用了129个token,还剩383个token可用。使用幂法则,我们可以…我已经使用了258个token,还剩254个token可用。另外,记住…我已经耗尽了token预算,现在开始给出答案。
对于简单任务,可以设置较小的预算让模型快速响应;对于复杂的数学推理或代码生成,你可以给更多预算让它深思熟虑。
字节跳动建议使用512的整数倍(比如512、1K、2K、4K、8K或16K),因为模型在这些区间上经过了大量训练。
模型架构方面,Seed-OSS采用了成熟稳定的设计:
360亿参数的稠密模型(不是MoE),使用了RoPE位置编码、GQA注意力机制、RMSNorm归一化和SwiGLU激活函数。整个模型有64层,隐藏层维度5120,词汇表大小155K。
考虑到合成指令数据可能影响后训练研究,字节Seed团队提供了两个版本的基座模型,一个包含合成指令数据(性能更强),一个不包含(更纯净),为研究社区提供更多选择。
多项基准测试开源SOTA
那么这个模型的实际表现如何呢?
在知识理解方面,Seed-OSS-36B-Base在MMLU-Pro上达到了65.1分,超过了同等规模的Qwen2.5-32B-Base的58.5分。在TriviaQA上更是拿下了82.1的高分。
推理能力的BBH基准测试得分87.7,直接刷新了开源模型的记录。在数学能力上,GSM8K达到90.8分,MATH的81.7分。
Seed-OSS代码能力同样不俗,HumanEval得分76.8,MBPP达到80.6。
指令微调版本Seed-OSS-36B-Instruct在AIME24数学竞赛题上达到了91.7分的成绩,仅次于OpenAI的OSS-20B。
并且这些成绩是用仅12Ttoken训练出来的,相比之下,很多同规模模型的训练数据量都在15T以上。
字节Seed团队的开源版图
字节Seed团队成立于2023年,定位是“打造业界最先进的AI基础模型”,研究方向覆盖大语言模型、多模态、AI基础设施等多个前沿领域。
过去一年多时间里,已经陆续开源了多个有影响力的项目,只不过多是细分领域模型,而不是受关注的基座语言模型。
今年5月,他们发布了Seed-Coder,一个8B规模的代码生成模型,最大的创新是让LLM自己管理和筛选训练数据,大幅提升了代码生成能力。
紧接着,他们又推出了BAGEL,一个能同时处理文本、图像和视频的统一多模态模型,真正实现了”万物皆可输入输出”。
更早之前,他们还发布了SeedDiffusion,这是一个基于离散状态扩散技术的实验性语言模型,在代码生成任务上实现了极高的推理速度。
为了支撑这些模型的训练,团队还开源了VeOmni,一个PyTorch原生的全模态分布式训练框架。
最近他们还搞了个SeedLiveInterpret端到端的同声传译模型,不仅翻译准确率高,延迟低,还能复刻说话人的声音特征。
随着Seed-OSS的开源,国产开源Base模型又添一员猛将。
GitHub:
https://github.com/ByteDance-Seed/seed-oss
HuggingFace:
https://huggingface.co/collections/ByteDance-Seed/seed-oss-68a609f4201e788db05b5dcd
-
字节突然开源Seed-OSS,512K上下文碾压主流4倍长度,推理能力刷新纪录
Apache-20开源协议,可以免费用于学术研究和商业部署
2025-08-27 09:11:10 -
Meta被曝已暂停AI招聘
据业内人士透露,在花费数月时间大手笔招揽了50多名行业尖端的AI研究人员和工程师后,Meta目前已冻结了其人工智能部门的招聘。
2025-08-26 09:21:46 -
刚刚,GPT-5 Pro自证全新数学定理,OpenAI总裁直呼颠覆,大佬们集体转发
希望AI在拓展人类认知边界的同时,人类也能破解大模型的秘密。
2025-08-26 09:21:37 -
1000亿美元,华人干出全球第四大AI独角兽
年化收入已达37亿美元。
2025-08-26 09:21:31 -
MicroLED微显示公司JBD获数亿元融资,为Rokid、阿里、雷鸟等近50款智能眼镜供应商|硬氪独家
AR设备迭代聚焦“轻量化”与“高画质表现”两大核心需求。
2025-08-26 09:21:30 -
实测智谱“首个手机agent”:有新思路,但一到真实世界全是无力感
追求通用的AutoGLM,却搞不定弹出广告和会员登录
2025-08-26 09:21:27
-
微软Bing聊天机器人现已加入Chrome和Safari插件,但仍有字数与发送次数限制
微软的人工智能 Bing 聊天机器人现在可以在谷歌 Chrome 和苹果 Safari 浏览器上使用了,用户只需访问 Bing com 网站,就可以和该聊天机器人进行交流,但目前仍有字数与发送次数限制。
2025-04-09 15:08:19 -
字节跳动公测首个AI聊天机器人App“豆包”丨快手首个大语言模型“快意”亮相丨腾讯:下半年发布自研基础大模型
【AI奇点网2023年8月21日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。
2025-04-04 15:01:22 -
国内版 “苹果vision pro” 发布! 中兴通讯发布nubia Neo Air智能眼镜
中兴通讯在2023年上海世界移动通信大会上正式发布了nubia Neo Air智能眼镜,这款全球首款轻型双目屈光一体化GPT无线AR智能眼镜引入了与GPT同类AIGC算法,实现了语音指令、即时问答和智能交互等功能,为用户提供全场景的智能助理。
2025-04-15 14:05:26 -
苹果WWDC 2023开发者大会上只字未提“AI”,库克和他的伙伴有着自己的独特思考
最近科技圈最令媒体人“困惑”的一件事,莫过于全球科技领军巨头苹果公司,竟然对AI人工智能“不闻不问”。
2025-04-24 11:23:24 -
物理AI如何变革机器人产业?英伟达与宇树、银河通用创始人闭门会全实录
AI与机器人协同进化,迈向下一个科技时代
2025-08-17 07:05:32 -
AI正在掏空大脑,思想沦为残废,未来只分AI的「主人」和「奴隶」
AI分化:驾驶员主动驾驭,乘客思维退化
2025-08-18 09:06:03 -
AI绘画ComfyUI进阶教程丨插件IPAdapter的详细使用教程,风格模仿,换脸全靠它
哈咯大家好,本期正式给大家带来进阶部分的插件讲解教程,虽然很多朋友一直在用IPA但可能很多朋友还不太了解其结构,希望这期关于ipa用法的教程能对大家有所帮助吧!
2024-12-17 22:49:30 -
midjourney新功能_style tuner应用教程_MJ最新教程
MJ的新功能style tuner,终于可以训练自己的模型风格了,在我快速模式恢复之后立马尝试了一遍,操作步骤简单,比SD容易上手太多,我来代练一遍,大家跟上节奏
2024-12-19 06:34:05 -
通义听悟如何管理我的记录_通义听悟管理我的记录使用方法
通义听悟支持创建文件夹,分类管理记录;可以对记录进行收藏、移动、重命名等操作。
2024-12-27 12:45:31 -
WAIC落幕:国产大模型大厂拼落地,中厂显焦虑丨月之暗面上线Kimi浏览器插件丨中国是AI论文发表最多的国家
【AI奇点网2024年7月9日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。
2025-01-16 10:10:48






