Qwen又立功,全球最快开源模型诞生,超2000 tokens/秒
全球最快的开源大模型来了——速度达到了每秒2000个tokens!
虽然只有320亿参数(32B),吞吐量却是超过典型GPU部署的10倍以上的那种。
它就是由阿联酋的****·本·扎耶德人工智能大学(MBZUAI)和初创公司G42AI合作推出的K2Think。
名字是不是有点熟悉?
没错,它和月之暗面前不久推出的KimiK2在命名上是有点小撞车,不过阿联酋这个多了个“Think”。
但非常有意思的一点是,在K2Think的背后,确实有“madeinChina”的味道。
因为从HuggingFace中的Modeltree来看,K2Think是基于Qwen2.5-32B打造的:
而且“全球最快开源AI模型”之外,MBZUAI官方还称自家的K2Think是“有史以来最先进的开源AI推理系统”。
那么它的实力到底几何?我们继续往下看。
实测速度均超过2000tokens/秒
目前,K2Think已经给出了可以体验的地址(见文末)。
我们先小试牛刀测试一把IMO的试题:
Leta_n=6^n+8^n.Determinetheremainderwhendividinga_{83}by49.
可以肉眼看到,在没有任何加速的情况下,K2Think在思考过后输出答案的速度,真的就是“啪的一下”。
从底部给出的速度来看,已经达到了2730.4tokens/秒。
接下来,我们用中文来测试一个经典问题:
Strawberry这个单词里面有几个字母R?
速度依旧保持在了2224.7tokens/秒,并且给出了正确答案:3个R。
我们再来实测几道AIME2025的数学题:
Findthesumofallintegerbases$b>9$forwhich$17_{b}$isadivisorof$97_{b}$.
Findthenumberoforderedpairs$(x,y)$,whereboth$x$and$y$areintegersbetween$-100$and$100$,inclusive,suchthat$12x^{2}-xy-6y^{2}=0$.
可以看到,K2Think最大特点就是所有问题均能保持在超过2000tokens/秒的速度,并且就目前实测结果来看,生成的答案均是正确。
但从功能角度来看,目前K2Think还不支持文档传输,以及多模态等能力。
不过MBZUAI的高级研究员TaylorW.Killian在X上也给出了解释:
这个模型主要为数学推理而开发。
技术报告也已发布
从体量上来看,K2Think仅有32B,但官方却表示,它已经可以与OpenAI和DeepSeek旗舰推理模型的性能相当。
从测试结果来看,K2Think在多项数学基准测试中,拿下了较为理想的分数,例如AIME’2490.83分、AIME’2581.24分、HMMT2573.75分,以及Omni-MATH-HARD上取得60.73分的成绩。
并且K2Think团队已经发布技术报告:
从整体来看,K2Think团队主要从六个方面做到了技术创新:
长链路思维的监督微调(SFT):通过精心设计的链式推理数据,训练模型逐步思考,而不是直接给答案,使其在复杂问题上更有条理。
可验证奖励的强化学习(RLVR):模型不是依赖人类偏好打分,而是直接以答案对错为奖励信号,显著提升数学、逻辑等领域的表现。
推理前的智能规划(Plan-Before-You-Think):先让一个规划代理提炼问题要点,制定解题大纲,再交给模型展开详细推理,就像人类先列提纲再解题一样。
推理时扩展(Best-of-N采样):对同一问题生成多个答案,再挑选最佳结果,从而提高正确率。
推测解码(SpeculativeDecoding):在推理时并行生成和验证答案,减少冗余计算,加速输出。
硬件加速(CerebrasWSE晶圆级引擎):依托全球最大的单芯片计算平台,实现单请求每秒超2000tokens的生成速度,使长链路推理也能保持流畅的交互体验。
与此同时,研究团队还对K2Think进行了系统的安全测试,包括拒绝有害请求、多轮对话鲁棒性、防止信息泄露和越狱攻击等,整体达到了较高水平。
体验地址:https://www.k2think.ai/
技术报告:https://k2think-about.pages.dev/assets/tech-report/K2-Think_Tech-Report.pdf
-
Qwen又立功,全球最快开源模型诞生,超2000 tokens/秒
仅32B大小
2025-09-16 10:46:13 -
16岁创业,22岁做成百亿独角兽,3位高中同学帮大厂训AI年入1亿美金
AI「后浪」的创业神话
2025-09-16 10:16:13 -
黄仁勋的话白说了
Anthropic停服中国,中美AI人才博弈,黄仁勋指50%研究者为华人。
2025-09-16 09:46:13 -
陶哲轩都惊了,o3首战「AI奥数」碾压夺冠,开源军团仅差5分狂追OpenAI
AI奥赛OpenAIo3首战47分,开源闭源差距缩小
2025-09-16 09:16:13 -
苹果端侧AI两连发,模型体积减半、首字延迟降85倍,iPhone离线秒用
苹果推出FastVLMMobileCLIP2多模态模型,快轻端侧运行。
2025-09-15 13:38:15 -
闷声搞钱的联想,正面临AI大考
联想活的怎么样?
2025-09-15 13:08:15
-
网易有道出品的开源AI语音合成工具EmotiVoice_合成不同情感的数字语音丨解压可用
AI合成语音,相信大家都不陌生。最近,网易有道开源了一款AI语音合成工具EmotiVoice,我这里第一时间制作了懒人包,可离线本地使用哦~
2024-12-19 04:34:37 -
谷歌助手安卓版进化!将推出AI网页内容总结功能
据外媒报道,在最新的Google应用测试版(版本 14 29)中,谷歌助手被发现正在准备一个新的“网页总结”功能。
2025-04-09 15:59:15 -
火山引擎联合南开大学,以大模型助力智慧校园建设
火山引擎AI创新巡展活动近日在天津举办,来自教育、交通、医疗等各领域的客户分享了大模型应用实践。南开大学副校长、教授、博士生导师方勇纯表示:“南开大学携手火山引擎,共同探索‘AI+教育’的创新模式,落地一
2025-07-16 13:32:12 -
网易推出一站式AI音乐创作平台“天音”:最快10秒钟完成歌曲创作
网易正式推出首个AI音乐创作平台——网易天音,利用AI技术来帮助创作最快仅需10秒钟就能完成歌曲制作并分享。
2025-04-26 15:17:30 -
钉钉推出AI数字分身代替本人参会丨钉钉宣布首个商用大模型套餐:每次调用5分钱丨李彦宏:以AI原生思维重构产品和服务
【AI奇点网2023年8月23日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。
2025-04-30 09:10:47 -
培育新质生产力,这些人工智能实践令人振奋
当快递员用上“顺丰丰语”,不同产品、不同重量、不同地区的运费可以立刻得出,服务效率与质量显著提升;当水泥厂遇上“数智化”,生产系统每5分钟就会收到一次优化参数,不仅让水泥生产的质量和稳定性同步增长,电耗
2025-04-30 14:20:30 -
苹果首款自研车Apple Car将在2026年问世
自从苹果2014年研发电动车的泰坦计划曝光后,艾夫斯再预言Apple Car即将问世,预计将于2026年上市。
2025-05-01 14:57:59 -
警惕!有机构利用人工智能程序日产上千篇虚假新闻
有MCN机构利用人工智能程序日产上千篇虚假新闻,导致大量不实信息在网上病毒式传播;某小说平台账号依靠AI“创作”,每日更新十几本电子书,行文却逻辑不通、辞藻空洞;医学论文因使用AI生成的虚假配图而被撤稿……当
2025-06-19 16:49:44 -
AI的下一阶段:“LifeOS”对文化娱乐生活的四大颠覆
你的“人生操作系统”
2025-08-16 07:05:33 -
性能大爆发!天玑9500NPU用上全新IP:AI算力翻倍
8月20日消息,据博主数码闲聊站最新爆料,联发科天玑9500这一代的NPU会用上全新IP硬件,AI算力对比前代直接翻倍。此前爆料称,天玑9500搭载第九代AI处理器NPU,可提供100TOPS的AI算
2025-08-24 07:02:26









