阿里云推出最新通义千问 QwQ-32B 推理模型,仅 1/20 参数媲美 DeepSeek R1
阿里云通义千问官方今日宣布推出最新的推理模型 QwQ-32B。这是一款拥有 320 亿参数的模型,其性能可与具备 6710 亿参数(其中 370 亿被激活)的 DeepSeek-R1 媲美。
目前,QwQ-32B 已在 Hugging Face (https://huggingface.co/Qwen/QwQ-32B) 和 ModelScope (https://modelscope.cn/models/Qwen/QwQ-32B) 开源,并采用了 Apache 2.0 开源协议。IT之家提醒,用户也可以通过 Qwen Chat(https://chat.qwen.AI/?models=Qwen2.5-Plus)直接进行体验。
性能方面,阿里云对 QwQ-32B 测试了数学推理、编程能力和通用能力,并展示了 QwQ-32B 与其他领先模型的性能对比,包括 DeepSeek-R1-Distilled-Qwen-32B、DeepSeek-R1-Distilled-Llama-70B、o1-mini 以及原始的 DeepSeek-R1。
在测试数学能力的 AIME24 评测集上,以及评估代码能力的 LiveCodeBench 中,千问 QwQ-32B 表现与 DeepSeek-R1 相当,远胜于 o1-mini 及相同尺寸的 R1 蒸馏模型;在由 Meta 首席科学家杨立昆领衔的“最难 LLMs 评测榜” LiveBench、谷歌等提出的指令遵循能力 IFEval 评测集、由加州大学伯克利分校等提出的评估准确调用函数或工具方面的 BFCL 测试中,千问 QwQ-32B 的得分均超越了 DeepSeek- R1。
阿里云表示,这是 Qwen 在大规模强化学习(rl)以增强推理能力方面的第一步。通过这一旅程,不仅见证了扩展 RL 的巨大潜力,还认识到预训练语言模型中尚未开发的可能性。
在致力于开发下一代 Qwen 的过程中,阿里云计划将更强大的基础模型与依托规模化计算资源的 RL 相结合,从而使其更接近实现人工通用智能(agi)。此外,阿里云正积极探索将智能体与 RL 集成,以实现长时推理,目标是通过推理时间扩展来释放更高的智能,敬请期待。
-
阿里云推出最新通义千问 QwQ-32B 推理模型,仅 1/20 参数媲美 DeepSeek R1
阿里云通义千问官方今日宣布推出最新的推理模型 QwQ-32B。这是一款拥有 320 亿参数的模型,其性能可与具备 6710 亿参数(其中 370 亿被激活)的 DeepSeek-R1 媲美。 目前,QwQ-32B 已在 Hugging Face (https: hu
2025-04-17 12:22:09 -
基于Stable Diffusion,日本独立工作室打造AI恋爱养成游戏:妹子怎么穿,玩家说了算
近日,日本的一个名叫“まつさこ”的独立游戏开发团队引起了游戏圈的广泛关注。该团队只有两个人组成,都是XR VR领域的工程师。他们宣布推出一款基于AIGC生成式人工智能技术的恋爱养成类游戏。
2025-04-17 12:14:29 -
韩国 Newnal 公司推出独特形态“AI 手机”:上下双屏设计,顶屏内置专属数字化身
在今年世界移动通信大会(MWC 2025)期间,韩国一家名为 Newnal 的公司发布了一款小巧玲珑、形态独特的“AI 手机”,其能够收集用户大量“过去与现在”的信息,并以此创建虚拟形象,成为你的虚拟助手。 ▲ 官图 ▲ Th
2025-04-17 12:00:54 -
一款突破创作边界的小说生成AI工具还能赚钱!一起探索AI-Writer
AI-Writer是一款令人惊叹的小说生成工具,通过使用先进的AI文本生成模型,它能够根据用户提供的开头字或句子,自动生成令人着迷的故事情节。这款开源项目以其独特的创意和创新性在文学创作领域引起了广泛的关注。
2025-04-17 11:52:31 -
OpenAI 宣布 GPT-4.5 正式面向所有 ChatGPT Plus 用户开放
OpenAI 于 2 月 28 日推出 GPT-4 5 AI 模型“研究预览版”,号称交互更自然,知识库更广,更能理解用户意图,并且“情商”更高。 OpenAI 今日宣布,已向 ChatGPT Plus 用户推出 GPT-4 5,比预期更早。 据官方介绍,G
2025-04-17 11:40:12 -
罚怕了!OpenAI奥特曼与Meta扎克伯格公开支持欧盟加强AI监管
欧盟委员会委员蒂埃里·布雷顿一行人,近日抵达美国加州拜会一系列的硅谷科技大厂,针对AI监管在欧盟地区落地的问题展开深入探讨。其中就包括Facebook母公司Meta、ChatGPT的开发商OpenAI,到访推特总部以及英伟达总部等等。
2025-04-17 11:31:08
-
Music To Image音生图工具是什么_AI音频生成图像工具有哪些_AI音生图工具有哪些_Music To Image怎么用
「Music To Image」是一款AI音频生成图片的多模态转换工具,它的本质生成逻辑是音频→文本提示词→图像。
2024-12-17 00:06:33 -
跟人类学孬了!联合国:AI大模型的回复存在严重的性别偏见、种族偏见与刻板印象等问题
报告指出,女性在大模型的描述中,从事“家务劳动”的频率是男性的4倍,而男性名字则与“商业”、“管理层”、“薪水”和“职业”等词汇联系在一起。
2025-02-08 12:52:22 -
?新年新气象!小红书推出AI人物头像绘图模型「InstantID」:轻松打造龙年新春头像,一键免费焕新
近日,小红书团队推出了一款AI头像生成工具「InstantID」,直接刷屏了。使用门槛较低。只需要用户提供一张自拍照就可以轻松生成一大波风格迥异的照片。
2025-02-13 14:27:20 -
阿里旗下夸克APP上线“AI学习助手”:内置海量试题,拍照一键解疑,巧用大模型帮助当代学子高效备考、快速进阶
夸克“AI学习助手”采用夸克宝宝的虚拟形象为用户进行题目讲解。基于大语言模型和视觉技术,AI智能讲解能够给用户提供 “考点分析”、“详解步骤”、“答案总结”等详细内容。
2025-02-18 16:08:16 -
微博推出“明星AI情感伴聊”:模拟你喜欢的爱豆来陪你聊天,演员李兰迪已进驻
用户向明星发送私信,专属的AI助手将模拟明星的聊天方式和风格进行自动回复,以情感陪伴提升用户体验。微博将陆续邀请更多明星开启该功能。
2025-04-04 10:51:09 -
AI绘画ComfyUI进阶教学丨Mask遮罩基础运用,IPA+CN+Lora+prompts+遮罩
本期开始正式进入遮罩相关的高级应用,这里我们会尝试为不同组件应用不同区域的遮罩,实现构图、效果的不同区域实现。希望本期内容能对大家有所帮助和启发,最后如果喜欢欧阳的教程就千万不要忘记支持一波啦!!!
2024-12-17 09:48:56 -
AI会议整理软件_通义听悟使用教程
最近还挺多人在群里问,有没有啥好的总结会议生成纪要的AI,所以今天更新一篇这个教程,也算是补上AI办公的拼图。
2024-12-17 16:12:59 -
Suno ai全面使用指南丨AI音乐GPT时刻来临,人人都能成为音乐大师!
最近,AI 音乐的 ChatGPT 时刻来临啦!一款音乐 AI神器——Suno V3发布,引发了广泛关注。这款AI音乐工具凭借其独特的创新,持续占据各大平台热搜榜首。
2024-12-17 20:54:47 -
2D转3D成熟倒计时!2023(最全)AIGC-3D技术总结,一个视频搞懂AI生成3D模型
2023年我们见证了AI生成图像的快速进化,同样在这一年,AI生成3D虽然相对之下默默无闻,但也出现了很多重要的技术,实现了从0到1的突破。相信2024年一定会迎来AI生成3D技术的突飞猛进。这个视频我们一起看一下2023年AI生成3D有哪些重要工作,提前了解。为后面的成熟做好准备。
2024-12-18 14:25:53 -
midjourney新功能_style tuner应用教程_MJ最新教程
MJ的新功能style tuner,终于可以训练自己的模型风格了,在我快速模式恢复之后立马尝试了一遍,操作步骤简单,比SD容易上手太多,我来代练一遍,大家跟上节奏
2024-12-19 06:34:05