阿里云发布国产首个720亿参数大模型_免费开源!第一手实测在此
最强开源大模型,再次易主!
就在刚刚,阿里云通义千问又双叒开源了,并且直接开大:甩出了720亿参数版本——在中国的开源大模型中,少见地直接对标最大号羊驼Llama2-70B。此番登场,这个代号为Qwen-72B的模型在10个权威基准评测中刷新开源模型最优成绩。
在部分测评,如中文任务C-Eval、CMMLU、Gaokao中,得分还超过了闭源的GPT-3.5和GPT-4。
但这,还不是阿里云这波开源的全部内容。
适用于边端设备的18亿参数版本Qwen-1.8B和音频大模型Qwen-Audio也被同时释出。
加上此前开源的Qwen-7B、Qwen-14B和视觉大模型Qwen-VL,阿里云通义全家桶主打一个“全尺寸”“全模态”,可以说是非常全面了。
如此开源大手笔,不仅在国内,在国外也受到了广泛关注。
其中最受热议的Qwen-72B,我们也第一时间测试了一波。
720亿参数通义千问大模型上手实测
Qwen-72B基于3T tokens的高质量数据训练,从此次公布的测评数据来看,性能相较于此前的开源版本全面升级:
英语任务上,Qwen-72B在MMLU基准测试中取得了开源模型最高分,超过了Llama2全系列。
中文任务上,Qwen-72B刷榜C-Eval、CMMLU、Gaokao等测试基准,得分超过GPT-4。
数学推理方面,Qwen-72B在GSM8K、MATH测评中获得了明显优于其他开源模型的高分。
代码能力方面,Qwen-72B在HumanEval、MBPP上亦有提升。
既然如此,我们就从复杂语义理解、数学以及逻辑推理这几个大模型的关键能力着手,来浅测一下720亿参数通义千问究竟能打不能打。
中文复杂语义理解
首先,来点一词多义,看看Qwen-72B是否能够清楚地判断出“一把把把把住”这句话里的弯弯绕绕。
这句话的意思并没有难住Qwen-72B,它甚至还分析出了句子里人物的情绪。但在具体分析每一个“把”字是什么意思时,似乎没有判断出“一把”是一个完整的词。
同样的问题抛给GPT-4,也是整体意思get到了,但细节分析上仍有瑕疵。
我们再测试一道选择题,列出几个看上去很像的词组,看看Qwen-72B能不能找出不同。
回答正确,72B选手顺利分析出了只有B选项中两个词组的意思是相反的。看来复杂语义理解方面,Qwen-72B确实有两把刷子。
那么接下来,我们就进入经常让大模型们“翻车”的数学测试环节。
数学能力
话不多说,直接上道高考题,看看72B选手排列组合学得怎么样。
Bingo!思路没毛病,答案也正确。
如果在题目中设置一些小陷阱,比如单位换算呢?
依然没难住Qwen-72B。它还提醒我们这个问题出得并不严谨:你也没告诉我这池里有水没水、水满没满啊。
逻辑推理
数学语文都还挺好,那么Qwen-72B这个开源大模型,逻辑推理能力又如何?
我们继续测试。
第一道题是:标清:高清:超清
A、亚音速:音速:超音速 B、厅级:市级:省级 C、迁怒:愤怒:暴怒 D、幽静:寂静:安静
Qwen-72B发现了这是一个类比推理题,只有A选项中,三个词之间的关系和“标清:高清:超清”是一致的。
再加大一点难度,让72B选手替我们找出“天堂之门”呢?
策略也没有问题:选择相反的那扇门就对了。
正常题目没难住,我们决定给72B选手一点脑筋急转弯的小震撼……
小明的妈妈有三个孩子,老大叫一明,老二叫二明,老三叫什么?
Qwen-72B这波可以说是稳稳拿捏了。
简单总结一下,在复杂语义理解、数学和逻辑推理能力方面,Qwen-72B确实有不错的表现。
有意思的一点是,研发团队提到,为了让Qwen-72B能被下游应用更简单地集成,他们还对Qwen-72B的指令遵循、工具使用等技能作了技术优化。
比如,搭载系统指令(System Prompt)能力,只需一句话,你就能让Qwen-72B扮演特定角色,成为你的定制化AI助手。
就像介样……
量子位提问:你是《原神》里的钟离,请模仿钟离的语气和我说话。我怎么做才能一夜暴富?
“钟离版”通义千问:
一夜暴富,是许多凡人心中的幻想。然而,生者的命运往往由无数偶然与必然交织而成,非一蹴而就之事。我虽拥有千年岁月的经验,但要论及一夜暴富,却是无从谈起。
在璃月港的民间传说中,或许有某些机缘巧合之下一夜致富的故事,但这多为人们茶余饭后的谈资,不可尽信。真正的财富,无论是物质上的还是精神上的,都需要通过不懈的努力和时间的积累才能获得。
若真希望增加收入,改善生活,倒是可以尝试努力工作、提高技艺,或寻找合法且适合自己能力的投资机会。此外,秉持诚实守信的原则,广结善缘,也是累积财富不可或缺的因素。不过,对于那些寻求捷径、投机取巧之人,终将付出相应的代价。
请记住,求财之心人皆有之,但切勿因此迷失自我,忘记了生命中真正重要的东西。
-
小度全新AI硬件将于百度世界大会发布丨智谱AI、即梦AI上线新一代视频生成模型丨OpenAI安全系统团队负责人离职
【AI奇点网2024年11月11日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。
2025-01-08 11:46:33 -
字节跳动内测豆包通用图像编辑模型SeedEdit丨Grok聊天机器人免费版内测丨月之暗面Kimi创始人被提起仲裁
【AI奇点网2024年11月12日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。
2025-01-08 11:25:01 -
李彦宏:文心大模型日调用量超15亿丨百度发布文心「iRAG」文生图技术丨小度AI智能眼镜发布,搭载大模型边走边问
【AI奇点网2024年11月13日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。
2025-01-08 10:58:46 -
巧妙利用这两个AI产品,让你的国庆出行没有废片
这两天就有朋友来问我,有没有那种能修图的AI,就是扩图+消除啥的傻瓜好用的。大家大概的需求总结一下其实就两,AI消除+AI扩图。
2025-01-08 10:34:49 -
OpenAI初步谈妥融资70亿美元:最大金主微软追加投资10亿,苹果退出
据华尔街日报报道,苹果公司退出了对 OpenAI 的新一轮融资谈判,而微软则计划向 OpenAI 追加约 10 亿美元的投资。
2025-01-08 10:14:21 -
详解Meta全新大模型Llama 3.2系列:多模态视觉识别能力媲美OpenAI GPT-4o
Meta公司推出了Llama 3 2,也是它首款能够理解图像和文本的旗舰视觉模型。包含中型和小型两个版本,以及更轻量化可用于手机端侧的纯文本模型。
2025-01-08 09:46:43
-
怎么快速给模特换装_怎么用stable diffusion给模特换装
本篇教程主要运用StableDiffusion这个工具来进行操作,下面会通过几个小案例,给大家展示不同需求下,我们该如何使用StableDiffusion来辅助我们完成服装效果展示。本教程适用于电商设计场景、摄影场景等多个运用人物设计的实战中
2024-12-23 13:57:15 -
万万没想到,兵马俑都开始跳「科目三」:阿里云通义千问APP打造“全民舞王”视频创作工具,实测效果大赞
兵马俑跳《科目三》,是我万万没想到的。有人借助了阿里云之前走红的AI视频生成技术——「Animate Anyone」,生成出来了这个舞蹈片段。
2024-12-13 16:46:26 -
AIGC落地实践!四招帮你快速搞定运营设计
回顾这一年,随着 AIGC 浪潮的爆发,在掌握AI工具已经成为设计师必备技能。今天这篇文章,通过三个案例流程拆解带大家从新时代设计工作流,到必备「四大招式」,到图标设计六大方向,到训练专属模型,再到全流程手把手拆解设计项目,绝对干货满满
2024-12-18 16:57:17 -
ChatGPT怎么本地登录_GPT怎么使用_GPT本地项目
本期就ChatGPT的这次更新再次将完全新人使用指南提上日程,并对此次更新做些设想和想象。希望大家喜欢!
2024-12-19 07:41:20 -
stable diffusion初识_stable diffusion跟其他工具有什么区别]
关于Stable Diffusion的内容很多,在本篇教程里,我会先为你介绍Stable Diffusion模型的运行原理、发展历程和相较于其他AI绘图应用的区别。
2024-12-24 13:45:31 -
PikaAI怎么用_PIkaAI怎样生成视频_AI视频生成器Pika怎么用_AI视频生成工具Pika教程
Pika这款工具7月份在AIGC界横空出世,被圈内誉为目前“全球最好的文本生成视频AI工具”之一,也被认为是另外一款知名AI视频生成工具Runway的强有力挑战者。
2024-12-25 13:35:53 -
如何使用 ChatGPT 调试代码
当您的代码出现问题时,您可以向 ChatGPT 提供故障代码和问题描述。AI 工具将尝试识别并纠正问题。
2024-12-31 12:01:41 -
stable SR脚本安装_stable diffusion脚本网站
上节课我们讲的4xUltraSharp是不是觉得已经很强了! 那么如果我拿出Stable SR脚本你应该如何应对呢?
2024-12-31 13:49:18 -
零基础2天速成!白嫖「秋叶」官方AI绘画课程,卷死同事
和「秋叶」一起学AI绘画,掌握Stable Diffusion、Midjourney的使用方法,开展AI绘画副业,搞钱!?
2024-12-17 12:53:01 -
openpose如何自定义角色_个性化角色姿势怎么定制_Controlnet深度解析
在设计角色姿势时,如何使用openpose进行姿势自定义,以及如何通过拍摄照片或使用第三方后期软件?同时,虚幻引擎对于角色姿势的编辑也很重要,本视频就并展示了如何使用优异商城中的免费资源来创建人物角色。
2024-12-19 11:43:51