阿里发力持续加码,通义千问再开源:Qwen V1.5版本提供六种参数版本,性能彻底碾压GPT-3.5
AI奇点网2月7日报道丨春节前后,内卷依旧。赶在春节前,阿里人工智能实验室打造的通义千问大模型(Qwen)的 V1.5 版上线了。新版大模型包括六个型号尺寸:0.5B、1.8B、4B、7B、14B 和 72B,其中最强版本的性能超越了GPT-3.5、Mistral-Medium,包括 Base 模型和 Chat 模型,且有多语言支持。
通义千问团队表示,相关技术也已经上线到了通义千问官网和通义千问 App。
除此以外,Qwen V1.5还支持 32K 上下文长度;开放了 Base + Chat 模型的检查点;可与 Transformers 一起本地运行;同时发布了 GPTQ Int-4 / Int8、AWQ 和 GGUF 权重。
借助更先进的大模型作为评委,通义千问团队在两个广泛使用的基准 MT-Bench 和 Alpaca-Eval 上对 Qwen1.5 进行了初步评估,评估结果如下:
尽管落后于 GPT-4-Turbo,但最大版本的 Qwen V1.5 模型 Qwen1.5-72B-Chat 在 MT-Bench 和 Alpaca-Eval v2 上都表现出了可观的效果,性能超过 Claude-2.1、GPT-3.5-Turbo-0613、Mixtral-8x7b-instruct 和 TULU 2 DPO 70B,与最近热门的新模型 Mistral Medium 不相上下。
此外通义千问团队表示,虽然大模型判断的评分似乎与回答的长度有关,但人类观察结果表明 Qwen1.5 并没有因为产生过长的回答来影响评分。AlpacaEval 2.0 上 Qwen1.5-Chat 的平均长度为 1618.与 GPT-4 的长度一致,比 GPT-4-Turbo 短。
通义千问的开发者表示,最近几个月,他们一直在专注探索如何构建一个真正「卓越」的模型,并在此过程中不断提升开发者的使用体验。
相较于以往版本,本次更新着重提升了 Chat 模型与人类偏好的对齐程度,并且显著增强了模型的多语言处理能力。在序列长度方面,所有规模模型均已实现 32768 个 tokens 的上下文长度范围支持。同时,预训练 Base 模型的质量也有关键优化,有望在微调过程中为人们带来更佳体验。
关于模型基础能力的评测,通义千问团队在 MMLU(5-shot)、C-Eval、Humaneval、GS8K、BBH 等基准数据集上对 Qwen1.5 进行了评估。
在不同模型尺寸下,Qwen1.5 都在评估基准中表现出强大的性能,72B 的版本在所有基准测试中都超越了 Llama2-70B,展示了其在语言理解、推理和数学方面的能力。
GitHub项目地址:
https://qwenlm.github.io/blog/qwen1.5/
-
阿里发力持续加码,通义千问再开源:Qwen V1.5版本提供六种参数版本,性能彻底碾压GPT-3.5
赶在春节前,通义千问大模型(Qwen)的V1 5版上线了。新版大模型包括六个型号尺寸:0 5B、1 8B、4B、7B、14B 和 72B。
2025-02-13 16:09:23 -
阿里云通义千问上线AIGC春节新玩法:AI帮你免费拍摄全家福,AI舞蹈视频生成器“全民舞王”新增春晚舞蹈
春节将至年味渐浓,阿里云通义千问APP上线多项免费新应用,涵盖全家福、拜新年、万物成龙等图像生成的新玩法。
2025-02-13 15:39:26 -
百度联合央视春晚推出AI线上体验新玩法丨通义千问大模型Qwen V1.5开源丨OpenAI最新估值跌破千亿美元
【AI奇点网2024年2月8日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。
2025-02-13 15:15:23 -
微软Copilot新增功能:可对生成的图像,进行在线编辑!
2月8日,微软在官网公布了Copilot的多个新功能,其中,用户借助Designer可对生成的图像进行在线编辑。编辑功能包括,着色、模糊图像背景、更改图像风格等,可以让生成的图像更满足用户的实际业务需求。
2025-02-13 14:49:35 -
?新年新气象!小红书推出AI人物头像绘图模型「InstantID」:轻松打造龙年新春头像,一键免费焕新
近日,小红书团队推出了一款AI头像生成工具「InstantID」,直接刷屏了。使用门槛较低。只需要用户提供一张自拍照就可以轻松生成一大波风格迥异的照片。
2025-02-13 14:27:20 -
钉钉登陆ᯅ苹果Vision Pro:创建AI数字人在线视频会议,随时随地开启加班生活
近日,知名在线协同办公应用钉钉宣布,针对苹果Vision Pro平台开发的客户端APP,正式上架App Store。推出了「AI数字人」虚拟现实在线视频会议功能。
2025-02-13 14:03:54
-
如何使用 ChatGPT 调试代码
当您的代码出现问题时,您可以向 ChatGPT 提供故障代码和问题描述。AI 工具将尝试识别并纠正问题。
2024-12-31 12:01:41 -
阿里“通义听悟”升级:支持6小时超长视频内容解析提问,还可一键生成巨幅思维导图
阿里通义大模型应用产品“通义听悟”发布多项新功能,上线音视频问答助手“小悟”、一键 AI 改写、思维导图生成等六大功能。
2025-02-06 16:53:33 -
思维脑图工具也能创作AI绘画作品,如何使用博思白板进行AI绘画
博思白板boardmix的创作平台提供多种登录方式,最方便要属直接微信扫码登录,然后绑定手机号实名制。再点击页面正中央紫色的按钮「免费使用」,你就可以进入博思白板boardmix的内容创作操作台。
2024-12-26 09:08:34 -
AI绘图模型测评_Meta Imagine发布_Meta Imagine最新地址
针对Meta Imagine,Midjourney,Adobe Firefly,Dalle,这四个我心目中的比较大的AI绘图模型测评。我会从细节质量、审美(构图色彩等)、风格多样化、语义理解这四个维度来评测,每个维度3个Prompt,同时每个Prompt我会在AI绘图模型中roll3次,取效果最具有代表性的那个图,尽量减少偏见。
2024-12-13 17:44:01 -
快手AI文生视频大模型【可灵】首发实测:这可能将成为真正意义的第一款「中国版Sora」
昨天,6月6号,是快手的13周年生日。在这一天,所有AI圈的人都想不到,快手在13周年之际,没有任何预兆、没有任何宣传,直接发布了他们的AI视频大模型。可灵。
2024-12-13 20:45:55 -
Stable Diffusion 3最新模型测评丨SD3模型ComfyUI流程简单搭建
由于前不久StabilityAI开放了SD3新模型的使用权,这期我们就简单聊聊这款新模型的使用方法,以及StabilityAI对于SD3模型的发布策略,和未来的发展预期!如果本期讯息对大家有所帮助,就点赞关注支持欧阳一下吧!
2024-12-13 21:10:24 -
科大讯飞星火大模型3.0实测:高能进化,给AI注入灵魂,部分能力与GPT-4旗鼓相当
科大讯飞星火认知大模型3 0正式发布。星火3 0的整体性能已经超越ChatGPT,部分能力与GPT-4旗鼓相当。科大讯飞立下又一个Flag,星火4 0要对标GPT-4
2024-12-13 22:43:43 -
高考大模型测评_豆包文科成绩领先
什么?好多大模型的文科成绩超一本线,还是最卷的河南省???没错,最近就有这么一项大模型“高考大摸底”评测走红了。河南高考文科今年的一本线是521分,根据这项评测,共计四个大模型大于或等于这个分数,其中头两名最值得关注:
2024-12-13 23:27:45 -
ChatGPT、阿里通义等AI机器人参加今年高考出分:干翻90%考生,有一科全员不及格
6月19日,上海人工智能实验室和司南评测体系发布了国内首个针对AI大模型参与2024高考「语数英」三科目的全卷解题能力测试的结果。
2024-12-13 23:42:30 -
AI会议整理软件_通义听悟使用教程
最近还挺多人在群里问,有没有啥好的总结会议生成纪要的AI,所以今天更新一篇这个教程,也算是补上AI办公的拼图。
2024-12-17 16:12:59