“零一万物”发布首个千亿参数大模型Yi-Large，CEO李开复立志带领中国大模型赶上美国

2025-01-27 来源：AI图库吧

以下文章来自于丨爱范儿

时隔一年，李开复带着「零一万物」与新版模型再次席卷而来。

去年 5 月，零一万物成立，6 个月后就发布了旗下首款中英双语大模型 Yi 系列。从一开始，李开复就定下了一个宏伟且艰难的目标：「成为 World"s No.1」。依靠大厂背景团队、优异模型表现，零一万物达到了 10 亿美元的估值。

今天，它们又带来了第二款产品：Yi-Large 闭源模型。

进击全球 SOTA 大模型

去年 11 月，零一万物所发布的 Yi-34B 以开源社区「甜点级」尺寸就在Hugging Face榜单中，超越了 Llama2-70B、Falcon-180B 等大几倍的模型，成为当时世界范围内开源最强基础模型之一。

半年后，零一万物正式发布千亿参数规模的 Yi-Large，在第三方权威评测中，零一万物 Yi 模型在全球头部大模型的中英文双语 PK 上表现出色。

最新出炉的斯坦福评测机构 AlpacaEval 2.0 经官方认证的模型排行榜上，Yi-Large 模型的英语能力主要指标 LC Win Rate（控制回复的长度）排到了世界第二，仅次于 GPT-4 Turbo，Win Rate 更排到了世界第一。

此前国内模型中仅有 Yi 和 Qwen 曾经登上此榜单的前 20。

大模型用起来聪明的一个重要前提，是它得清楚你在说什么。

国外的模型表现优秀，但都是基于英语语境，而诞生在本土的国产大模型，天生就对中文理解有得天独厚的优势。

在中文能力方面，SuperCLUE更新的四月基准表现中，Yi-Large 也位列国产大模型之首，Yi-Large 的综合中英双语能力皆展现了卓越的性能。

在更全面的大模型综合能力评测中，Yi-Large 多数指标超越 GPT4、Claude3、Google Gemini 1.5 等同级模型，达到首位。

在通用能力、代码生成、数学推理、指令遵循方面都取得了优于全球领跑者的成绩，稳稳跻身世界范围内的第一梯队。

随着各家大模型能力进入到力求对标 GPT4 的新阶段，大模型评测的重点也开始由简单的通用能力转向数学、代码等复杂推理能力。

在针对代码生成能力的 HumanEval、针对数学推理能力的 GSM-8K和 MATH、以及针对领域专家能力的 GPQA 等评测集上，Yi-Large 也取得了耀眼的成绩。

此外，从行业落地的角度来看，理解人类指令、对齐人类偏好已经成为大模型不可或缺的能力，指令遵循（Instruction Following）相关评测也越发受到全球大模型企业重视。

斯坦福开源评测项目 AlpacaEval 和伯克利 LM-SYS 推出的 MT-bench 是两组英文指令遵循评测集，AlignBench 则是由清华大学的团队推出的中文对齐评测基准。

在中外权威指令遵循评测集中，Yi-Large 的表现均优于国际前五大模型。

发布会上，李开复还宣布，零一万物已启动下一代 Yi-XLarge MoE 模型训练，将冲击 GPT-5 的性能与创新性。

同时，零一万物也在考虑一些非常复杂的议题，李开复总结了三个重点：

一方面，要预备技术的进步，我们能力所及产生什么样的模型;第二，怎么把推理成本做到最低，让我们点燃普惠点;第三，还有传统的 PMF，找到用户需求。

李开复说，这些考量是他们在硅谷公司一般没有看到的：这是我们独特的方法，也是中国独角兽的机会。

Yi-1.5全面升级，API平台全球首发

此次发布会上，零一万物 Yi 系列开源模型也迎来全面升级，Yi-1.5 分为 34B、9B、6B 三个版本，且提供了 Yi-1.5-Chat 微调模型可供开发者选择。

从评测数据来看，Yi-1.5 系列延续了 Yi 系列开源模型的出色表现，数学逻辑、代码能力全面增强的同时，语言能力方面也保持了原先的高水准。

经过微调后的 Yi-1.5-6B/9B/34B-Chat 在数学推理、代码能力、指令遵循等方面更上一层楼。

Yi-1.5-6B/9B-Chat 在 GSM-8K 和 MATH 等数学能力评测集、HumanEval 和 MBPP 等代码能力评测集上的表现远同参数量级模型，也优于近期发布的 Llama-3-8B-Instruct。

在 MT-Bench、AlignBench、AlpacaEval 上的得分在同参数量级模型中也处于领先位置。

去年零一万物选择以开源首发 Yi 系列模型，其优异的性能受到国际开发者的高度认可。

Yi 开源版本 2023 年 11 月上线首月，便占据开源社区近 5 成热门模型排行，发布一个月后 Yi-34B 被 Nvidia 大模型 Playground 收录。

在大模型的开发和产品的落地等问题上，李开复也有着自己的解题思路。

在接受 APPSO 采访时，李开复说：

我们是务实的 AGI 信仰者，我们一定要用最少的芯片，最低的成本训练出我们能训练最好的模型。同时我们会不断的去摸索，找 TC-PMF。

国内的初创公司，相对硅谷公司的差异，我们能够仰望星空，但也能脚踏实地。

零一万物不会用纯大力出奇迹的唯一思维，追求能不能用一百亿美金，一千亿美金。

OPEN AI有资格尝试这条道路，但这不是他们要走的道路，当然也不会花时间来预测 AGI 的点燃点，但是他很确定地告诉大家，跟他们相关度更高的是 AI 普惠点。

今天，零一万物同时宣布，面向国内市场一次性发布了包含 Yi-Large、Yi-Large-Turbo、Yi-Medium、Yi-Medium-200K、Yi-Vision、Yi-Spark 等多款模型 API 接口，Yi API Platform 英文站同步对全球开发者开放试用申请。

其中，千亿参数规模的 Yi-Large API 具备超强文本生成及推理性能，适用于复杂推理、预测，深度内容创作等场景;

Yi-Large-Turbo API 则根据性能和推理速度、成本，进行了平衡性高精度调优，适用于全场景、高品质的推理及文本生成等场景。

Yi-Medium API 优势在于指令遵循能力，适用于常规场景下的聊天、对话、翻译等场景;

如果需要超长内容文档相关应用，也可以选用 Yi-Medium-200K API，一次性可解读 20 万字的文本;

Yi-Vision API 具备高性能图片理解、分析能力，可服务基于图片的聊天、分析等场景;

Yi-Spark API 则聚焦轻量化极速响应，适用于轻量化数学分析、代码生成、文本聊天等场景。

更重要的是，现在已经有了落地的应用，针对胰腺肿瘤患者设计的「小胰宝」就是其中之一。

小胰宝 AI 小助手可以 7x24 小时为患者介绍综合治疗知识。

这一助手背后的技术支持正是零一万物的 Yi 大模型。使用 Yi API 调用 AI 大模型后，小胰宝突破了胰腺肿瘤治疗信息壁垒，可将胰腺癌治疗路线图和治疗方案精准且系统性地呈现给胰腺肿瘤病友。

目前，该公益项目已经帮助了 3000 多位胰腺肿瘤病友。

一站式工作平台「万知」

今天的发布会，也同时介绍了零一万物近期上线的一站式 AI 工作站「万知」。

根据官方介绍，万知是一个专门为中国用户量身打造的一站式 AI 工作平台，可以做会议纪要、周报、写作助手、解读财报、论文、做 PPT，中英双语且完全免费。

目前，用户可以通过官网和微信小程序「万知 AI」登录体验。

发布会上万知官方举了一个非常实际的例子：

你刚到公司楼下，突然被领导要求做一个会议展示，但是电脑不在身边，现在通过「万知」，在手机上输入你想演示的主题，然后等你从电梯到工位的两分钟里，PPT 已经在万知网页端做好了，之后你只需要做一些简单的文字、配图和修改，就能直接使用。

除此之外，万知还有许多其他的功能。

首先是文档阅读能力，万知 AI 助手能够快速阅读和理解大量文档内容，包括长文档和复杂的财务数据。它能够在几秒钟内提炼出关键信息，并支持中英双语阅读。其次，在通用问答场景中，万知也展现出了不俗的产品性能，能够快速地给出恰当的答案，和专业快速的反馈。另外，万知 AI 助手不仅支持文本输出，还能以表格、公式、代码等多种形式展现信息，使工作汇报和生活规划更加清晰明了。最后，万知 AI 助手能够实时访问互联网信息，确保用户获取的数据和见解是最新和最准确的。