微软AI推出基于ZeRO的高级通信优化策略,加速大型模型训练
AI奇点网6月28日报道 | 微软研究人员在人工智能领域的创新之一是ZeRO++,一种旨在优化大型模型训练的系统。大规模模型如Turing-NLG、ChatGPT和GPT-4的训练需要跨多个GPU设备的大量内存和计算资源。为了克服ZeRO在小批量和低带宽集群训练中的限制,DeepSpeed团队开发了ZeRO++,它在现有的ZeRO优化基础上引入了增强的通信策略。
ZeRO系列优化使用集体GPU内存和计算能力进行模型状态的跨GPU划分,而不是复制。然而,在训练过程中,ZeRO可能会导致较高的通信开销。为了解决这个问题,ZeRO++结合了三个通信优化策略:量化权重通信(qwZ)、分层权重划分(hpZ)和量化梯度通信(qgZ)。
ZeRO++采用了权重量化,利用基于块的量化来降低参数通信量,并保持训练精度。通过在每台机器内维护完整的模型副本来交换GPU内存进行通信,最大限度地减少了反向传播期间的通信开销。对于梯度通信,ZeRO++引入了qgZ,一种新颖的量化梯度通信范例,可以减少跨节点流量和延迟。
这些通信优化使通信量显著减少,ZeRO++相较于ZeRO的减少量可达到4倍,从而提高了训练吞吐量和效率。当每个GPU使用小批量大小时,在高带宽集群中,ZeRO++的吞吐量比ZeRO-3提高了28%到36%。与ZeRO-3相比,ZeRO++在低带宽集群中平均加速了2倍,使得大型模型训练更容易在更广泛的集群中进行。
除了训练场景,ZeRO++还可以扩展到使用人类反馈(RLHF)训练的强化学习对话模型中。通过与DeepSpeed-Chat的集成,RLHF训练可以受益于改进的生成和训练阶段,实现比ZeRO更高的生成吞吐量(高出2.25倍)和训练吞吐量(高出1.26倍)。
DeepSpeed发布了ZeRO++,使得大型模型训练更加高效,并可供AI社区使用。这一系统旨在加速训练、减少通信开销,并实现更大的批量,最终节省时间和资源。研究人员和从业者可以利用ZeRO++更有效地训练ChatGPT等模型,并探索人工智能的新可能性。
-
微软AI推出基于ZeRO的高级通信优化策略,加速大型模型训练
微软研究人员开发了名为ZeRO++的系统,旨在解决大型人工智能模型训练中的数据传输开销和带宽限制问题。ZeRO++基于现有的ZeRO优化,提供了增强的通信策略,以提高训练效率、降低训练时间和成本。这一优化策略将受益于Turing-NLG、ChatGPT和GPT-4等大型模型的训练,解决了小批量和低带宽集群的限制。
2025-04-15 17:47:42 -
《人工智能生成合成内容标识办法》答记者问
近日,国家互联网信息办公室、工业和信息化部、公安部、国家广播电视总局联合发布《人工智能生成合成内容标识办法》(以下简称《标识办法》),自2025年9月1日起施行。日前,国家互联网信息办公室有关负责人就《
2025-04-15 17:36:19 -
谷歌透露开发中的语言模型 Gemini,将结合 AlphaGo 技术和大型语言模型
谷歌公司在最近的采访中透露了正在开发中的大型语言模型 Gemini。该系统将结合 AlphaGo 技术和大型语言模型,在赋予系统规划和问题解决等新的能力,超过 OpenAI 的 GPT-4。
2025-04-15 17:22:39 -
全球AI电影大奖得主谈海螺AI体验感“技术平权让人震撼!”
国产AI电影崛起!近日,在麻省理工学院(MIT)举办的全球AI电影黑客马拉松(MIT AI Filmmaking Hackathon)中,由海螺视频与中国传媒大学未来影像研究中心联合出品的AI短片《电火花之舞》(Dance of E-Spark)凭
2025-04-15 17:12:55 -
中国联通国际董事长孟树森呼吁应对大模型技术挑战并抓住发展机遇
中国联通国际有限公司董事长兼总经理孟树森表示,ChatGPT等大模型技术的进步将加速人类社会进入通用人工智能时代。中国联通发布的图文大模型“鸿湖图文大模型1 0”,以及其在运营商增值业务方面的应用。
2025-04-15 16:58:49 -
网络犯罪的“智能帮凶”:OpenAI Operator 等 AI 智能体成黑客新武器
网络安全公司 Symantec 于 3 月 13 日发布博文,指出 AI 智能体(如 OpenAI 的 Operator)已突破传统工具功能限制,可协助黑客发起钓鱼攻击、构建攻击基础设施。 研究人员强调,这类 AI 工具正从“被动辅助”转向“
2025-04-15 16:44:48
-
AI会议整理软件_通义听悟使用教程
最近还挺多人在群里问,有没有啥好的总结会议生成纪要的AI,所以今天更新一篇这个教程,也算是补上AI办公的拼图。
2024-12-17 16:12:59 -
挑战用AI做一个全网最复杂的红包封面(挂件+动态)丨附使用教程
春节马上就要到了,一年一度的微信红包封面大战又要开始了。微信公众号奖了我一万多个红包封面。所以这次我打算调整一下做个最复杂的红包封面,也就是挂件+动态,并且借由这个测试下现在AIGC的能力边界。
2024-12-18 10:08:19 -
钉钉发布V7.5版本:首次推出AI个人助理产品「超级助理」,人人都可以创建专属的AI助理并上架应用市场
钉钉举行V7 5版本的迭代产品发布会,钉钉正式发布了基于70万家企业需求共创的AI助理产品,推动AI的使用门槛进一步降低,让人人都能创造AI助理。
2025-02-19 14:21:28 -
Music To Image音生图工具是什么_AI音频生成图像工具有哪些_AI音生图工具有哪些_Music To Image怎么用
「Music To Image」是一款AI音频生成图片的多模态转换工具,它的本质生成逻辑是音频→文本提示词→图像。
2024-12-17 00:06:33 -
AI绘画ComfyUI进阶教程丨插件IPAdapter的详细使用教程,风格模仿,换脸全靠它
哈咯大家好,本期正式给大家带来进阶部分的插件讲解教程,虽然很多朋友一直在用IPA但可能很多朋友还不太了解其结构,希望这期关于ipa用法的教程能对大家有所帮助吧!
2024-12-17 22:49:30 -
跟人类学孬了!联合国:AI大模型的回复存在严重的性别偏见、种族偏见与刻板印象等问题
报告指出,女性在大模型的描述中,从事“家务劳动”的频率是男性的4倍,而男性名字则与“商业”、“管理层”、“薪水”和“职业”等词汇联系在一起。
2025-02-08 12:52:22 -
?新年新气象!小红书推出AI人物头像绘图模型「InstantID」:轻松打造龙年新春头像,一键免费焕新
近日,小红书团队推出了一款AI头像生成工具「InstantID」,直接刷屏了。使用门槛较低。只需要用户提供一张自拍照就可以轻松生成一大波风格迥异的照片。
2025-02-13 14:27:20 -
AI概念股表现强势 Arm Holdings(ARM.US)涨超14%
周三,AI概念股表现强势,Arm Holdings(ARM US)涨超14%,甲骨文(ORCL US)、戴尔科技(DELL US)涨超7%,C3 ai(AI US)涨超6%。消息面上,美东时间周二,在当晚的白宫活动中,特朗普宣布,OpenAI、软银和甲骨文将成立
2025-02-25 17:23:06 -
微博推出“明星AI情感伴聊”:模拟你喜欢的爱豆来陪你聊天,演员李兰迪已进驻
用户向明星发送私信,专属的AI助手将模拟明星的聊天方式和风格进行自动回复,以情感陪伴提升用户体验。微博将陆续邀请更多明星开启该功能。
2025-04-04 10:51:09 -
AI绘画ComfyUI进阶教学丨Mask遮罩基础运用,IPA+CN+Lora+prompts+遮罩
本期开始正式进入遮罩相关的高级应用,这里我们会尝试为不同组件应用不同区域的遮罩,实现构图、效果的不同区域实现。希望本期内容能对大家有所帮助和启发,最后如果喜欢欧阳的教程就千万不要忘记支持一波啦!!!
2024-12-17 09:48:56