号称中文千亿参数量「地表最强」:华为盘古大模型到底是个啥水平?
AI奇点网6月5日报道丨华为计划7月7日举行华为云HDC 2023开发者大会,届时将发布一款直接对标ChatGPT的多模态千亿级大模型应用,或称“盘古Chat”,基于华为自研盘古大模型。与ChatGPT和百度文心一言等针对C端落地不同,华为这款应用产品主要面向ToB/ToG的政企客户,服务于各行各业的工作场景,针对提高生产力和改善效率。
需要强调的是,华为盘古大模型是一个系列,而不是一个独立的大语言模型。根据华为云官网资料,盘古系列大模型包括以下五个基础模型,也被称为(L0)级大模型。
中文语言(NLP)大模型
为业界首个超千亿级参数的中文预训练大模型,被认为是最接近人类中文思维能力的AI大模型。与ChatGPT等国外AIGC大语言模型相比,华为盘古大模型更注重本土语言优化。作为一家非社交互联网属性的企业,华为为了打造盘古大模型,从互联网爬取了80TB公开文本,最后清洗出1TB的精选中文数据集供给大模型训练,在预训练阶段总共学习了超过40TB文本数据,并通过行业数据的小样本调优,以提升模型在不同垂直场景中的应用性能。
视觉(CV)大模型
超过30亿参数的业界最大的CV视觉大模型,首次实现模型按需抽取,首次实现兼顾判别与生成能力。它可以基于模型大小和运行速度需求,自适应抽取不同规模模型,AI应用开发快速落地,使AI开发进入工业化模式。使用层次化语义对齐和语义调整算法,在浅层特征上获得了更好的可分离性,使小样本学习的能力获得了显著提升,性能表现可达业界第一。
其他基础大模型
图+网络(Graph)大模型
首创图+网络融合技术,在工艺优化、时序预测、智能分析等场景有广泛应用。
多模态大模型
具备图像和文本的跨模态理解、检索与生成能力。可以从多个数据源中获得更丰富的信息,从而提高模型的性能和鲁棒性。
科学计算大模型
主要解决各种科学问题,旨在用AI促进基础科学的发展。包括传统的气象、海洋、农业、地球科学、航空航天等领域开始从偏微分方程的方法拓展到AI方法。
基础大模型夯底
向上发展垂直大模型
(L1)级 垂直领域行业大模型
在L1级别的行业大模型方面,华为已经推出了盘古金融大模型、盘古矿山大模型、盘古气象大模型、盘古电力大模型、盘古制造质检大模型、盘古药物分子大模型等行业大模型。
(L2)级 细分场景的推理模型
在L2级细分场景模型方面,华为已经推出诸如基于气象大模型的短临气象预报、台风预测等场景模型;基于电力大模型的无人机电力巡检、电力缺陷识别等场景模型;基于时尚大模型的辅助设计、版权保护等应用场景模型。此外,在物联网、智能汽车座舱、智能驾驶等领域,华为都已推出基于盘古大模型的各种应用。
基于华为盘古大模型开发的华为盘古聊天应用,将被命名为“盘古Chat”,可广泛应用于智能舆情、智能营销、智能巡检、智慧物流等多种场景,具有赋能千行百业的潜力。在人才储备和算力自主可控方面具有优势,有望成为国内最为领先的大模型应用产品。
此前曾有国内券商披露,在训练盘古大模型时,华为团队调用了超过2000块昇腾910服务器芯片,进行了超2个月的数据训练能力。
华为盘古大模型诞生于2020年11月在华为云内部会议,并于2021年4月对外披露相关消息。根据华为公布的一份论文数据,盘古PanGu-Σ大模型的参数量高达1.085万亿,并基于华为自研MindSpore框架开发。
根据内测人士透露,盘古PanGu-Σ大模型的自然语言对话能力可达到GPT-3.5的水平。在2022年4月华为官宣发布2.0版本,并且宣布自然语言处理大模型、计算机视觉大模型和科学计算气象大模型均已实现商用上线。
来自天眼查的信息,华为已于近期申请注册两个“HUAWEINETGPT”(华为网络GPT)商标。此外,华为已成功抢注多个带有“盘古”“PANGU”字样的商标。
伴随中美摩擦加剧以及高科技禁运的不利条件下,备受国人关注的AI训练算力方面,在此之前,华为昇腾计算业务CTO周斌在采访中曾表示,有信心承载类似ChatGPT这种规模的应用训练,他认为华为完全没有问题。
他说:“我们已经服务了国内几十家合作伙伴的大模型,至少从底层技术软硬件的规模上来讲,华为的参数量不比ChatGPT少,而ChatGPT所需的算力需求,我们已经经过了大规模验证,是完全没问题的。”
-
号称中文千亿参数量「地表最强」:华为盘古大模型到底是个啥水平?
华为盘古大模型为业界首个超千亿级参数的中文预训练大模型,与ChatGPT等国外AIGC大语言模型相比,华为盘古大模型更注重本土语言优化。
2025-04-25 14:01:44 -
谷歌PaLM 2大语言模型参数量曝光:对比第一代大幅减少,但训练量翻五倍
近日,谷歌内部文件泄漏大量PaLM 2的训练细节被曝光,其中训练数据量是前代的近5倍、参数量仅为第一代2 3左右。
2025-04-25 13:32:47 -
AI诈骗的门槛究竟有多低:几张受害者相关截图+免费开源的算法
近期,“AI诈骗正在全国爆发”的话题多次冲上微博热搜。就在上个月,合肥一企业的老板郭先生被“好友”视频差点骗走430万元。
2025-04-25 13:12:45 -
索尼CEO:未来将把AI应用在PlayStation的云游戏业务
近日,索尼集团CEO吉田健一郎也对PlayStation的云游戏计划发表了评论,并表示有意让人工智能在新兴领域中发挥更重要的作用。
2025-04-25 12:51:02 -
OpenAI官网单月访问量飙升至18亿:上榜全球访问量最高的网站TOP20
OpenAI的网站在3月份的访问量激增了54%以上,总共有8 47亿用户访问了该网站,这使得OpenAI成为全球20家流量最高网站之一。
2025-04-25 12:30:01 -
动视暴雪自研AI绘图工具Blizzard Diffusion:帮助员工快速生成游戏美术概念图
暴雪Blizzard Diffusion的推出,将为暴雪游戏的美术设计带来更多的可能性和创新。通过使用人工智能技术,开发人员可以更快速地生成游戏美术概念图,从而更好地展现游戏的世界观和故事情节。
2025-04-25 12:02:04
-
AI绘画ComfyUI进阶教程丨如何实现Clip精准控图,流程自动化入门!
大家好,又到学习时刻? 本期跟大家分享CLIP构图相关的一些进阶基础内容,以及自动化逻辑编程基础,希望能对大家有所启发,最后不要忘记支持欧阳一波啦?!
2024-12-17 13:16:14 -
大语言模型「新王」Claude 3全面测评:原生多模态大模型各项能力实力超群,连打麻将都学会,实测比GPT-4好用
OpenAI「不可战胜」的神话,看样子是要被打破了。Claude 3的多版本发布后,“中杯”Sonnet直接免费体验,“大杯”Opus充个会员也能即刻享受,各路测评纷至沓来。
2024-12-13 18:57:45 -
有手就行:Stability AI推出简笔画生成图片工具Stable Doodle
近日,图像生成模型 Stable Diffusion 背后的初创公司 Stability AI 推出了一项新的服务,可以将简笔画转换为图像。这项服务名为 Stable Doodle,利用最新的 Stable Diffusion 模型分析简笔画的轮廓,让每个人都能得到堪称艺术的作品。
2025-04-10 13:09:46 -
阿里云通义千问上线AIGC春节新玩法:AI帮你免费拍摄全家福,AI舞蹈视频生成器“全民舞王”新增春晚舞蹈
春节将至年味渐浓,阿里云通义千问APP上线多项免费新应用,涵盖全家福、拜新年、万物成龙等图像生成的新玩法。
2025-02-13 15:39:26 -
阿里旗下夸克APP上线“AI学习助手”:内置海量试题,拍照一键解疑,巧用大模型帮助当代学子高效备考、快速进阶
夸克“AI学习助手”采用夸克宝宝的虚拟形象为用户进行题目讲解。基于大语言模型和视觉技术,AI智能讲解能够给用户提供 “考点分析”、“详解步骤”、“答案总结”等详细内容。
2025-02-18 16:08:16 -
应用商店下载排行第一,“Meta版推特”Threads注册用户超5000万
新上线社交应用Threads已注册激活用户超过5000万,该数字仍在持续增长。当前在英国和美国苹果应用商店免费应用中的下载量排名第一。
2025-04-14 13:36:13 -
AI写真生成器妙鸭相机免费体验版实测_仅需8张自拍
在小红书、朋友圈刷屏的“妙鸭相机”,还记得吗?9月20日,这家AI快消应用公司宣布“妙鸭相机”免费体验版本正式上线啦!本次更新的“妙鸭相机”APP,专业版要求上传的图片数量也从20张下调到15张了哟
2024-12-16 09:21:10 -
网易出品的免费AI在线绘画工具:AI绘画工坊,安利给大家
网易出品推出的云端Stable Diffusion简直太好用了,集成了多种模型任你选,想生成什么类型的图像都超级容易。
2024-12-16 09:26:04 -
AI绘画ComfyUI进阶教程丨插件IPAdapter的详细使用教程,风格模仿,换脸全靠它
哈咯大家好,本期正式给大家带来进阶部分的插件讲解教程,虽然很多朋友一直在用IPA但可能很多朋友还不太了解其结构,希望这期关于ipa用法的教程能对大家有所帮助吧!
2024-12-17 22:49:30 -
抖音开启AI搜索功能灰度测试丨OpenAI CEO奥特曼:2024年无法实现AGI丨夸克APP上线“健康大模型”
【AI奇点网2023年12月26日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。
2025-02-21 17:23:50