英伟达最强AI大模型训练芯片H200正式发布:141G海量超大内存,AI推理速度提升90%,向下兼容H100
11月14日北京时间今天凌晨,英伟达老黄带着新一代GPU芯片H200再次炸场。官网毫不客气就直说了,“世界最强的GPU,专为AI和超算打造”。
听说所有AI公司都抱怨内存不够?
这回直接141GB大内存,与H100的80GB相比直接提升76%。作为首款搭载HBM3e内存的GPU,内存带宽也从3.35TB/s提升至4.8TB/s,提升43%。
对于AI来说意味着什么?来看测试数据——
在HBM3e加持下,H200让Llama-70B推理性能几乎翻倍,运行GPT3-175B也能提高60%。
对AI公司来说还有一个好消息:
H200与H100完全兼容,意味着将H200添加到已有系统中不需要做任何调整。
最强AI芯片只能当半年
除内存大升级之外,H200与同属Hopper架构的H100相比其他方面基本一致。
台积电4nm工艺,800亿晶体管,NVLink 4每秒900GB的高速互联,都被完整继承下来。
甚至峰值算力也保持不变,数据一眼看过去,还是熟悉的FP64 Vector 33.5TFlops、FP64 Tensor 66.9TFlops。
对于内存为何是有零有整的141GB,AnandTech分析HBM3e内存本身的物理容量为144GB,由6个24GB的堆栈组成。
出于量产原因,英伟达保留了一小部分作为冗余,以提高良品率。仅靠升级内存,与2020年发布的A100相比,H200就在GPT-3 175B的推理上加速足足18倍。
H200预计在2024年第2季度上市,但最强AI芯片的名号H200只能拥有半年。同样在2024年的第4季度,基于下一代Blackwell架构的B100也将问世,具体性能还未知,图表暗示了会是指数级增长。
多家超算中心将部署GH200超算节点
除了H200芯片本身,英伟达此次还发布了由其组成的一系列集群产品。
首先是HGX H200平台,它是将8块H200搭载到HGX载板上,总显存达到了1.1TB,8位浮点运算速度超过32P(10^15) FLOPS,与H100数据一致。
HGX使用了英伟达的NVLink和NVSwitch高速互联技术,可以以最高性能运行各种应用负载,包括175B大模型的训练和推理。HGX板的独立性质使其能够插入合适的主机系统,从而允许使用者定制其高端服务器的非GPU部分。
接下来是Quad GH200超算节点——它由4个GH200组成,而GH200是H200与Grace CPU组合而成的。
Quad GH200节点将提供288 Arm CPU内核和总计2.3TB的高速内存。通过大量超算节点的组合,H200最终将构成庞大的超级计算机,一些超级计算中心已经宣布正在向其超算设备中集成GH200系统。
据英伟达直接官宣,德国的尤利希超级计算中心将在Jupiter超级计算机使用GH200超级芯片,包含的GH200节点数量达到了24000块,功率为18.2兆瓦,相当于每小时消耗18000多度电。
该系统计划于2024年安装,一旦上线,Jupiter将成为迄今为止宣布的最大的基于Hopper的超级计算机。
Jupiter大约将拥有93(10^18) FLOPS的AI算力、1E FLOPS的FP64运算速率、1.2PB每秒的带宽,以及10.9PB的LPDDR5X和另外2.2PB的HBM3内存。
除了德国的Jupiter,日本先进高性能计算联合中心、德克萨斯高级计算中心、伊利诺伊大学香槟分校国家超级计算应用中心等超算中心也纷纷宣布将使用GH200对其超算设备进行更新升级。
那么,AI行业的从业者有机会通过哪些尝鲜途径体验到GH200呢?
上线之后,GH200将可以通过Lambda、Vultr等特定云服务提供商进行抢先体验,Oracle和CoreWeave也宣布了明年提供GH200实例的计划,亚马逊、谷歌云、微软Azure同样也将成为首批部署GH200实例的云服务提供商。
英伟达自身,也会通过其NVIDIA LaunchPad平台提供对GH200的访问。
硬件制造商方面,华硕、技嘉等厂商计划将于今年年底开始销售搭载GH200的服务器设备。
-
英伟达最强AI大模型训练芯片H200正式发布:141G海量超大内存,AI推理速度提升90%,向下兼容H100
11月14日北京时间今天凌晨,英伟达老黄带着新一代GPU芯片H200再次炸场。官网毫不客气就直说了,“世界最强的GPU,专为AI和超算打造”。
2025-03-28 11:08:52 -
英伟达祭出地表最强AI芯片H200:大模型推理速度翻倍,大厂超算换代进行时
北京时间11月14日凌晨,老黄又一次在深夜炸场,发布目前世界最强的AI芯片H200!较前任霸主H100,H200的性能直接提升了60%~90%。
2025-03-28 10:44:13 -
最强AI旗舰!vivo发布X100系列旗舰手机:首发搭载蓝心AI大模型,基于天玑9300“AI芯片”
11月13日晚间,vivo正式发布了年度旗舰手机X100,这款旗舰新品配备了天玑9300旗舰平台,搭载了vivo自研的70亿参数大模型端侧部署的蓝河操作系统。
2025-03-28 10:20:14 -
夸克推出自研千亿级参数大模型:CMMLU测评榜单第一,将与APP搜索能力深度整合
夸克App本次上线的夸克大模型号称是“全栈自研、千亿级参数”,在最新的一期中文大模型测评基准CMMLU 当中位列榜首,超越了上一次榜单的领跑者vivo。
2025-03-28 09:57:01 -
OpenAI已经开始训练“GPT-5”:月入7亿不够烧,希望微软再投资亿点点
GPT-5已开工!CEO奥特曼也承认,OpenAI正在开发下一代大模型,但并未透露具体发布时间表。也没有宣布大模型的名字,不过我们姑且先叫他“GPT-5”。
2025-03-28 09:30:49 -
激光投影+随身GPT+手势操控:苹果前设计师联手OpenAI重新定义手机
AI Pin由智能硬件初创公司Humane推出的可穿戴人工智能设备,定位为智能手机的平替,而非智能手机的一款配件。它可以吸附在衣服上,没有屏幕,基于OpenAI的人工智能技术打造,可以借助镭射投屏在手掌上进行交互。
2025-03-28 09:08:30
-
AI视频后期消除对象神器ProPainter:一涂一抹,视频轻松移除指定对象丨本地离线一键部署
今天给大家介绍一款超强的一键删除视频内的移动物体和去除视频水印的工具ProPainter。本地部署比较麻烦,已经为大家制作好了离线整合包,解压即用。
2024-12-19 17:43:32 -
小米公司开启小爱AI大模型多模态能力内测:支持图片内容问答、AI扩图、消除路人,适配小米14、Redmi K70等
3月15日,小米官方宣布小米社区开启新一轮的小爱AI大模型内测。现已开启“小爱同学多模态功能内测”。
2025-02-07 13:53:52 -
你已经是个“成熟的AI”,可以帮我代肝了:智谱AI联合清华大学团队打造视觉大模型CogAgent:可提供《原神》教学辅助
日,清华大学与旗下孵化的人工智能创企智谱AI合作,联合推出了新一代视觉GUI Agent图像理解大模型 CogAgent,可告知《原神》游戏操作步骤等
2025-02-20 17:54:39 -
AI代理将主导2025年,而不是ChatGPT
很多人工智能专家和预测者都认为,今年该领域最大的趋势之一是 AI 代理,它与 Claude 或 ChatGPT 等生成式 AI 模型不同。AI 代理也不同于定制 GPT。以下是它们各自的主要区别。 生成式 AI: 专注于根据用户输入创
2025-02-21 09:08:08 -
OPPO公布AndesGPT大模型最新升级:70亿参数端侧模型,OPPO Find X7系列首发搭载,小布助手能力全面提升
在会上,OPPO 公布了自研的”安第斯大模型“ AndesGPT 的全新升级,为行业内”首个端侧应用70亿参数大模型“的手机厂商。
2025-02-21 09:08:06 -
银河证券:DeepSeek的技术颠覆带来的是AI行业的多元化,有望加速AI行业的普及繁荣
每经快讯,银河证券研报认为,DeepSeek通过算法及工程创新,显著降低成本。结合银河证券对芯片、硬件、软件、应用端等的影响分析,DeepSeek的技术颠覆带来的是AI行业的多元化,有望加速AI行业的普及繁荣。建议关
2025-02-21 13:40:54 -
谷歌Gemini自称文心一言?!一个BUG牵出AI大模型重大难题:全球陷入高质量训练数据荒,2024年或将枯竭
当地时间12月22日,外网内网的网友们激动地奔走相告:Gemini承认自己是用文心一言训练中文语料的。这听起来就是个段子,简直魔幻。
2025-02-21 16:58:14 -
为人工智能发展提供要素支撑
长广溪智能制造(无锡)有限公司的协作机器人在进行汽车智能部件自动装配。孙 斌摄 数据来源:工业和信息化部等 习近平总书记强调,人工智能是新一轮科技革命和产业变革的重要驱动力量,加快发展新一代人工智能
2025-02-21 16:59:00 -
抖音开启AI搜索功能灰度测试丨OpenAI CEO奥特曼:2024年无法实现AGI丨夸克APP上线“健康大模型”
【AI奇点网2023年12月26日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。
2025-02-21 17:23:50 -
软银联手OpenAI成立合资公司 打造日本的人工智能帝国
当地时间周一(2月3日),软银集团在官网宣布,OpenAI将与其成立一家名为“SB OpenAI Japan”的合资公司,合作开发和推广高级企业人工智能“Cristal intelligence”。 另外,软银每年将投资30亿美元在集团内部部署Op
2025-02-24 09:40:05