消息称华为即将发布AI推理领域突破性成果:降低对HBM依赖,提升国内大模型性能
8月10日消息,据《科创板日报》报道,华为将于8月12日在2025金融AI推理应用落地与发展论坛上,发布AI推理领域的突破性技术成果。据透露,这项成果或能降低中国AI推理对HBM(高带宽内存)技术的依赖,提升国内AI大模型推理性能,完善中国AI推理生态的关键部分。
注意到,华为在AI推理领域的技术突破已有先例。2025年3月,北京大学联合华为发布了DeepSeek全栈开源推理方案,该方案基于北大自研SCOW算力平台系统和鹤思调度系统,整合了DeepSeek、openEuler、MindSpore与vLLM/RAY等社区开源组件,实现了华为昇腾上的DeepSeek高效推理。
在性能方面,华为昇腾已实现多项突破。例如CloudMatrix384超节点部署DeepSeekV3/R1时,在50ms时延约束下单卡Decode吞吐突破1920Tokens/s;Atlas800IA2推理服务器在100ms时延约束下单卡吞吐达到808Tokens/s。
科大讯飞与华为的合作也取得了显著成果,双方率先实现了国产算力上MoE模型的大规模跨节点专家并行集群推理,使推理吞吐提升3.2倍,端到端时延降低50%。
-
消息称华为即将发布AI推理领域突破性成果:降低对HBM依赖,提升国内大模型性能
据《科创板日报》报道,华为将于8月12日在2025金融AI推理应用落地与发展论坛发布AI推理突破性成果,或降低中国AI推理对HBM技术依赖,完善AI推理生态。华为AI推理成果
2025-08-11 09:51:06 -
GPT-5问题太多,奥特曼带团回应一切,图表弄错是因「太累了」
「它比我们想象得要坎坷一些!」
2025-08-11 09:51:05 -
代季峰陈天桥联手AGI首秀炸场!最强开源深度研究模型,GAIA测试82.4分超OpenAI
“经过一个季度的努力”
2025-08-11 09:51:03 -
腾讯《虚环》《穿越火线:虹》公开实机演示;心动投资AI游戏公司;GPT-5可分钟级生成3D游戏 | 氪游周报8.4-8.10
一文读懂84-810游戏行业大事件。
2025-08-11 09:51:02 -
施耐德电气:当AI进入产业主场核心技术+场景知识带来价值最大化
当大模型的讨论热潮逐步回归理性,企业关注焦点已转向AI如何真正落地,成为推动产业效率、绿色转型和商业模式重塑的关键变量。最近2025世界人工智能大会(WAIC)期间,关于AI如何真正融入产业、
2025-08-09 07:02:50 -
「兔子蹦床」播放超 5 亿,这条全网最火 AI 视频,是人类爱被「骗」的结果
兔子没在蹦床上,但人在短视频里
2025-08-09 07:02:32
-
本科就在人工智能顶级会议发表论文,他从江大直博香港科技大学
他大一便加入实验室,发表9篇外文论文,其中1篇人工智能顶级会议论文,3篇SCI期刊论文;他还领衔或参与申请2项国家发明专利,13项软件著作权、成果转让达十余万元;他还是武汉大学、香港大学、伊利诺伊大学厄巴纳
2025-05-25 14:42:49 -
AI应用也想玩儿预装了?手机厂商不乐意,只因害怕痛失入口
AIApp会将成为下一个「CarPlay」。
2025-08-03 07:01:56 -
comfyUI系列教程_SDXL完整工作流推荐
本期来跟大家分享comfyUI中 SDXL 的初级和高级多种处理流程,希望对大家有所帮助!
2024-12-18 13:21:39 -
国内“AI声音侵权”第一案在京开庭审理:微软、出门问问进入被告席,「AI孙燕姿们」进入司法深水区,要慌了…
12月12日,北京互联网法院首次组成五人合议庭,依法公开审理全国首例「AI声音侵权案」。微软、出门问问等AI科技企业涉嫌侵权成被告。
2025-02-24 17:58:31 -
AI工具网站全球流量TOP50统计榜单(截止6月):ChatGPT稳居第一,大部分用户仍未深入使用
ChatGPT在榜单中排行第一;位居次席的是一款“主打个性化的AI聊天机器人”的网站Character ai;拿下第三的则是谷歌提供的Bard。
2025-04-01 17:34:14 -
首批ITU-T AICP评估结果重磅发布 | 阿里云人工智能平台PAI率先通过国际标准评估!
随着智能算力逐步取代通用算力成为算力结构最主要构成,传统的通用云计算服务逐步升级成为服务于人工智能技术和应用发展的智算云,打造集智能算力、通用算法和大模型开发平台于一身的新型人工智能云平台成为云服
2025-05-25 13:06:49 -
张军出席第19届亚太首席大法官会议并作专题发言表示 深化人工智能领域的司法交流合作 努力为人类司法文明进步作出新贡献
张军出席第19届亚太首席大法官会议并作专题发言表示 深化人工智能领域的司法交流合作 努力为人类司法文明进步作出新贡献 当地时间10月12日至13日,第19届亚太首席大法官会议在马来西亚吉隆坡举办
2025-06-25 11:06:12 -
我国人工智能核心产业规模不断提升 注册用户超6亿
工业和信息化部12日表示,截至目前,我国生成式人工智能服务大模型的注册用户超过6亿。 工业和信息化部总工程师 赵志国:我国人工智能核心产业的规模在不断提升,企业数量超过了4500家。完成备案并上线为公众
2025-06-25 11:30:12 -
OpenAI发布GPT-4o mini丨知名大模型迎战2024高考全科成绩出炉丨苹果否认使用未授权YouTube视频训练AI
【AI奇点网2024年7月19日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。
2025-01-14 17:45:35 -
OpenAI深夜发动价格战_ChatGPT 4omini价格下跌
GPT-4o mini深夜忽然上线,OpenAI终于开卷小模型!每百万输入token已达15美分的超低价,跟GPT-3相比,两年内模型成本已降低99%。Sam Altman惊呼:通往智能的成本,已变得如此低廉!另外,清华同济校友为关键负责人。
2025-01-15 09:04:34