西南交通大学大模型边缘推理优化技术取得新成绩
今年7月底,第二届中国计算机学会(CCF)芯片大会在上海举办。近两千名国内外计算机和微电子等学科领域从事芯片相关研究与技术开发的专家学者、研究人员、企业代表参会,共同探讨芯片设计与EDA、新型体系架构、容错计算、新兴计算机工程与工艺等方面的理论创新、技术研发、应用示范与产业发展话题。
在本届芯片大会体系结构专委组织的“CCFTCarch定制计算挑战赛”(消费级显卡的LLM部署加速)上,西南交通大学冯力教授带领的研究团队凭借其在大模型边缘推理优化方面的卓越表现,荣获了全国第二名的优异成绩。
在此次竞赛中,冯力团队采用了一系列创新技术来应对大模型边缘推理面临的挑战,其中包括算子融合技术。该技术通过将多个独立的运算操作合并,减少了显存的频繁读写,显著提升了计算效率。
据冯力介绍,通过算子融合,团队成功地将计算时间缩短了80%以上,极大地提高了计算资源的利用效率。此外,团队还实施了精度量化技术,将部分计算从浮点运算转换为定点运算。虽然这在一定程度上带来了精度上的损失,但整体上仍实现了计算速度的大幅提升和能耗的降低。
冯力强调,此次竞赛的成功离不开团队成员之间的紧密合作。尽管参赛的学生们在大模型领域缺乏经验,但他们展现出了非凡的学习能力和勇于探索的精神。通过与国际顶尖学者的合作,特别是与英国布里斯托大学的跨国交流,学生们不仅拓宽了视野,也积累了宝贵的经验。冯力表示:“我们的学生非常年轻,但他们充满热情,勇于面对挑战。通过大量的文献阅读和技术研讨,他们迅速掌握了相关领域的最新进展,并将理论知识转化为实践成果。”
谈及未来的发展方向,冯力表示,随着大模型技术的进步,特别是在隐私保护和私有化部署方面的需求日益增加,团队的研究成果将具有广阔的应用前景。例如,在金融、交通和航空等领域,许多敏感数据不适合传输到云端处理,而是在本地进行分析,这就需要高效的大模型边缘推理技术。冯力透露,目前团队正在积极与多家企业和研究机构合作,致力于将研究成果应用于网络安全漏洞分析和交通大数据处理等方面,推动科研成果的商业化转化。
-
西南交通大学大模型边缘推理优化技术取得新成绩
今年7月底,第二届中国计算机学会(CCF)芯片大会在上海举办。近两千名国内外计算机和微电子等学科领域从事芯片相关研究与技术开发的专家学者、研究人员、企业代表参会,共同探讨芯片设计与EDA、新型体系架构、容错
2025-07-17 13:08:37 -
MiniMax闫俊杰:大模型快就是好 可有时候慢是为了更快
大模型是拼速度的领域,但有时候慢可能是另一种快。 8月31日,国内AI独角兽企业MiniMax上海稀宇科技有限公司(以下简称“MiniMax”)在首届开发者大会“MiniMaxLink伙伴日”上低调发布视频模型abab-video-1,输入
2025-07-17 12:44:37 -
监督帮扶大模型上线,未来拟向全国推广!
“能即时回复,而且内容详细,有些我们没想到的事项也会包括在答复里。” 作为参加2024年第七轮次重点区域空气质量改善夏季监督帮扶的执法同志,来自河南省濮阳市生态环境局的彭建志向“监督帮扶智能答疑模型”咨询相
2025-07-17 12:20:37 -
杭州字节方舟取得一种基于人工智能的区块链大数据推荐方法的专利,使推荐系统能更精确地匹配用户的兴趣点
专利摘要显示,本发明公开了一种基于人工智能的区块链大数据推荐方法,涉及区块链技术领域,该推荐方法的步骤为:S1、收集用户的行为数据,并采用区块链技术存储加密行为数据;S2、对行为数据进行预处理,并从行
2025-07-17 11:56:37 -
高盛:AI浪潮可能在未来10年拖累油价
高盛本周发表研报指出,目前围绕AI对能源行业影响的讨论主要集中在需求侧,如AI算力需求增加,导致电力需求上升,这可能推高能源需求和价格。然而,供给侧的影响更加复杂,AI可以极大提升石油勘探和生产的效率,
2025-07-17 11:32:37 -
生成式AI会让人类思考力退化吗?这场大会将揭示十大热点话题答案
越来越多工作岗位可能被AI替代,如何实现人的劳动诉求和人生价值?当AI开始弥补甚至取代情感陪伴这一曾经独属于人类的体验,将带来哪些新可能和新问题? 9 月 3 日,外滩大会官微发布2024 Inclusion·外滩大会
2025-07-17 11:08:37
-
李彦宏:AI大模型本身不直接产生价值,“卷”大模型没有意义,“卷”应用机会更大
9月5日,百度CEO李彦宏在百度“文心杯”创业大赛颁奖致辞中表示,AI 原生应用要能解决过去解决不了、解决不好的问题,应用才是大模型存在的意义。
2025-04-13 15:06:30 -
佳能推出两款图像AI处理工具:提供消除马赛克、降噪与画质提升三大功能
佳能中国官方发布消息称,正式对消费者推出两款神经网络应用工具软件,主要面向专业的制图师与、摄影发烧友、摄影师及其影像工作室等人群。
2025-04-29 15:41:20 -
美年健康:大模型与AI Agent赋能,引领医疗人工智能应用
随着科技迅猛发展,人工智能已悄然融入生活各个角落。在12 月 14日结束的第七场发布上,Open AI 作为全球AI领域的先行者,再次展示了其在人工智能领域持续迭代与创新的强劲势头,从ChatGPT 的广泛应用,到后来依
2025-05-14 16:25:21 -
金融街论坛观察:“AI+金融”在多个业务领域落地开花
中新经纬10月20日电 (李自曼)AI与金融的融合正成为推动数字金融转型升级的重要力量。在2024金融街论坛年会期间,多位金融界和科技界专家学者、公司高管就“AI+金融”相关主题进行了深入探讨。 中国银行业协会首席信
2025-06-20 14:21:20 -
张军出席第19届亚太首席大法官会议并作专题发言表示 深化人工智能领域的司法交流合作 努力为人类司法文明进步作出新贡献
张军出席第19届亚太首席大法官会议并作专题发言表示 深化人工智能领域的司法交流合作 努力为人类司法文明进步作出新贡献 当地时间10月12日至13日,第19届亚太首席大法官会议在马来西亚吉隆坡举办
2025-06-25 11:06:12 -
我国人工智能核心产业规模不断提升 注册用户超6亿
工业和信息化部12日表示,截至目前,我国生成式人工智能服务大模型的注册用户超过6亿。 工业和信息化部总工程师 赵志国:我国人工智能核心产业的规模在不断提升,企业数量超过了4500家。完成备案并上线为公众
2025-06-25 11:30:12 -
人工智能可帮助寻找暗物质
瑞士研究人员开发出一种人工智能算法,可从天文观测数据中分辨出与暗物质有关的信号,将其与容易混淆的其他信号区别开来。 瑞士洛桑联邦理工学院科研人员开发的这一深度学习算法利用了“卷积神经网络”技术,这是一
2025-07-08 11:09:23 -
midjourney新功能_style tuner应用教程_MJ最新教程
MJ的新功能style tuner,终于可以训练自己的模型风格了,在我快速模式恢复之后立马尝试了一遍,操作步骤简单,比SD容易上手太多,我来代练一遍,大家跟上节奏
2024-12-19 06:34:05 -
OpenAI官宣:开始训练下一代AI大模型,「GPT-5」发布时间曝光
最近OpenAI的小动作越来越频繁了。当地时间5月28日,OpenAI在官网博客上正式宣布?:开启下一代大模型的训练,同时成立AI安全监管委员会。
2025-01-21 17:52:43 -
阿里云加入AI大模型API价格战:宣布主力模型Qwen-Long降价97%,中文能力比肩GPT-4
5月21日,阿里云紧随其后抛出重磅炸弹:通义千问「GPT-4级」主力模型 Qwen-Long 宣布降价,降价后,1元最多可以获得200万tokens。
2025-01-22 15:43:06