提升AI代理可靠性 英伟达推出容器化微服务Inference Microservices
英伟达周四推出用于加速生成式AI模型的部署的容器化微服务Nvidia Inference Microservices(NIM),希望帮助企业提高人工智能代理的信任、安全和可靠性。
英伟达在一篇博客中表示,人工智能代理是一项正在迅速发展的技术,正逐步改变人们与计算机互动的方式,但也伴随着诸多关键问题。智能化 AI(Agentic AI)有望革新知识工作者的任务执行方式,以及客户与品牌“对话”的方式,但其背后的大型语言模型仍可能出现不良反应,甚至在恶意用户试图突破防护时引发安全问题。
英伟达表示,周四发布的内容是基于其为开发者提供的保护框架Nemo Guardrails的扩展,旨在提高生成式人工智能应用的安全性、精确性和可扩展性。NeMo Guardrails是英伟达NeMo平台的一部分,用于管理、定制和保护人工智能,帮助开发者在大型语言模型(LLM)应用中集成并管理AI防护措施。目前Amdocs、Cerence AI和Lowe’s正在使用NeMo Guardrails来保护 AI 应用。
英伟达发布的NIM共有三种,分别涵盖主题控制、内容安全和越狱保护。该公司表示,这些微服务是经过高度优化的小型轻量级AI模型,可通过调控大型模型的响应提升应用性能。
英伟达企业AI模型、软件与服务副总裁Kari Briski表示。
“其中一项用于调控内容安全的新微服务,是基于Aegis内容安全数据集训练的。这是同类数据集中质量最高、由人工标注的数据源之一。”
Aegis内容安全数据集由英伟达推出,包括超过35,000个由人工标注的样本,用于检测AI安全问题和试图绕过系统限制的越狱行为。该数据集将在今年晚些时候于Hugging Face上公开发布。
例如,用于主题控制的NIM可防止AI代理“过于健谈”或偏离其原本的任务目标,确保其保持在既定主题内。英伟达表示,与AI聊天机器人进行的对话时间越长,它越容易忘记对话的初衷,从而让话题偏离轨道,类似于人类对话可能的漫谈。虽然人类可以接受这种情况,但对于聊天机器人,尤其是品牌AI代理,偏离主题可能导致谈论到名人或竞争产品,这对品牌不利。
Briski表示,
“像NeMo Guardrails系列中的小型语言模型,具有较低的延迟,专为资源受限或分布式环境中的高效运行而设计,这使它们非常适合在医疗、汽车、制造等行业的医院或仓库等场景中扩展ai应用。”
此外,NIM允许开发者以最小的附加延迟叠加多个防护措施。英伟达表示,这对大多数生成式AI应用至关重要,因为用户不喜欢长时间等待,例如看到三点闪烁或转圈加载动画后才出现文本或语音。
英伟达表示,NIM微服务以及用于轨道编排的NeMo Guardrails和Nvidia Garak工具包,现在已经面向开发者和企业开放使用。开发者可以通过相关教程开始将AI防护措施集成到客户服务的AI代理中,利用NeMo Guardrails构建安全的AI应用。
-
提升AI代理可靠性 英伟达推出容器化微服务Inference Microservices
英伟达周四推出用于加速生成式AI模型的部署的容器化微服务Nvidia Inference Microservices(NIM),希望帮助企业提高人工智能代理的信任、安全和可靠性。 英伟达在一篇博客中表示,人工智能代理是一项正在迅
2025-02-28 16:53:25 -
快与慢:AI 采用速度的真实影响
对于生成式 AI 的采用,采取谨慎和缓慢的方式有很多原因。技术变化迅速,在错误的平台上投入大量资金可能会造成巨大损失。 生成式 AI 仍存在准确性和安全性问题,版权问题也尚未在法庭上得到解决,这些都可能
2025-02-28 16:24:53 -
AI时代我们需要什么样的教育?
党的二十届三中全会《中共中央关于进一步全面深化改革推进中国式现代化的决定》指出:“加快建设高质量教育体系,统筹推进育人方式、办学模式、管理体制、保障机制改革”。当前,一个以AI为引领的新科技革命浪潮正
2025-02-28 16:00:33 -
神州数码加速AI应用落地 DC·AI生态创新中心启幕
2025年,神州数码开始加速AI应用产业落地。 1月15日,由神州数码携手生态伙伴共同打造的DC·AI生态创新中心正式启幕。该中心位于深圳湾超总基地神州数码国际创新中心37层,面积1000平方米,是集品牌展示和体验
2025-02-28 15:36:17 -
委员谈AI+教育:不怕学生用得多,怕他们不会用
“我们现在不是怕他们(ai)用得太多,反而是怕他们用得太少,不会跟上时代步伐。我们希望人人都能用起来,但是需要安全合规。”1月15日,上海市政协委员、同济大学国豪书院副院长任捷接受澎湃新闻采访时表示,要支
2025-02-28 15:13:20 -
AI市场热度持续攀升 基金人士聚焦产业链新变化
近日,人工智能(AI)热度再起。半导体、人形机器人、AI眼镜、智谱AI、抖音豆包等概念板块纷纷走强,科技股被很多投资者视为A股市场“顶梁柱”。 随着AI大模型全面进入消费领域,AI商业化成功的逻辑正在逐步兑现。
2025-02-28 14:50:33
-
商汤「日日新4.0」大模型测评:性能逼近GPT-4,全新「Assistants API」能力连OpenAI都只能自叹不如
近日,商汤官宣新一代大模型「日日新4 0」。大模型体系全面升级,不仅如此,商汤还领先推出全球首个支持不同模态下实现能力调用的Assistants API
2025-02-13 11:37:00 -
阿里发布视频生成模型MotionShop:支持AI数字人物一键替换,让“二次元老婆”跳宅舞,免费玩!开源圈杀疯!
阿里杀疯了!又整出跳舞模型新活儿——全新的AI数字人像生成模型框架。新框架支持一键替换原视频当中的动态人物,并且完美还原原版舞蹈。
2025-02-17 14:27:35 -
你已经是个“成熟的AI”,可以帮我代肝了:智谱AI联合清华大学团队打造视觉大模型CogAgent:可提供《原神》教学辅助
日,清华大学与旗下孵化的人工智能创企智谱AI合作,联合推出了新一代视觉GUI Agent图像理解大模型 CogAgent,可告知《原神》游戏操作步骤等
2025-02-20 17:54:39 -
AI代理将主导2025年,而不是ChatGPT
很多人工智能专家和预测者都认为,今年该领域最大的趋势之一是 AI 代理,它与 Claude 或 ChatGPT 等生成式 AI 模型不同。AI 代理也不同于定制 GPT。以下是它们各自的主要区别。 生成式 AI: 专注于根据用户输入创
2025-02-21 09:08:08 -
OPPO公布AndesGPT大模型最新升级:70亿参数端侧模型,OPPO Find X7系列首发搭载,小布助手能力全面提升
在会上,OPPO 公布了自研的”安第斯大模型“ AndesGPT 的全新升级,为行业内”首个端侧应用70亿参数大模型“的手机厂商。
2025-02-21 09:08:06 -
微软计划春季发布第一款Surface系列的AI PC丨优酷APP上线「AI搜片」功能丨马斯克:今年将诞生AI电影
【AI奇点网2024年1月2日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。
2025-02-21 09:28:14 -
两次走出低谷后,人工智能正重新占据舞台中心
2月16日早上,王祚的手机里收到了一条公众号推送,文章标题直白且不加掩饰——“现实,不存在了。” 这句看似从科幻小说《三体》中借鉴来的标题吸引了王祚,出于好奇,他打开了这篇推文。文章中讲述的是美国开放人工
2025-02-21 09:35:08 -
AI浪潮勿忘“银发族”
在春节这个家庭团聚的时刻,新科技总是成为聊天的热门话题,而今年,人工智能(AI)无疑成了讨论的焦点。 在大年初一的家庭聚会中,刚步入大学的侄子热情洋溢地分享了他在校园内参与AI社团的经历,以及如何利用AI
2025-02-21 09:56:40 -
银河证券:DeepSeek的技术颠覆带来的是AI行业的多元化,有望加速AI行业的普及繁荣
每经快讯,银河证券研报认为,DeepSeek通过算法及工程创新,显著降低成本。结合银河证券对芯片、硬件、软件、应用端等的影响分析,DeepSeek的技术颠覆带来的是AI行业的多元化,有望加速AI行业的普及繁荣。建议关
2025-02-21 13:40:54 -
超越人类认知边界!AI设计的芯片太复杂:科学家也看不懂
快科技2月4日消息,随着AI的快速发展,部分科学家开始借助AI设计芯片,然而AI设计的部分芯片过于复杂,甚至超出人类的理解范畴。 普林斯顿大学Sengupta实验室的科学家团队主导了这项研究,他们通过“逆向设计”
2025-02-21 14:30:37