当闭环王者进入开源世界:苹果发布开源多模态大模型Ferret,可用于精准识别与定位图像里边的物体
AI奇点网12月25日报道丨今年10月,苹果和哥伦比亚大学的研究人员低调地发布了一个名为「Ferret」(中文名:雪貂)的开源多模态大语言模型。这款大模型其实是苹果公司与哥伦比亚大学研究人员的合作成果。当时发布的内容包括了代码生成和权重,仅限研究用途,不可用于商业。因为没有太多的宣发,当时并未引起广泛的注意。
一直奉行闭环生态的苹果公司在今年 10 月正式加入了开源 AI 的圈子。Ferret 的推出展现了苹果对影响深远的 AI 研究的承诺。这款模型既能精准地识别图像并描述其内容,还能辨别和定位图像中的各种元素。
Ferret 有 7B 和 13B 两个参数量版本,是一个对标微软、谷歌的10B量级的小参数模型。此外,为了增强模型的能力,苹果专门收集了一个名为 GRIT 数据集。该数据集包含了 110 万个样本,涵盖丰富的层次空间知识。
苹果公司 AI/ML 研究科学家 Zhe Gan 在 10 月份发布的一条推文中解释了 Ferret 的用途 —— 一个可以在图像中 "以任何粒度对任何地方的任何东西进行参照和定位" 的系统。它还可以通过使用图像中任何形状的区域来做到这一点。
简单地说,该模型可以分析图像上绘制的区域,确定其中对用户查询有用的元素,并将其识别出来,在检测到的元素周围绘制一个边界框。然后,它就可以将识别出的元素用作查询的一部分,并以典型的方式作出响应。
例如,高亮显示图像中的动物图片并询问大模型“这是什么动物”,大语言模型可以确定该动物的种类,并确定用户所指的是动物群中的某只动物。然后,它还可以利用图像中检测到的其他项目的上下文,提供进一步的回复。
尽管苹果以往以其产品和技术的封闭性著称,但现在它通过GitHub发布开源大语言模型,正逐渐改变这一形象,展现出其在 AI 领域的活跃参与和创新精神。这不仅对苹果自身,也对整个 AI 领域来说,都是一个值得关注的重要发展方向。
GitHub开源代码:
https://github.com/apple/ml-ferret
-
当闭环王者进入开源世界:苹果发布开源多模态大模型Ferret,可用于精准识别与定位图像里边的物体
苹果和哥伦比亚大学的研究人员低调地发布了一个名为「Ferret」的开源多模态大语言模型。这款模型既能精准地识别图像并描述其内容,定位图像中的各种元素。
2025-02-24 10:54:21 -
传阿里引入顶级人工智能科学家,打响新年AI To C赛道第一枪
2月3日,据业内人士透露,一位全球顶级人工智科学家已于近期正式入职阿里巴巴,后续或将专注AI To C业务的基础大模型研发与应用。据悉,这位顶级人工智能科学家在工业界和学术界均拥有超20年经验,尤其在多模态AI
2025-02-24 10:26:19 -
官宣:ChatGPT APP语音交互功能已下放至GPT-3.5模型,面向全体用户开放使用
OpenAI 官方宣布,ChatGPT APP 的语音功能现已面相所有用户全面上线,在此之前只有ChatGPT Plus订阅用户,也就是GPT-4模型的用户才可以使用。
2025-02-24 10:25:17 -
OpenAI CEO奥特曼公开公司2024年计划心愿表:GPT-5、开源项目以及更强大更好用的ChatGPT应用
年终岁末,正值圣诞节热闹气氛,OpenAI联合创始人兼CEO奥特曼在社交平台写下了OpenAI的2024年产品发展清单。
2025-02-24 10:01:59 -
软银联手OpenAI成立合资公司 打造日本的人工智能帝国
当地时间周一(2月3日),软银集团在官网宣布,OpenAI将与其成立一家名为“SB OpenAI Japan”的合资公司,合作开发和推广高级企业人工智能“Cristal intelligence”。 另外,软银每年将投资30亿美元在集团内部部署Op
2025-02-24 09:40:05 -
OpenAI CEO奥特曼年底炖煮一大锅“心灵鸡汤”:2023年个人年终总结,17句「职场箴言」引发全网共鸣
2023年即将画上一个句号。在推特(X)平台上,奥特曼连发多条推文,忆往昔,展未来。他还撰写了17句心灵鸡汤,希望可以帮到有需要的人。
2025-02-24 09:36:47
-
快手APP上线首个AI社交技能:「AI小快」聊天机器人,成为评论区的欢乐喜剧人
快手可能找到了AI聊天机器人与社交软件合体的最佳方式。最近很多快手用户发现,一个名叫「AI小快」的账号格外活跃,与网友聊得火热,一个抛梗、一个接梗…
2025-01-31 14:46:56 -
快手「可灵AI」全面开放内测,国际版上线丨Mistral发布1230亿Large 2旗舰模型丨OpenAI免费提供GPT-4o微调
【AI奇点网2024年7月25日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。
2025-01-14 11:04:50 -
AI视频后期消除对象神器ProPainter:一涂一抹,视频轻松移除指定对象丨本地离线一键部署
今天给大家介绍一款超强的一键删除视频内的移动物体和去除视频水印的工具ProPainter。本地部署比较麻烦,已经为大家制作好了离线整合包,解压即用。
2024-12-19 17:43:32 -
Midjourney 模型如何选择_怎么选择MJ模型
AI 绘画,顾名思义就是利用人工智能进行绘画,是人工智能生成内容(AIGC)的一个应用场景。其主要原理简单来说就是收集大量已有作品数据,通过算法对它们进行解析,最后再生成新作品,Midjourney是一个由同名研究实验室开发的人工智能程序。
2025-01-02 10:23:33 -
10年缘分说散就散:Ilya Sutskever官宣从OpenAI离职,麾下的“超级对齐团队”负责人也一并离职
5月14日,OpenAI 联合创始人、首席科学家 Ilya Sutskever 发推文对外宣告离职。作为联合创始人历经供职十载,OpenAI初创团队还是走散了
2025-01-26 13:54:56 -
爆火Sora震惊威尔·史密斯,真人整活吃意面视频丨OpenAI技术路线或早在1月被成功预言
威尔·史密斯的这段视频,把全网都骗了!其实Sora的技术路线,早已被人预言了。李飞飞去年就用Transformer做出了逼真的视频。但只有OpenAI大力出奇迹,跑在了所有人前面。
2025-02-13 09:47:49 -
openai取消每日限制_GPT-4 turbo取消每日限制
2月17日,OpenAI在社交平台宣布,取消了GPT-4 Turbo的所有每日限制,并将速率限制提升1倍。现在,每分钟可处理高达150万TPM的数据。
2025-02-13 10:38:31 -
商汤「日日新4.0」大模型测评:性能逼近GPT-4,全新「Assistants API」能力连OpenAI都只能自叹不如
近日,商汤官宣新一代大模型「日日新4 0」。大模型体系全面升级,不仅如此,商汤还领先推出全球首个支持不同模态下实现能力调用的Assistants API
2025-02-13 11:37:00 -
痛失2亿港元!警方通报:香港一跨国公司惨遭「AI换脸」线上诈骗,公司上下竟无一人察觉
据香港媒体报道,??香港警方披露境内首宗多人换脸AI技术诈骗案,一家总部位于英国的跨国公司的香港分公司被AI换脸技术的一段视频,直接骗走2亿港元。
2025-02-13 12:49:36 -
hugging face开源平替_Hugging Chat Assistant最新上线
抱抱脸新推出了OpenAI的GPT商店开源平替,“Hugging Chat Assistant”,也瞄准了让用户免费制定自定义聊天机器人。该软件完全免费,无需像OpenAI那样不开会员就被拒之门外。
2025-02-14 10:04:00