微软New Bing聊天机器人灰度测试多模态能力:开放“AI识图”入口
AI奇点网6月15日报道 | OpenAI在3月份公布了GPT-4的重磅升级,这版本的大模型具备了图像输入的能力,能够理解梗图、解答物理问题,甚至能够阅读论文,仍记得这一消息当时震惊了许多人。然而,OpenAI表示图像输入功能仍处于研究预览阶段,尚未向公众开放。然而,最近Reddit上的一位网友却发现他的Bing Chat账号悄悄增加了一个上传图片的入口,并且Bing Chat竟然可以通过识图回答问题。
此前,微软透**ing Chat使用的正是GPT-4模型,并在上个月的更新日志中提到将为Bing加入多模态支持。综合这些信息来看,Bing Chat很可能正在逐步开发并向用户开放识图功能的测试。
该网友进行了大量的测试,让我们一起来看看这个被称为「长了眼睛」的Bing Chat有多厉害吧。
网友将这张梗图上传到Bing Chat进行测试,Bing Chat并没有认出这是VGA接口,因此也无法理解其中的笑点。但是,Bing Chat还是可以将照片解读出来,甚至提供线缆的品牌和更详细的资料。这可能是Bing Chat的一个偶然误差,或者是微软在实际应用GPT-4时进行了更多限制和调整,导致回答的偏差。
网友还上传了一张关于机器学习的梗图漫画,这次Bing Chat能够准确地回答出图片中的内容和笑点。
同样,Bing Chat对一张关于在汽车上烫衣服的梗图的分析也非常到位。
Bing Chat的识图精度似乎相当高,网友还上传了一张《任天堂大乱斗》游戏的角色图,要求Bing Chat识别其中的所有角色。结果显示,Bing Chat在12个角色中认出了7个,这说明对于二次元的问题,它还存在一定的困难。
OpenAI在发布GPT-4时还展示了通过手绘图编程网页的案例,这位网友也手画了一张图来测试Bing Chat。虽然代码的部分被省略了,但可以看出基础的网页雏形已经搭建完成。
识图功能的加入为Bing Chat增添了许多实用的用途。毕竟,有些现实世界中的内容(如公式、图表)很难用文字来清晰表达,这时候通过一张图向AI提问就能得到答案。
加入视觉识别后,Bing Chat甚至可以充当初中、高中甚至大学老师的角色,帮助学生解答复杂的数理化问题。如果将识图功能推广开来,或许能在一定程度上解决教育资源不均衡的问题。
用户还可以利用Bing Chat进行基础的医疗诊断,节约就医所需的金钱和时间,充分展现了AI对大众的普惠价值。
然而,尽管Bing Chat能够基本理解现实世界的内容,但它的回答终究只能作为参考,不能被当作专业意见。因此,要完全向公众开放识图功能,微软仍需要进行大量的限制和调试,以确保公众不会因为错误的AI回答而导致安全问题的发生。
-
微软New Bing聊天机器人灰度测试多模态能力:开放“AI识图”入口
Reddit上的网友发现Bing Chat新增了上传图片的功能,并且能够通过识图回答问题。尽管识图功能还处于测试阶段,但这一功能有望为用户提供更多多模态的支持,展示了GPT-4相较于GPT-3 5的巨大升级。
2025-04-19 12:33:18 -
提高AI产出质量,OpenAI 发布新的 AI 模型训练方法以解决“AI 幻觉”难题
OpenAI 宣布计划采取一种新的 AI 模型训练方法,称为“过程监督”,旨在解决“AI 幻觉”问题。该方法将奖励模型在推理过程中做出的每个正确步骤,以提高其输出的可解释性。然而,一些专家对此表示怀疑,认为该方法还需要进一步的验证和评估。
2025-04-19 12:08:25 -
GitHub调查显示:受访者表示人工智能工具对开发者工作有极大帮助
最近,代码托管平台GitHub对美国拥有1000名以上员工的企业进行了一项调查,旨在了解人工智能对开发者工作的影响。调查结果显示,使用人工智能工具的开发者们普遍认为其对工作效率的提升起到了积极的作用。
2025-04-19 11:44:56 -
DeepSeek开源周启幕,Flash MLA解码内核引领AI效率革新
DeepSeek公司近期宣布了一项重大举措——“开源周”,旨在向全球开发者社区开放其技术研究成果。作为这一活动的开场,首个亮相的代码库是Flash MLA,一个专为Hopper GPU优化设计的解码内核。 Flash MLA详细介绍:http
2025-04-19 11:27:56 -
网易云音乐与微软小冰合作出道!快捷创作音乐
网易云音乐宣布与小冰公司达成战略合作,共同推出了音乐创作辅助工具网易云音乐·X Studio,并正式成立了虚拟歌手厂牌WOWAIDO!该合作将为音乐人及音乐爱好者提供便捷有效的音乐创作工具,并带来丰富的音乐消费体验。
2025-04-19 11:14:59 -
中信出版:公司AIGC数智出版平台辅助图书出版流程关键环节,提升出版效率、优化精准营销
中信出版:公司AIGC数智出版平台辅助图书出版流程关键环节,提升出版效率、优化精准营销 证券之星消息,中信出版(300788)02月26日在投资者关系平台上答复投资者关心的问题。 投资者:想咨询一下公司是否有开展
2025-04-19 11:07:01
-
Music To Image音生图工具是什么_AI音频生成图像工具有哪些_AI音生图工具有哪些_Music To Image怎么用
「Music To Image」是一款AI音频生成图片的多模态转换工具,它的本质生成逻辑是音频→文本提示词→图像。
2024-12-17 00:06:33 -
阿里旗下夸克APP上线“AI学习助手”:内置海量试题,拍照一键解疑,巧用大模型帮助当代学子高效备考、快速进阶
夸克“AI学习助手”采用夸克宝宝的虚拟形象为用户进行题目讲解。基于大语言模型和视觉技术,AI智能讲解能够给用户提供 “考点分析”、“详解步骤”、“答案总结”等详细内容。
2025-02-18 16:08:16 -
阿里寻光_寻光视频创作平台_寻光视频创作官方网站
AIGC时代,视频创作这事儿真的不一样了。就像这样,轻轻一圈,选定目标立刻变身单独图层,再丝滑嵌入不同的背景视频,场景变换so easy~
2025-01-16 11:04:19 -
AI动漫视频生成_yoyo官方网站_yoyo功能及介绍
视频生成赛道又起新秀,而且还是二次元定制版!稳定产出电影级画面,一键文 图生成视频,即使是「手残党」也能复刻自己喜欢的动漫作品了。
2025-01-16 11:53:08 -
有手就行:Stability AI推出简笔画生成图片工具Stable Doodle
近日,图像生成模型 Stable Diffusion 背后的初创公司 Stability AI 推出了一项新的服务,可以将简笔画转换为图像。这项服务名为 Stable Doodle,利用最新的 Stable Diffusion 模型分析简笔画的轮廓,让每个人都能得到堪称艺术的作品。
2025-04-10 13:09:46 -
应用商店下载排行第一,“Meta版推特”Threads注册用户超5000万
新上线社交应用Threads已注册激活用户超过5000万,该数字仍在持续增长。当前在英国和美国苹果应用商店免费应用中的下载量排名第一。
2025-04-14 13:36:13 -
AI绘画ComfyUI进阶教程丨插件IPAdapter的详细使用教程,风格模仿,换脸全靠它
哈咯大家好,本期正式给大家带来进阶部分的插件讲解教程,虽然很多朋友一直在用IPA但可能很多朋友还不太了解其结构,希望这期关于ipa用法的教程能对大家有所帮助吧!
2024-12-17 22:49:30 -
跟人类学孬了!联合国:AI大模型的回复存在严重的性别偏见、种族偏见与刻板印象等问题
报告指出,女性在大模型的描述中,从事“家务劳动”的频率是男性的4倍,而男性名字则与“商业”、“管理层”、“薪水”和“职业”等词汇联系在一起。
2025-02-08 12:52:22 -
?新年新气象!小红书推出AI人物头像绘图模型「InstantID」:轻松打造龙年新春头像,一键免费焕新
近日,小红书团队推出了一款AI头像生成工具「InstantID」,直接刷屏了。使用门槛较低。只需要用户提供一张自拍照就可以轻松生成一大波风格迥异的照片。
2025-02-13 14:27:20 -
阿里云通义千问上线AIGC春节新玩法:AI帮你免费拍摄全家福,AI舞蹈视频生成器“全民舞王”新增春晚舞蹈
春节将至年味渐浓,阿里云通义千问APP上线多项免费新应用,涵盖全家福、拜新年、万物成龙等图像生成的新玩法。
2025-02-13 15:39:26