谷歌发布多模态互动服务Gemini Live丨AI手机谷歌Pixel 9系列发布丨快手上线AI陪伴APP「飞船」
AI奇点网2024年8月14日报道丨AI资讯早报
谷歌发布多模态互动服务Gemini Live:可实时AI对话,随时打断
当地时间 8月 13 日,谷歌在山景城总部举行了今年的 Pixel 9 系列手机新品发布会。发布了 Gemini Live 实时对话服务,将于今天开始率先面向使用英语语言版本的 Gemini Advanced 订阅用户开放。
谷歌表示 Gemini Live 提供了一种随时随地的移动对话体验,让用户可以通过手机上的 Gemini AI 应用展开自由流畅的对话。通过 Gemini Live(内置在 Gemini 应用内),用户可以与 Gemini AI 进行直接的自然语言对话,并从10种自由选择的“自然声音”中选择它可以回应的声音。
Gemini Live 是对标 OpenAI ChatGPT 最新上线的 Advanced Voice 模式。后者也采用了增强型的语音引擎,可以展开更连贯、更有情感表达力、更逼真的多轮对话。
谷歌表示,用户与 Gemini 聊天机器人说话时,可以在任何时候打断它发言,并提出后续的问题,聊天机器人会根据实时情况,来适应用户的说话模式。
目前的谷歌 Gemini Live 测试版本里边,暂时还不支持多模态多媒体上传信息提供分析能力。谷歌表示,多模态输入功能将在“今年晚些时候推出”,但拒绝透露更多的具体细节。
谷歌Pixel 9系列手机发布,开启AI手机新纪元
当地时间8月13日,谷歌方面正式发布了最新一代 Pixel 9 系列等多款新品。这是谷歌推出的第二代基于 AI 大模型基础开发的智能手机产品,作为一款“亲儿子”作品,谷歌往上倾注了最大的力量。
两款手机的定价展示如下:
Pixel 9: 799 美元Pixel 9 Pro:999 美元Pixel 9 Pro XL: 1099 美元Pixel 9 Pro Fold:1799 美元具体来说,Pixel 9/Pixel 9 Pro 系列配备了一块 6.3 英寸 120Hz OLED 直屏,搭载 Tensor G4 处理器,从光学指纹传感器变为超声波指纹传感器,电池容量为 4700mAh。 影像上 Pixel 9 后摄搭载 50MP 主摄与 48MP 超广角,Pixel 9 Pro 多一个 48MP 长焦镜头。
在 RAM 方面,两款机型有所不同。Pixel 9 配备 12GB 内存,Pixel 9 Pro 配备 16GB 内存。
Pixel 9 Pro XL 屏幕大小为 6.8 英寸,分辨率比 Pixel 9 Pro 更高,电池容量为 5060mAh,其他配置基本和 Pixel 9 Pro 相同。
Pixel 9 Pro Fold 同样搭载 Tensor G4 处理器,采用 48MP 主摄、12MP 超广角、10.8MP 5 倍长焦镜头。屏幕方面,Pixel 9 Pro Fold 外屏大小为 6.3 英寸 ,内屏大小为 8 英寸,总体设计上比前代产品更长更薄,折叠后厚度为 10.5 毫米,展开厚度 5.1 毫米,重量为 257 克。
Pixel 9 系列支持卫星通信,在生成式 AI 功能上,这两款手机支持在本地运行的端侧的 Gemini Nano 小尺寸模型,以及 Pixel Screenshots(屏幕回溯)、Pixel Studio 图像生成应用,Magic Editor 图片编辑等功能。值得一提的是,Google 在发布会上强调,Gemini AI 不需要依赖第三方 AI 服务,能够在端侧进行独立的查询。
快手上线「飞船」APP:基于大模型,主打虚拟陪伴
近日,快手公司在AI图文视频生成领域大展拳脚后,有最新发布了名为「飞船」(Kraft)的 AI 虚拟人物对话产品,这是一款类似于 Character.AI 的个性对话软件,提供一对一虚拟对话聊天的情感陪伴服务。
官方介绍称,「飞船」智能助手 App 是一款基于先进 AI 技术的互动软件,旨在提升用户的生活质量和工作效率。用户可以通过文字或语音与 AI 助手进行交流,解答疑问、获得娱乐、进行创作和角色定制等。
用户在飞船平台上扮演“船长”角色,名为快快的 AI 少女领航员引导用户体验,飞船基于快手自研大模型“快意”,更侧重于虚拟陪伴,拥有快速的回复速度和逼真的语音体验。
用户可以在该应用中创建和定制专属 AI 虚拟角色,进行内容创作、知识解答,并具备语音交互功能。
面壁智能小模型MiniCPM-V 2.6登顶GitHub开源大模型榜首
近日,国内 AI 初创企业面壁智能宣布,旗下的小参数大模型 MiniCPM-V 2.6 登顶了知名开源社区 GitHub 的第一位,并且在大模型生态社区 Hugging Face 趋势榜页进入了前三位。
MiniCPM-V 2.6 是一款多模态的开源大模型,不仅是一款性能十分不错的聊天机器人助理,而且在单图、多图和视频理解方面,MiniCPM-V 2.6 的部分性能甚至超越了 GPT-4V,甚至在单图理解上优于 GPT-4o mini、Gemini 1.5 Pro 和 Claude 3.5 Sonnet 等商用闭源模型。
据介绍,MiniCPM-V 2.6 仅 8B 参数,量化后端侧内存仅 6 GB,将实时视频理解、多图联合理解、多图 ICL 等能力搬上了端侧多模态模型,支持多种语言。
「AI数据荒」来临,麻省理工发现网页数据公开时代走向衰落
人工智能系统依靠充足、高质量的训练数据来获得高性能,但麻省理工学院(MIT)等研究机构最近的一项研究发现,曾经免费提供的数据在多个方面变得越来越难获取。
随着生成式 AI 产品的开发和研究变得越来越广泛,训练数据的抓取许可也越来越成为受关注的话题。
最近,华裔人工智能科学家吴恩达在网站 The Batch 上提及了一篇有关数据许可的研究,其结果似乎让本就迫近的「AI数据荒」雪上加霜。
研究人员发现,C4、RefineWeb、Dolma 等开源数据集所爬取的各种网站正在快速在收紧他们的许可协议,曾经触手可及的开放数据越来越难以获取。
这不仅会影响商用 AI 模型的训练,也会对学术界和非营利机构的研究造成阻碍。
不仅如此,AI科技公司与出版商之间的版权纠纷日益突出。比如,从去年12月开始,《纽约时报》就对OpenAI展开了一系列的版权诉讼,指控其未经许可使用该报的内容进行AI模型训练,索赔金额达到数十亿美元。
今年,谷歌与法国的新闻出版商的纠纷谷歌因未适当使用法国新闻内容进行AI训练,被罚款2.5亿欧元,并且尝试与法国新闻出版商方面进行重新谈判合作。该事件反映了AI公司在处理版权问题时面临的法律风险和复杂性。
诸如此类的事件,标志着出版商对于AI科技公司借助互联网手段快速收集数据用于训练大模型的时代行将落幕,来自攻防双方的对抗也愈演愈烈。
-
谷歌发布多模态互动服务Gemini Live丨AI手机谷歌Pixel 9系列发布丨快手上线AI陪伴APP「飞船」
【AI奇点网2024年8月14日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。
2025-01-13 09:51:35 -
30s生成视频,免费不限次数,中国版OpenAI今天发布的「智谱清影」被玩疯了丨 附体验指南
过去半年,国内外视频生成模型迎来了新一轮技术大爆发,也都总能在第一时间烧遍社交网络。与以往的「掉队」有所不同,近期趋势却显示国内在视频生成模型这一领域的进步大为超越了国际水平。不少国外网友表示,「中国的可灵 AI 视频」在引爆互联网,而 OpenAI 的 Sora 却在沉睡。今天,国内头部大模型厂商智谱 AI 也发布了旗下 AI 视频生成产品「清影」。
2025-01-13 09:26:51 -
xAI正式发布Grok 2大模型测试版丨OpenAI更新GPT-4o,多项跑分重夺第一丨昆仑万维发布AI音乐流媒体创作平台Melodio
【AI奇点网2024年8月15日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。
2025-01-10 17:56:29 -
马斯克旗下Grok-2可直接生成血腥恐怖图像丨百度文库「橙篇」APP上线丨苹果在生成式AI领域至少落后谷歌两三年
【AI奇点网2024年8月16日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。
2025-01-10 17:34:54 -
秘塔AI搜索收到中国知网侵权律师函丨OpenAI的SearchGPT搜索服务开启封测丨智元双足机器人发布5款新品
【AI奇点网2024年8月19日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。
2025-01-10 17:12:26 -
通义千问上线全新域名「tongyi.ai」丨昆仑万维推出AI短剧创作平台SkyReels丨科大讯飞推出星火大模型端到端语音交互
【AI奇点网2024年8月20日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。
2025-01-10 16:43:52
-
怎么设置关键词权重_怎么设置Multi Prompts
AI 绘画,顾名思义就是利用人工智能进行绘画,是人工智能生成内容(AIGC)的一个应用场景。其主要原理简单来说就是收集大量已有作品数据,通过算法对它们进行解析,最后再生成新作品,Midjourney是一个由同名研究实验室开发的人工智能程序。
2025-01-03 10:00:57 -
怎么快速给模特换装_怎么用stable diffusion给模特换装
本篇教程主要运用StableDiffusion这个工具来进行操作,下面会通过几个小案例,给大家展示不同需求下,我们该如何使用StableDiffusion来辅助我们完成服装效果展示。本教程适用于电商设计场景、摄影场景等多个运用人物设计的实战中
2024-12-23 13:57:15 -
万万没想到,兵马俑都开始跳「科目三」:阿里云通义千问APP打造“全民舞王”视频创作工具,实测效果大赞
兵马俑跳《科目三》,是我万万没想到的。有人借助了阿里云之前走红的AI视频生成技术——「Animate Anyone」,生成出来了这个舞蹈片段。
2024-12-13 16:46:26 -
AIGC落地实践!四招帮你快速搞定运营设计
回顾这一年,随着 AIGC 浪潮的爆发,在掌握AI工具已经成为设计师必备技能。今天这篇文章,通过三个案例流程拆解带大家从新时代设计工作流,到必备「四大招式」,到图标设计六大方向,到训练专属模型,再到全流程手把手拆解设计项目,绝对干货满满
2024-12-18 16:57:17 -
ChatGPT怎么本地登录_GPT怎么使用_GPT本地项目
本期就ChatGPT的这次更新再次将完全新人使用指南提上日程,并对此次更新做些设想和想象。希望大家喜欢!
2024-12-19 07:41:20 -
stable diffusion初识_stable diffusion跟其他工具有什么区别]
关于Stable Diffusion的内容很多,在本篇教程里,我会先为你介绍Stable Diffusion模型的运行原理、发展历程和相较于其他AI绘图应用的区别。
2024-12-24 13:45:31 -
PikaAI怎么用_PIkaAI怎样生成视频_AI视频生成器Pika怎么用_AI视频生成工具Pika教程
Pika这款工具7月份在AIGC界横空出世,被圈内誉为目前“全球最好的文本生成视频AI工具”之一,也被认为是另外一款知名AI视频生成工具Runway的强有力挑战者。
2024-12-25 13:35:53 -
如何使用 ChatGPT 调试代码
当您的代码出现问题时,您可以向 ChatGPT 提供故障代码和问题描述。AI 工具将尝试识别并纠正问题。
2024-12-31 12:01:41 -
stable SR脚本安装_stable diffusion脚本网站
上节课我们讲的4xUltraSharp是不是觉得已经很强了! 那么如果我拿出Stable SR脚本你应该如何应对呢?
2024-12-31 13:49:18 -
零基础2天速成!白嫖「秋叶」官方AI绘画课程,卷死同事
和「秋叶」一起学AI绘画,掌握Stable Diffusion、Midjourney的使用方法,开展AI绘画副业,搞钱!?
2024-12-17 12:53:01