谷歌惨变汪峰!I/O开发者大会掏空家底:14款AI新品震撼大井喷,且惨遭Ilya离职逆转新闻头条
从今天起,请叫OpenAI CEO奥特曼「营销大神」!
2024年,奥特曼“重伤”谷歌两次……
第一次是今年春节,谷歌这头官宣Gemini 1.5 Pro,那头奥特曼就放出了Sora,震惊全网!
第二次正是今天,预期到谷歌举办一年一度的I/O开发者大会,OpenAI昨天抢先一步推出GPT-4o多模态大模型,让谷歌人彻底坐不住了。
昨夜大爆发,谷歌I/O大会一口气足足推出了14款产品线的上新or更新。我们替大家整理了一图读懂:
这真的称得上是“狂轰滥炸”,谷歌依托自身的海量产品线,几乎拿出了看家的本事。
下边挑几个亮点新品给大伙细说一下——
追赶Sora、长文本、多模态助理一个不能少
首先是备受瞩目的多模态视觉AI助理:Project Astra。不得不吐槽,谷歌每次起的名字都那么难念…
与OpenAI的GPT-4o类似,Astra同样能听??会看?还会表达?。因为与GPT-4o的能力过于相似,因此新鲜感大打折扣。
谷歌展示了一个一镜到底的视频案例演示,通过摄像头,AI助理Astra可以轻松表达自己“看”到的一切,并且还能为用户解决疑问,甚至直接从电脑屏幕上读取代码片段:
据了解,Project Astra这个项目基于Gemini大模型开发。
谷歌希望能够开发一款AI助理软件,能真正帮助人们在日常生活中解决各种问题。
似乎觉得发布会上展示的案例还不够丰富,在会后,谷歌DeepMind CEO还在个人社交账号上传了一段短视频,展示多模态认知能力。
未来,人手一个AI助理不再是幻想。
遇到不懂的问题,打开手机的相机,直接将书面的问题照给AI助理看,答案信手拈来~!
单身狗们还有隐藏版福利!
只见DeepMind的员工干脆和AI助理一起同步收看谷歌I/O大会。
设想一下,将来单身狗们人手一个“虚拟女友”,啧啧啧?
不少网友认为,这是谷歌对OpenAI的GPT-4o最直接的正面回应。
客观说,今天的开发者大会,谷歌的确是做了充足的准备。
谷歌CEO甚至直接贴出全场发布活动一共提及121次「AI」,就可见这家科技大厂提前彩排了多少遍。
接下来,我们看谷歌出品的原生AI视频大模型「Veo」。
为了报春节被Sora阻击之“仇”,「虽迟但到」的谷歌也释出了一款AI视频生成大模型,直接对标OpenAI,生成的时长还更长,超过了一分钟。
支持生成长度超过1分钟、分辨率1080P的高质量视频,并且支持多种视觉和电影风格,可以理解诸如“延时拍摄”和“航拍视角”这种专业的摄像术语。
谷歌对外展示了不少的「Veo」生成视频的案例,其中最具代表性的当属下面这辆赛车在城市霓虹夜景中狂飙的视频,长度为1分23秒,作为视频主体的赛车?整体一致性表现较好。
从现阶段谷歌与OpenAI对标来看,两家的文生视频模型基本在一个水平线上,接下来就PK看谁能更快地将大模型应用于商业化。
接下来,谷歌宣布将春节发布的Gemini 1.5 Pro再次升级。
最核心的变化是,上下文窗口吞吐从100万提高到了200万,一口气能读1500页PDF。这么看起来,现在「长文本」的卖点已经没有护城河了。
但,一下放出这么多的震撼弹,就一点槽点没有吗?
有网友们也关注到了某些细节问题。比如,名为Project Astra的AI助理,延迟似乎明显比GPT-4o更长,在演示中也没有体现能打断AI助理说话的能力。
此外,Project Astra这个名字就包含了两层含义:
只是实验性项目上线要鸽到下半年了Anyway,我们看到了谷歌在追赶OpenAI做出的努力。据我了解,谷歌的员工为了能够在最短时间内赶上竞争对手,那些已经习惯了摸鱼的老部门都开始加班了。
言归正传,与此同时,谷歌的文生图模型也迎来了更新:Imagen 3发布。
作为迭代版本,与上一代Imagen 2相比,Imagen 3的视觉伪影更少,生成的图像细节拉满,并且可以更准确地在画面中生成英文单词。
比如这张图:一张庄严的图书馆入口的照片,刻有「中央图书馆」(Central Library)字样。
谷歌重塑旗下产品,AI搜索自我革命
在本场I/O开发者大会上,我们欣喜地看到,谷歌要用AI重塑产品线的决心。
作为一家「披着科技外衣的广告公司」,谷歌终于下定决心要打破搜索业务的内核。
基于Gemini,谷歌搜索首度推出了AI概述(AI Overview)新功能,在传统搜索排名之上,将AI搜索与回复放在了更高的层级上。
用户在搜索框输入问题,马上就能得到AI生成的简洁答案,以及回复引用的具体文章链接。?
而且是任何复杂超长问题都能一键处理的那种,比如:
请查找波士顿辖区内最好的瑜伽或普拉提工作室,并提供他们的入门优惠详情以及从灯塔山出发步行所需的时间。
AI概述(AI Overview)在几秒钟内就帮你标记好了所有的最优选择,以后出门还需要提前查阅什么小红书吗?
对于这种复杂问题的搜索,谷歌表示采用了多步推理技术,可以将复杂问题拆解成一个个小问题,然后自动对问题进行排序回答。
尽管很多早期搜索引擎的开发者批评称,AI搜索将会破坏原有的搜索引擎排名商业体系。
——也就是竞价排名。
但是我想说,一个老的商业模式萎缩,也会带来新形态的商业机遇。
比如,可以往「AI内容电商」方向发力。我们使用谷歌AI概述(AI Overview)制定一个为期三天且易于执行的餐饮计划。
AI一键给出了方案,每个方案都可以点击修改,下方还可以一键将食材加入购物车,完整的商业链路闭环。
这还不是全部,AI概述(AI Overview)可以轻而易举地领悟用户比较笼统的需求,比如提问:在达拉斯找一个餐厅庆祝周年纪念日。
AI搜索给出的结果涵盖音乐餐厅、电影院、酒店、购物广场推荐等等不同的场所分类,在一页内完整呈现多样化的个性推荐。
最后,谷歌也秀了一下AI视频实时搜索能力。
在现场演示中,用户对着手机讲“为什么唱片机无法播放”,只需一边拍摄指定的对象,一边提出问题,AI概述(AI Overview)就可以马上给出分析结论并给出处置建议。
最后,谷歌AI概述(AI Overview)服务目前仅在美国地区IP上线,后续开放给其他国家与地区,相信大家知道怎么操作。
谷歌惨变汪峰,头条惨遭Ilay截胡
今天一早,当地时间5月14日下午,「OpenAI宫斗」之后久未露脸的OpenAI首席科学家Ilya Sutskever突然现身!
这一露脸,就是大新闻——他从OpenAI请辞了。
Ilya被认为是CEO奥特曼被董事会罢免一案当中的关键性人物(罢免提案的致命一票)。
Ilya与奥特曼一同官宣他的离开,并且表示已经有了下一个人生大计,但目前还不能透露细节。
这则消息,简直是对谷歌的头号暴击!!BOOM!
自从去年的高层内斗风波后,这是OpenAI的高层首次同框。
但没想到,再一次合影便是Ilay的“毕业照”。
对于这件大事,CEO奥特曼转发了IlaySutskever的推文,表示“感到非常难过”。
网友评价?「我真的哭死」。只能说,Ilya真的太爱这家公司了。作为联合创始人的他,也给OpenAI送出了最后一波助攻与流量——
就在OpenAI刚刚发布的旗舰模型GPT-4o的官方介绍页上,IlyaSutskever的名字被写入了「其他贡献者」一栏。
这可能是他为这个团队做出的最后一项技术贡献了。
此外,他本人宣布离开OpenAI的时机也非常讲究,刚好就在谷歌开完I/O大会,媒体还没有来得及发稿之际,就把全世界的目光再次集中到OpenAI这边。
这真的不是跟奥特曼商量好的??
看到这则突发消息,关注AI圈的朋友们似乎松了口气:“很高兴看到Ilya还活着”。?
-
谷歌惨变汪峰!I/O开发者大会掏空家底:14款AI新品震撼大井喷,且惨遭Ilya离职逆转新闻头条
昨夜大爆发,谷歌I O大会一口气足足推出了14款产品线的上新or更新。这真的称得上是“狂轰滥炸”,谷歌依托自身的海量产品线,几乎拿出了看家的本事。
2025-01-26 16:28:57 -
字节跳动发布豆包大模型,火山引擎推出全栈AI服务,发布一系列ToB企业AI应用
5月15日,2024春季火山引擎 FORCE 原动力大会在北京正式举办。会上正式发布了字节跳动豆包大模型家族、火山方舟2 0、AI 应用及 AI 云基础设施等最新产品。
2025-01-26 16:00:15 -
Ilya Sutskever从OpenAI离职,接班人简介:职业生涯下一站秘而不宣,自称「意义重大」
5月15日早上,,久未露面的Ilya Sutskever突然发声——官宣离开OpenAI,已经有了下一个计划,但目前还不能透露细节。
2025-01-26 15:32:09 -
谷歌发布「Project Astra」正面硬刚GPT-4o!超60秒AI视频丝滑生成,还把上下文窗口卷到了200万Tokens
当地时间5月14日,谷歌DeepMind CEO哈萨比斯亲自携谷歌版的《Her》多模态大模型「Project Astra」登场:能听会看能说道。
2025-01-26 15:07:25 -
2024谷歌I/O开发者大会回顾:疯狂2小时新品放送,从大模型到软件应用到算力TPU,正面硬刚GPT-4o与Sora
谷歌I O 2024如期来了,眼花缭乱地发布了一堆更新。面对一天前的OpenAI挑衅,谷歌甩出Project Astra,视觉识别和语音交互效果,跟GPT-4o不相上下。
2025-01-26 14:46:32 -
详解腾讯混元文生图大模型开源大模型:国内首个中文原生的DiT架构图像生成模型
首个中文原生DiT架构!腾讯混元文生图大模型免费商用,据了解,这是业内首个中文原生的 DiT 架构文生图开源模型,支持中英文双语输入及理解。
2025-01-26 14:20:32
-
AI绘画comfyUI教程_图生图工作流程
本期的视频教程是关于在ComfyUI中搭建完整的图生图工作流的。视频中介绍了如何使用ComfyUI中的组件来实现图像的裁剪和重绘。
2024-12-18 13:42:28 -
怎么快速给模特换装_怎么用stable diffusion给模特换装
本篇教程主要运用StableDiffusion这个工具来进行操作,下面会通过几个小案例,给大家展示不同需求下,我们该如何使用StableDiffusion来辅助我们完成服装效果展示。本教程适用于电商设计场景、摄影场景等多个运用人物设计的实战中
2024-12-23 13:57:15 -
万万没想到,兵马俑都开始跳「科目三」:阿里云通义千问APP打造“全民舞王”视频创作工具,实测效果大赞
兵马俑跳《科目三》,是我万万没想到的。有人借助了阿里云之前走红的AI视频生成技术——「Animate Anyone」,生成出来了这个舞蹈片段。
2024-12-13 16:46:26 -
AIGC落地实践!四招帮你快速搞定运营设计
回顾这一年,随着 AIGC 浪潮的爆发,在掌握AI工具已经成为设计师必备技能。今天这篇文章,通过三个案例流程拆解带大家从新时代设计工作流,到必备「四大招式」,到图标设计六大方向,到训练专属模型,再到全流程手把手拆解设计项目,绝对干货满满
2024-12-18 16:57:17 -
stable diffusion初识_stable diffusion跟其他工具有什么区别]
关于Stable Diffusion的内容很多,在本篇教程里,我会先为你介绍Stable Diffusion模型的运行原理、发展历程和相较于其他AI绘图应用的区别。
2024-12-24 13:45:31 -
PikaAI怎么用_PIkaAI怎样生成视频_AI视频生成器Pika怎么用_AI视频生成工具Pika教程
Pika这款工具7月份在AIGC界横空出世,被圈内誉为目前“全球最好的文本生成视频AI工具”之一,也被认为是另外一款知名AI视频生成工具Runway的强有力挑战者。
2024-12-25 13:35:53 -
如何使用 ChatGPT 调试代码
当您的代码出现问题时,您可以向 ChatGPT 提供故障代码和问题描述。AI 工具将尝试识别并纠正问题。
2024-12-31 12:01:41 -
stable SR脚本安装_stable diffusion脚本网站
上节课我们讲的4xUltraSharp是不是觉得已经很强了! 那么如果我拿出Stable SR脚本你应该如何应对呢?
2024-12-31 13:49:18 -
怎么设置关键词权重_怎么设置Multi Prompts
AI 绘画,顾名思义就是利用人工智能进行绘画,是人工智能生成内容(AIGC)的一个应用场景。其主要原理简单来说就是收集大量已有作品数据,通过算法对它们进行解析,最后再生成新作品,Midjourney是一个由同名研究实验室开发的人工智能程序。
2025-01-03 10:00:57 -
零基础2天速成!白嫖「秋叶」官方AI绘画课程,卷死同事
和「秋叶」一起学AI绘画,掌握Stable Diffusion、Midjourney的使用方法,开展AI绘画副业,搞钱!?
2024-12-17 12:53:01