谷歌PaLM 2大语言模型参数量曝光:对比第一代大幅减少,但训练量翻五倍
AI奇点网6月5日报道丨5月初,谷歌在山景城总部举行了一年一度的I/O 2023开发者大会,会上发布了新一代的大语言模型PaLM 2版本。谷歌 CEO 皮查伊表示,新一代的大语言模型,改进了数学、代码、推理、多语言翻译和自然语言生成能力。谷歌对外宣称,大语言模型的训练量是关键,参数量并不是最核心的,此言论被认为是反击OpenAI关于“模型性能的与规模成比例的规律仍然成立”的说法。
近日,谷歌内部文件被泄露了,大量谷歌新一代大模型 PaLM 2 的训练细节被曝光,其中训练数据量是前代的近 5 倍、参数量仅为第一代的 2/3 左右。谷歌官方表示,大语言模型的表现重点在于训练方式,而不是参数量。不过在发布会上,谷歌并没有给出 PaLM 2 的具体技术细节。其实这样做的不只谷歌一家,OpenAI 也缄口不言其最新多模态大模型 GPT-4 的细节。
PaLM 2 模型特点是提供了完全不同规模的4种版本,这将有助于大模型在更轻巧的终端上落地训练。从小到大依次为 Gecko(壁虎)、Otter(水獭)、Bison(野牛)和Unicorn(独角兽),易于针对各种使用场景进行部署。其中最为轻量级的 Gecko 模型可以在移动设备,比如手机上运行,速度非常快,不联网也能在设备上运行出色的交互式应用程序。
昨日,CNBC 发表报道称,根据他们查阅到的内部文件显示,PaLM 2 经过了 3.6 万亿个 tokens 训练。作为对比,上一代也就是第一代 PaLM 只接受了 7800 亿 token 的训练,总体数量级提高了 5 倍之多。
此外,谷歌还表示,PaLM 2 大模型远比目前主流,也是ChatGPT采取的 LLM 规模更小,这意味着在完成更复杂任务的同时变得更高效。这一点也在内部文件中得到了验证,PaLM 2 的训练参数量仅为 3400 亿,远低于 PaLM 的 5400 亿。按照谷歌的观点,PaLM 2的训练参数量显得更高效也更精准。而且除了Token数量的激增,PaLM2在语料库数据的质量选择上也有很大的提升。
作为对比,OpenAI曾经公开ChatGPT的GPT-3的参数量为1750亿,训练量为3000 亿 token;Facebook母公司Meta 在 2 月发布的 LLaMA 大语言模型则接受了 1.4 万亿 token 的训练。
谷歌发布的 PaLM 2 后,把主要的展示重心放在了应用落地层面,渴望展示其 AI 技术的强大能力以及如何嵌入到谷歌搜索、电子邮件、文件处理和电子表格中。但是不让忽视的是,AI的训练量与参数量依然是目前大语言模型表现至关重要的一个核心因素,考虑到商业竞争的考量,不对外公布也是情由所原。
有研究专家表达这样一种观点:虽然表面看起来 OpenAI 和谷歌在大语言模型上你追我赶,但真正的赢家未必会从这两家中产生,因为第三方力量——「开源」大模型正在悄然崛起,AI 大模型的训练量将会得到更多开发者的共同努力。此外,中国的国产大模型也在迅速的加大投资。
PaLM 2 参数被泄密,就可以倒着推敲 Bard 的能力边界——一名网友表示。
而事实上,谷歌Bard 目前也拥有多项 ChatGPT不具备的能力,比如更优质的联网搜索能力,支持图片上直接调用Bard进行内容检索以及分享Bard生成内容的能力,而ChatGPT在经过最近一次微软能力加持后,加入了Bing搜索的能力,上周才加入了分享按钮;Bard可以通过Adobe FireFly获得图像生成的能力;免费的语音输入能力,目前ChatGPT需要付费插件支持;更广泛的编码语言支持,包括 C++、Python、Java、TypeScript、JavaScript等,它可以辅助开发者进行代码生成、解释和调试;整合谷歌的各项服务,比如Gmail,这也是微软所不能企及的应用落地。
总之,一场持久而轰烈的AI大模型内卷大战已经打响,最终会鹿死谁手呢?
-
谷歌PaLM 2大语言模型参数量曝光:对比第一代大幅减少,但训练量翻五倍
近日,谷歌内部文件泄漏大量PaLM 2的训练细节被曝光,其中训练数据量是前代的近5倍、参数量仅为第一代2 3左右。
2025-04-25 13:32:47 -
AI诈骗的门槛究竟有多低:几张受害者相关截图+免费开源的算法
近期,“AI诈骗正在全国爆发”的话题多次冲上微博热搜。就在上个月,合肥一企业的老板郭先生被“好友”视频差点骗走430万元。
2025-04-25 13:12:45 -
索尼CEO:未来将把AI应用在PlayStation的云游戏业务
近日,索尼集团CEO吉田健一郎也对PlayStation的云游戏计划发表了评论,并表示有意让人工智能在新兴领域中发挥更重要的作用。
2025-04-25 12:51:02 -
OpenAI官网单月访问量飙升至18亿:上榜全球访问量最高的网站TOP20
OpenAI的网站在3月份的访问量激增了54%以上,总共有8 47亿用户访问了该网站,这使得OpenAI成为全球20家流量最高网站之一。
2025-04-25 12:30:01 -
动视暴雪自研AI绘图工具Blizzard Diffusion:帮助员工快速生成游戏美术概念图
暴雪Blizzard Diffusion的推出,将为暴雪游戏的美术设计带来更多的可能性和创新。通过使用人工智能技术,开发人员可以更快速地生成游戏美术概念图,从而更好地展现游戏的世界观和故事情节。
2025-04-25 12:02:04 -
一款角色扮演AI工具上架引爆国外:下载量是ChatGPT iOS客户端的三倍
一款名为Character AI的角色演绎生成式AI在5月份突然横空出世,并发布了一经推出,瞬间风靡,仅一周的时间里下载量已超过170万,是ChatGPT的3倍。
2025-04-25 11:38:49
-
AI绘画ComfyUI进阶教程丨如何实现Clip精准控图,流程自动化入门!
大家好,又到学习时刻? 本期跟大家分享CLIP构图相关的一些进阶基础内容,以及自动化逻辑编程基础,希望能对大家有所启发,最后不要忘记支持欧阳一波啦?!
2024-12-17 13:16:14 -
大语言模型「新王」Claude 3全面测评:原生多模态大模型各项能力实力超群,连打麻将都学会,实测比GPT-4好用
OpenAI「不可战胜」的神话,看样子是要被打破了。Claude 3的多版本发布后,“中杯”Sonnet直接免费体验,“大杯”Opus充个会员也能即刻享受,各路测评纷至沓来。
2024-12-13 18:57:45 -
有手就行:Stability AI推出简笔画生成图片工具Stable Doodle
近日,图像生成模型 Stable Diffusion 背后的初创公司 Stability AI 推出了一项新的服务,可以将简笔画转换为图像。这项服务名为 Stable Doodle,利用最新的 Stable Diffusion 模型分析简笔画的轮廓,让每个人都能得到堪称艺术的作品。
2025-04-10 13:09:46 -
阿里云通义千问上线AIGC春节新玩法:AI帮你免费拍摄全家福,AI舞蹈视频生成器“全民舞王”新增春晚舞蹈
春节将至年味渐浓,阿里云通义千问APP上线多项免费新应用,涵盖全家福、拜新年、万物成龙等图像生成的新玩法。
2025-02-13 15:39:26 -
阿里旗下夸克APP上线“AI学习助手”:内置海量试题,拍照一键解疑,巧用大模型帮助当代学子高效备考、快速进阶
夸克“AI学习助手”采用夸克宝宝的虚拟形象为用户进行题目讲解。基于大语言模型和视觉技术,AI智能讲解能够给用户提供 “考点分析”、“详解步骤”、“答案总结”等详细内容。
2025-02-18 16:08:16 -
应用商店下载排行第一,“Meta版推特”Threads注册用户超5000万
新上线社交应用Threads已注册激活用户超过5000万,该数字仍在持续增长。当前在英国和美国苹果应用商店免费应用中的下载量排名第一。
2025-04-14 13:36:13 -
AI写真生成器妙鸭相机免费体验版实测_仅需8张自拍
在小红书、朋友圈刷屏的“妙鸭相机”,还记得吗?9月20日,这家AI快消应用公司宣布“妙鸭相机”免费体验版本正式上线啦!本次更新的“妙鸭相机”APP,专业版要求上传的图片数量也从20张下调到15张了哟
2024-12-16 09:21:10 -
网易出品的免费AI在线绘画工具:AI绘画工坊,安利给大家
网易出品推出的云端Stable Diffusion简直太好用了,集成了多种模型任你选,想生成什么类型的图像都超级容易。
2024-12-16 09:26:04 -
AI绘画ComfyUI进阶教程丨插件IPAdapter的详细使用教程,风格模仿,换脸全靠它
哈咯大家好,本期正式给大家带来进阶部分的插件讲解教程,虽然很多朋友一直在用IPA但可能很多朋友还不太了解其结构,希望这期关于ipa用法的教程能对大家有所帮助吧!
2024-12-17 22:49:30 -
抖音开启AI搜索功能灰度测试丨OpenAI CEO奥特曼:2024年无法实现AGI丨夸克APP上线“健康大模型”
【AI奇点网2023年12月26日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。
2025-02-21 17:23:50