马斯克旗下xAI开源Grok 1.0大模型丨苹果推出300亿参数多模态大模型丨苹果收购AI系统小型化研究公司
AI奇点网2024年3月18日报道丨AI资讯早报
马斯克旗下xAI开源Grok 1.0大模型
当地时间3月17日,马斯克信守诺言,赶在本周的最后时刻开源旗下大模型。马斯克的AI创企xAI正式发布备受期待大模型Grok-1。据专家分析,其参数量达到了3140亿,远超OpenAI前年发布的GPT-3.5的1750亿规模。
这是世界上迄今参数量最大的开源大语言模型,遵照Apache 2.0协议开放模型权重和架构。
Grok-1是一个混合专家(Mixture-of-Experts,MOE)大模型,这种MOE架构重点在于提高大模型的训练和推理效率,形象地理解,MOE就像把各个领域的“专家”集合到了一起,遇到任务派发给不同领域的专家,最后汇总结论,提升效率。决定每个专家做什么的是被称为“门控网络”的机制。
目前,xAI已经将Grok-1的权重和架构在GitHub上开源。
苹果推出300亿参数多模态大模型
刚刚宣布放弃造车项目的苹果公司,在当今的人工智能(AI)竞赛中落伍了。为了摆脱窘境,苹果近期放弃了造车项目,正在全面转向生成式AI领域,并且很快有了新动作,推出了一款被命名为「MM1」的多模态大模型。
MM1的独特之处在于其庞大的规模和架构创新,包括密集的模型和混合专家模型。研发团队称,MM1不仅在预训练指标中是“最先进的”,并且在一系列已建立的多模态基准测试中,经过微调后也保持了“有竞争力的”性能。
据了解,MM1最高参数量为300亿,支持增强的上下文学习和多图像推理,在多模态基准测试中表现较好。尽管MM1的整体性能还没有完全超过谷歌的Gemini和OpenAI的GPT-4,但它被认为是苹果在AI方面的一次重大飞跃。
苹果收购AI系统小型化研究公司
根据彭博社报道,苹果公司在今年年初收购了一家加拿大AI创企DarwinAI,这家创企的首席科学家连同数十名员工已经加入了苹果的AI部门。这也是苹果已知收购的第33家AI公司。截止2023年底,苹果总共收购了32家AI公司,是当今知名科技公司中收购人工智能研究机构数量最多的大厂。
DarwinAI开发的AI技术主要用于工业制造过程中的印刷电路板(PCB)视觉检测领域,他们的核心技术优势主要是把AI系统做的更小型化,同时兼顾较高的处理速度。
这其实刚好正中苹果下怀,彭博社报道认为,苹果一直致力于做的就是在终端设备商本地运行AI大模型,而不是放在云端,因此DarwinAI的技术优势对苹果来说,经过评估之后很可能会有所帮助。
GPT-3.5 Turbo参数规模被扒:大约只有70亿
据外媒报道,来自南加州大学的最新研究显示,他们使用一种反向的攻击方法,花费不到 1000 美元就把最新版 gpt-3.5-turbo 模型的大概模样给呈现出来。南加大团队三位作者破解出了未公布的 gpt-3.5-turbo 嵌入向量维度(embedding size)为 4096 或 4608,通过这个数据可以推算出 GPT-3.5 的大概参数规模。
根据目前已知的开源大模型,比如 Llama 和 Mistral,嵌入式向量维度在 4096 的时候,参数规模大约为 7B 参数规模。其它比例的话,就会造成网络过宽或过窄,已被证明对模型性能不利。
因此南加大团队指出,可以反向倒推 gpt-3.5-turbo 的参数规模也在 7B 左右,除非是专家模型 MoE 架构可能不同。
美图吴欣鸿:原本以为类似Sora的产品2-3年后才能实现
3月15日,美图公司披露2023年业绩报告,总收入27亿元,同比增长29.3%。经调整后归属于母公司权益持有人净利润3.7亿元,同比增长233.2%。美图CEO欣鸿在业绩会上表示,AI 原生工作流会是未来非常巨大的机会,美图会致力于 AI 原生应用的进一步打造。同时他还强调,美图不会做通用大模型,但美图会针对不同垂直场景的需求做模型的训练和微调。
吴欣鸿透露,Sora 给了行业较大的心理冲击,原本以为这样的能力会在 2-3 年后才能实现。Sora 也让美图反省了视觉大模型的底层架构,紧急升级了模型的底层框架,重新投入到图像和视频模型的训练。他认为,垂直场景支撑创新的 AI 原生应用还有约 2 年的窗口期。
-
马斯克旗下xAI开源Grok 1.0大模型丨苹果推出300亿参数多模态大模型丨苹果收购AI系统小型化研究公司
【AI奇点网2024年3月18日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。
2025-02-07 15:22:34 -
别等OpenAI了,全球首个类Sora抢先开源!所有训练细节/模型权重全公开,成本仅1万美元
OpenAI Sora还没用上,国产Sora刚刚正式宣布全面开源!「Open-Sora 1 0」所有的训练细节模型权重全面开源,1万美元64块GPU复现,训练成本直降46%。
2025-02-07 14:59:28 -
3140亿参数量,登顶「地表最强开源大模型」!马斯克旗下xAI正式开源Grok 1.0大模型
当地时间3月17日晚间,马斯克信守诺言,赶在本周的最后时刻开源旗下Grok 1 0模型。据专家分析,其参数量达到了3140亿,远超OpenAI的GPT-3 5大模型的1750亿规模。
2025-02-07 14:37:51 -
恐怖谷拉满!当人形机器人接入OpenAI大模型GPT-4,说话的样子实在太吓人了
还记得被称为最像人类的英国人形机器人Ameca吗?Ameca说话的能力通过接入大语言模型GPT-4来实现的,所以交流起来和ChatGPT APP的语音互动体验非常接近。
2025-02-07 14:14:24 -
小米公司开启小爱AI大模型多模态能力内测:支持图片内容问答、AI扩图、消除路人,适配小米14、Redmi K70等
3月15日,小米官方宣布小米社区开启新一轮的小爱AI大模型内测。现已开启“小爱同学多模态功能内测”。
2025-02-07 13:53:52 -
苹果首个多模态大模型MM1曝光:论文上线,300亿参数规模、支持图像内容解读、MoE架构
刚刚宣布放弃造车项目的苹果公司,在当今的人工智能(AI)竞赛中落伍了。为了摆脱窘境,苹果很快有了新动作,推出了一款被命名为「MM1」的多模态大模型。
2025-02-07 13:33:49
-
怎么快速给模特换装_怎么用stable diffusion给模特换装
本篇教程主要运用StableDiffusion这个工具来进行操作,下面会通过几个小案例,给大家展示不同需求下,我们该如何使用StableDiffusion来辅助我们完成服装效果展示。本教程适用于电商设计场景、摄影场景等多个运用人物设计的实战中
2024-12-23 13:57:15 -
万万没想到,兵马俑都开始跳「科目三」:阿里云通义千问APP打造“全民舞王”视频创作工具,实测效果大赞
兵马俑跳《科目三》,是我万万没想到的。有人借助了阿里云之前走红的AI视频生成技术——「Animate Anyone」,生成出来了这个舞蹈片段。
2024-12-13 16:46:26 -
stable diffusion初识_stable diffusion跟其他工具有什么区别]
关于Stable Diffusion的内容很多,在本篇教程里,我会先为你介绍Stable Diffusion模型的运行原理、发展历程和相较于其他AI绘图应用的区别。
2024-12-24 13:45:31 -
如何使用 ChatGPT 调试代码
当您的代码出现问题时,您可以向 ChatGPT 提供故障代码和问题描述。AI 工具将尝试识别并纠正问题。
2024-12-31 12:01:41 -
怎么设置关键词权重_怎么设置Multi Prompts
AI 绘画,顾名思义就是利用人工智能进行绘画,是人工智能生成内容(AIGC)的一个应用场景。其主要原理简单来说就是收集大量已有作品数据,通过算法对它们进行解析,最后再生成新作品,Midjourney是一个由同名研究实验室开发的人工智能程序。
2025-01-03 10:00:57 -
零基础2天速成!白嫖「秋叶」官方AI绘画课程,卷死同事
和「秋叶」一起学AI绘画,掌握Stable Diffusion、Midjourney的使用方法,开展AI绘画副业,搞钱!?
2024-12-17 12:53:01 -
思维脑图工具也能创作AI绘画作品,如何使用博思白板进行AI绘画
博思白板boardmix的创作平台提供多种登录方式,最方便要属直接微信扫码登录,然后绑定手机号实名制。再点击页面正中央紫色的按钮「免费使用」,你就可以进入博思白板boardmix的内容创作操作台。
2024-12-26 09:08:34 -
pika1.0首测超越gen-2_pika最新发布_pika文生图怎么用
Pika 1 0正式上线后,拿到内测资格的网友们已经玩疯了!有人用它生成了一个姜黄色头发女孩和她的姜黄色猫的短片。以往,因为一致性的难题,用AI视频很难做出优秀的动漫作品。但是Pika 1 0 实在是太给人惊喜了!
2024-12-13 17:39:08 -
AI绘图模型测评_Meta Imagine发布_Meta Imagine最新地址
针对Meta Imagine,Midjourney,Adobe Firefly,Dalle,这四个我心目中的比较大的AI绘图模型测评。我会从细节质量、审美(构图色彩等)、风格多样化、语义理解这四个维度来评测,每个维度3个Prompt,同时每个Prompt我会在AI绘图模型中roll3次,取效果最具有代表性的那个图,尽量减少偏见。
2024-12-13 17:44:01 -
Midjourney角色一致性命令 "cref "测评丨如何保持多个角色一致性
预告了好久的MJ角色一致性功能终于来了, 新的命令“ --cref ”与 样式参考 “--sref”功能类似,但它不是匹配参考样式,而是尝试让角色匹配 "角色参考 "图像,--cref 目前只适用于 niji 6 和 v6 模型。
2024-12-13 18:32:59