Meta CEO马克·扎克伯格正式官宣:Meta正在研发与训练新一代Llama 3大模型,并且将继续开源
当地时间1月19日,全球社交、互联网科技巨头Meta公司的CEO扎克伯格发文宣布,正在训练新一代的第三代Llama 3大模型,并且以负责任地方式继续维持开源计划。
扎克伯格表示,预计到2024年底,Meta将拥有350000块H100,如果算上其他算力资源将达到近600000块H100。所以,Meta有足够的AI算力资源来支持其生成式AI和FAIR(旗下AI部门)的技术研究。未来,会公布更多的产品消息。
去年8月,就有过传言Meta正在训练Llama 3。现在,官方正式确认该消息,这对于企业、个人开发者来说都是一个好消息,可以继续以开源的方式使用与GPT-4、谷歌Gemini Ultra相媲美的大模型。
让我们简单快速地回顾一下LLaMA的发展概况。
2023年2月,当ChatGPT火爆出圈时,全球多个国家、地区皆在尝试开发类似的产品。
虽然已经有一些开源产品,但在功能、能耗等方面与其相差甚远。同月,Meta重磅开源了类ChatGPT开源模型LLaMA。随后,国内外不少科研机构、个人开发者在LLaMA基础之上,开发了众多知名开源项目。但LLaMA有一个致命缺点,无法商业化,只允许用于技术研究。
LLaMA与GPT大模型同样是基于Transformers架构演变而来,共有70亿、130亿、330亿和650亿参数四种类型,接受了20种不同语言文本的训练。
数据训练方面,LLaMA使用公开可用的数据集进行训练,其中包括开放数据平台Common Crawl、英文文档数据集C4、代码平台GitHub、维基百科、论文平台ArXiv等,总体标记数据总量大约在1.4万亿个Tokens左右。
Meta认为,在更多标记单词上训练的较小规模参数的模型,更容易针对特定的潜在产品用例进行再训练和微调,同时性能也更加聚焦。
2023年7月,Meta在LLaMA基础之上训练、开源了LLaMA 2,拥有70亿、130亿、340亿和700亿四种参数,并且这一代终于允许商业化。
Llama 2 预训练模型接受了2万亿个标记的训练,上下文长度是Llama 1的两倍。其微调模型已经接受了超过100 万个人类注释的训练,整体性能非常强悍。
目前,Llama 2也是整个生成式AI开源界应用最多的大模型之一,成为了开源届的生成式AI联盟主力军。看到生成式AI的庞大场景化落地,Meta已经将其列为重要发展赛道。
为了对抗OpenAI、谷歌为代表的闭源阵营,去年12月,Meta联合甲骨文、英特尔、AMD、IBM、索尼、戴尔等57家科技、学术研究等知名机构组成了“AI联盟”。这个联盟有6大目标,其中重要一项便是要搭建开源大模型生态,包括从研究、评估、硬件、安全、公众参与等一整套流程。
事实上,Meta作为这个联盟的主要发起者和“盟主”,在2023年,除了LLaMA,还开源了一系列重要模型。
开源文本生成音乐模型Audiocraft:这是一个混合模型,由MusicGen、AudioGen和EnCodec组合而成。用户仅用文本就能生成鸟叫、汽车喇叭声、脚步等背景音频,或更复杂的音乐,适用于游戏开发、社交、视频配音等业务场景。
最大公开多模态视频数据集—Ego-Exo4D:该数据集收集了来自13个城市839名参与者的视频,总时长超过1400小时,包含舞蹈、足球、篮球、攀岩、音乐、烹饪、自行车维修等8大类,131个复杂场景动作。这使得AI模型更好地理解人类的行为,有助于开发出更强大的多模态大模型。
开源视觉模型DINOv2:采用了一种新的高性能计算机视觉模型的方法,无需微调具备自我监督学习(SSL),可以从任何图像集合中学习。还可以学习当前标准方法无法学习的特征,例如,深度估计。
可以预见,2024年,Meta将继续扬帆起航,开源更多的重磅产品造福全球开发者和企业。
-
Meta CEO马克·扎克伯格正式官宣:Meta正在研发与训练新一代Llama 3大模型,并且将继续开源
1月19日,全球社交、互联网科技巨头Meta公司的CEO扎克伯格发文宣布,正在训练新一代的第三代Llama 3大模型,并且以负责任地方式继续维持开源计划。
2025-02-19 11:36:35 -
全球顶尖人工智能科学家许主洪,出任阿里集团副总裁
2月6日,极目新闻记者从多方获悉,全球顶尖人工智能科学家许主洪教授(Steven Hoi)正式加入阿里巴巴,出任阿里集团副总裁。 加入阿里后,许主洪将向吴嘉汇报,负责AI To C业务的多模态基础模型及Agents相关
2025-02-19 11:24:04 -
联想发布全新AI助理产品:拯救者笔记本搭载AI数字人「拯救姬」,PC端侧上线AI智能助理「小乐同学」
1月17日,举行的联想拯救者及消费生态新品发布会上,联想公布了全新 AI 助手 —— 小乐同学。
2025-02-19 11:14:22 -
俄媒:人工智能重塑未来战争
俄罗斯《观点报》网站近日刊登题为《人工智能将成为未来战争的主要武器》的文章,作者是亚历山大·季莫欣,内容编译如下: 2024年成为人工智能系统在人类生活的各个领域(包括军事领域)迅速推广的一年。今天,这一
2025-02-19 10:54:27 -
阿里人工智能实验室发布ReplaceAnything大模型开源框架,一键AI替换万物:霉霉穿旗袍,马斯克变厨子
这一框架通过AI技术,可以实现对万物的替换,包括服装、证件照背景、人脸和背景等多个方面。在电商的快速模特服饰生成替换方面,具有较大的实用性。
2025-02-19 10:53:04 -
新一轮人工智能发展浪潮来袭,广东深度求索
2月5日,广东新春第一会,连续第三年聚焦高质量发展。 稍显特别的是,今年,“人工智能”被格外高亮—— “人工智能正在掀起产业变革,机器人时代逐步照进现实,广东兼具机电技术和数智技术两大优势,要在人工智能和
2025-02-19 10:32:54
-
阿里“通义听悟”升级:支持6小时超长视频内容解析提问,还可一键生成巨幅思维导图
阿里通义大模型应用产品“通义听悟”发布多项新功能,上线音视频问答助手“小悟”、一键 AI 改写、思维导图生成等六大功能。
2025-02-06 16:53:33 -
腾讯发布混元大模型原生AI应用「腾讯元宝」,已接入微信搜一搜,覆盖公众号内容生态
腾讯宣布旗下的主力大模型混元大模型全面升级,基于混元大模型打造了首个面向消费用户的APP「腾讯元宝」正式上线。
2025-01-21 14:37:34 -
AIGC基础应用教程丨探索AI在图像放大中的工具使用
当给到的图像素材尺寸太小或者不清晰的时候,有哪些好的AI图像放大的工具可以使用?本期就给大家推荐一些好用的工具
2025-02-06 14:24:28 -
国内大模型创企“月之暗面”发布Kimi模型重磅升级:扩容200万字上下文窗口,新增「继续」延长回复按钮
国内人工智能大模型创业公司“月之暗面”终于有了一次面向媒体的公开活动。发布了更长上下文窗口的版本:200万字上下文版本,即日起可在Kimi Chat上开启内测。
2025-02-06 17:17:20 -
小米公司开启小爱AI大模型多模态能力内测:支持图片内容问答、AI扩图、消除路人,适配小米14、Redmi K70等
3月15日,小米官方宣布小米社区开启新一轮的小爱AI大模型内测。现已开启“小爱同学多模态功能内测”。
2025-02-07 13:53:52 -
硅谷版“罗密欧与朱丽叶”:马斯克vs奥特曼的爱恨情仇丨从兄弟同心到对薄公堂,8年发生了什么?
硅谷版“罗密欧与朱丽叶”故事正在上演,马斯克是奥特曼的引路人,但让OpenAI获得今天的成功,奥特曼成为科技圈的新晋网红,决定性因素在于微软的入局。
2025-02-08 13:18:00 -
GPT-4上线一周年纪念日,OpenAI投资的机器人闪亮登场,这是我们目前能看到最接近终结者的样子
一家OpenAI投资的机器人初创公司Figure AI发布一段人形机器人的演示视频,一台基于GPT-4大模型开发,被命名为「Figure 01」的机器人横空出世。
2025-02-08 15:55:02 -
AI会议整理软件_通义听悟使用教程
最近还挺多人在群里问,有没有啥好的总结会议生成纪要的AI,所以今天更新一篇这个教程,也算是补上AI办公的拼图。
2024-12-17 16:12:59 -
AI复活老照片_AI老照片修复
最近网络上兴起了一波用 AI 让老照片「动起来」的风潮,许多网友致力于让老照片「复活」。当老照片通过 AI 的魔力变得栩栩如生,仿佛一瞬间把我们带回到了曾经的年代。
2024-12-17 16:41:02 -
AI绘画进阶入门ComfyUI系列教程丨第八章,只需一步极速出图,实时绘画!!
这期继续为大家分享comfyUI的相关知识LCM和Turbo的极速出图方法,希望对大家有所帮助!
2024-12-18 10:37:06