上海人工智能实验室宣布开源化学大模型“浦科化学”:基于“书生·浦语”2.0,化学领域的推理能力超越ChatGPT
上海AI实验室最新开源成果——最新的科学大模型“浦科化学”(ChemLLM),发布即开源!
它基于书生·浦语2.0强大的基座模型能力,通过注入海量的化学专业数据,使大模型获得理解和处理化学相关专业任务的知识与能力。值得一提的是,在获得化学能力同时,大模型的数理学科及推理能力还得到增强。
目前该模型已经发布到公开社区,支持免费商用。
化学领域超越ChatGPT
浦科化学具备专业的化学知识能力,可以精准翻译研究论文中的各种专业名词:
还能回答高中化学试题,并给出解释。
在多项测试中,浦科化学的表现都大幅超过其他模型。
研究人员通过3个任务来测试模型专业能力:
分子名称转换分子性质预测反应产物预测这些任务分别涉及化学物质的表示、性质和转化,是化学研究的基础和核心。
分子名称转换要求模型能够在不同分子表示方式之间进行准确转换,如SMILES、IUPAC名称、分子式等。
分子性质预测方面,要求模型能根据分子的结构和组成,预测其化学性质,如沸点、密度、溶解度等。
反应产物预测方面,要求模型能根据给定的反应物和反应条件预测反应产物的结构。
结果显示,浦科化学在这三项任务上均表现出色,分别获得22.0、49.0和7.0的分数,远超过其他同规模模型的水平,并超越了GPT-3.5.证明浦科化学在理解和处理化学知识方面具备强大能力。
泛理科能力涌现
在化学能力提升的同时,浦科化学在数学、物理及推理方面的能力也都得到提升。
研究人员使用MMLU(大规模多任务语言理解数据集)作为测试集来评估浦科化学在通用场景下的性能,对语言模型的多项任务能力进行测试评估,并将浦科化学与其他同等规模的模型进行比较,以评估化学训练数据对基础模型的影响。
评测结果显示,浦科化学在大学化学任务上得分为47.0,超越了所有其他模型。
研究人员发现,尽管没有对浦科化学进行数学和物理学科的训练,模型在大学数学、大学物理、STEM(科学、技术、工程和数学)类等相关领域上也获得了最佳成绩。同时,浦科化学在形式逻辑任务上也达到了最高水平。
上述结果表明,当对大模型进行进行化学专业训练时,其数理及推理能力也能得到增强。
有趣的是,浦科化学在道德场景、人文科学类、社会科学类等分项任务上也展现了优异的平均性能,这说明,对大模型进行专业某个学科的知识训练,不仅不会让大模型“分心”,反而有助于其道德水平及一般任务水平的提升。
据了解,上海AI for Science团队面向化学、物理、生命、地球等科学领域,通过深入研究各学科基础理论,结合最新人工智能理论,探索AI驱动重大科学问题的研究范式,加速人工智能在化学、药物研发、新材料、气象等领域的渗透与落地。
其中,AI for Chemistry方面的研究以语言模型为核心,通过大模型连接智能化实验设备,全方位提升实验效率,从而实现化学研究的自动化和智能化。相关研究范式的创新,将助推科学发现速度,实现更大的社会效益。
未来,基于浦科化学模型,人工智能可为化学研究提供智能化辅助,如化学合成路径规划、化学反应条件优化、实验结果自动化分析等,从而提升化学研究的效率和质量。
项目开源地址:
https://huggingface.co/AI4Chem/ChemLLM-7B-Chat
-
上海人工智能实验室宣布开源化学大模型“浦科化学”:基于“书生·浦语”2.0,化学领域的推理能力超越ChatGPT
上海AI实验室开源科学大模型“浦科化学”(ChemLLM),基于书生·浦语2 0强大的基座模型能力,使大模型获得理解和处理化学相关专业任务的知识与能力。
2025-02-17 16:12:00 -
CIBA何其有幸AI嘉年华:元宵盛典暨DeepSeek新机遇大会成功举办
2025年2月12日,CIBA 何其有幸 AI 嘉年华:元宵盛典暨DeepSeek新机遇大会在元宵佳节成功举办。 这场盛会由战略投资家、CIBA 新经济创始人何佳蔚女士联合发起,汇聚了众多 AI 领域的专家学者、行业领袖和创新实践
2025-02-17 15:49:41 -
旷视科技推出「地表最小」多模态视觉大模型Vary-toy:麻雀虽小技能俱全,GTX 1080Ti显卡轻松运行,开源免费玩
一款名为Vary-toy的超小体积的大模型来了!普通消费级显卡就可以训练,几年前的GTX 1080Ti 8G的老显卡轻松运行。
2025-02-17 15:49:14 -
苹果疯狂招兵买马布局AI大模型技术研发:6月WWDC发布iOS 18系统,将搭载升级版Siri
《金融时报》报道,苹果公司正低调地进行一系列与人工智能相关的收购和人才招聘,目的是为其下一代 iPhone 装配端侧的 AI 技术做准备。
2025-02-17 15:14:36 -
腾讯文档AI版开启全民公测:一键生成Word/Excel/PPT/思维导图等,助你实现「年终总结」自由
1月26日,腾讯文档宣布,「腾讯文档AI版」开启公测,面向全体用户开放AIGC内容生成体验,支持常用的全品类文档生成、跨类型的文档信息转换处理等。
2025-02-17 14:49:02 -
阿里发布视频生成模型MotionShop:支持AI数字人物一键替换,让“二次元老婆”跳宅舞,免费玩!开源圈杀疯!
阿里杀疯了!又整出跳舞模型新活儿——全新的AI数字人像生成模型框架。新框架支持一键替换原视频当中的动态人物,并且完美还原原版舞蹈。
2025-02-17 14:27:35
-
阿里“通义听悟”升级:支持6小时超长视频内容解析提问,还可一键生成巨幅思维导图
阿里通义大模型应用产品“通义听悟”发布多项新功能,上线音视频问答助手“小悟”、一键 AI 改写、思维导图生成等六大功能。
2025-02-06 16:53:33 -
腾讯发布混元大模型原生AI应用「腾讯元宝」,已接入微信搜一搜,覆盖公众号内容生态
腾讯宣布旗下的主力大模型混元大模型全面升级,基于混元大模型打造了首个面向消费用户的APP「腾讯元宝」正式上线。
2025-01-21 14:37:34 -
AIGC基础应用教程丨探索AI在图像放大中的工具使用
当给到的图像素材尺寸太小或者不清晰的时候,有哪些好的AI图像放大的工具可以使用?本期就给大家推荐一些好用的工具
2025-02-06 14:24:28 -
国内大模型创企“月之暗面”发布Kimi模型重磅升级:扩容200万字上下文窗口,新增「继续」延长回复按钮
国内人工智能大模型创业公司“月之暗面”终于有了一次面向媒体的公开活动。发布了更长上下文窗口的版本:200万字上下文版本,即日起可在Kimi Chat上开启内测。
2025-02-06 17:17:20 -
小米公司开启小爱AI大模型多模态能力内测:支持图片内容问答、AI扩图、消除路人,适配小米14、Redmi K70等
3月15日,小米官方宣布小米社区开启新一轮的小爱AI大模型内测。现已开启“小爱同学多模态功能内测”。
2025-02-07 13:53:52 -
硅谷版“罗密欧与朱丽叶”:马斯克vs奥特曼的爱恨情仇丨从兄弟同心到对薄公堂,8年发生了什么?
硅谷版“罗密欧与朱丽叶”故事正在上演,马斯克是奥特曼的引路人,但让OpenAI获得今天的成功,奥特曼成为科技圈的新晋网红,决定性因素在于微软的入局。
2025-02-08 13:18:00 -
GPT-4上线一周年纪念日,OpenAI投资的机器人闪亮登场,这是我们目前能看到最接近终结者的样子
一家OpenAI投资的机器人初创公司Figure AI发布一段人形机器人的演示视频,一台基于GPT-4大模型开发,被命名为「Figure 01」的机器人横空出世。
2025-02-08 15:55:02 -
快手AI文生视频大模型【可灵】首发实测:这可能将成为真正意义的第一款「中国版Sora」
昨天,6月6号,是快手的13周年生日。在这一天,所有AI圈的人都想不到,快手在13周年之际,没有任何预兆、没有任何宣传,直接发布了他们的AI视频大模型。可灵。
2024-12-13 20:45:55 -
Stable Diffusion 3最新模型测评丨SD3模型ComfyUI流程简单搭建
由于前不久StabilityAI开放了SD3新模型的使用权,这期我们就简单聊聊这款新模型的使用方法,以及StabilityAI对于SD3模型的发布策略,和未来的发展预期!如果本期讯息对大家有所帮助,就点赞关注支持欧阳一下吧!
2024-12-13 21:10:24 -
科大讯飞星火大模型3.0实测:高能进化,给AI注入灵魂,部分能力与GPT-4旗鼓相当
科大讯飞星火认知大模型3 0正式发布。星火3 0的整体性能已经超越ChatGPT,部分能力与GPT-4旗鼓相当。科大讯飞立下又一个Flag,星火4 0要对标GPT-4
2024-12-13 22:43:43