OpenAI首款“推理”模型o1:人工智能的下一场豪赌?
OpenAI 刚刚发布了其全新人工智能模型——o1。虽然名称听起来像是随便起的,但o1承载着OpenAI对未来AI发展的雄心壮志。简而言之,o1是一款先进的“推理”模型,具备处理更复杂问题的能力,并且运算速度超过人类。然而,值得注意的是,o1的使用成本显著高于以往的模型,这可能会成为用户的一大考量。

对于关注AI行业动态的用户来说,o1其实就是此前备受热议的“Strawberry”模型。此次,OpenAI不仅推出了o1,还发布了一个更为经济实惠的“迷你版”——o1-mini,后者在价格上更加亲民,但在功能上有所简化。

在多AI模型订阅平台 POE 上o1模型使用每一次约为25000积分(约合3.5元人民币)

在多AI模型订阅平台 POE 上GPT4o模型使用每一次约为25000积分(约合3.5元人民币)
o1:实际上手体验,高考数学包OK!
在多AI模型订阅平台 POE 上,近日更新了对 o1 模型的支持。尽管 o1 模型目前仍处于测试阶段,每天仅限 3 条使用权限,并且每发送一条消息所消耗的积分大约是常规 GPT-4 模型的 50 倍,许多用户仍然愿意尝试。需要注意的是,使用 o1 时回复速度较慢,通常需要等待较长时间。

我们对 o1 模型进行了几道逻辑题和数学题的测试,旨在比较它与 ChatGPT-4o-Latest 之间的差异,特别是 o1 模型在逻辑推理方面的表现。
测试一:9.11 和 9.9 哪个更大?
这是 GPT 模型常常犯错的题目,因为它容易在小数点后的数值比较中产生“幻觉”,错误地认为 9.11 比 9.9 大。ChatGPT-4o-Latest 在这一题上也给出了错误答案,未能正确处理数值的大小关系。

ChatGPT-4o-Latest
然而,o1 模型在这道题上不仅给出了正确答案——9.9 更大,并且进一步探讨了当数字比较不是单纯数值时,可能存在的其他歧义情况。o1 模型的回答不仅准确,还展示出它在逻辑上的深度思考能力。这种对问题**度的理解反映了它在逻辑推理上的优势。

o1-mini
测试二:在客厅的桌子上放着一个杯子,杯子里有一个戒指。之后,杯子被移到了书房的桌子上,再移到了卧室的床上。在那里,杯子曾被翻倒过一次,随后又恢复了原样。之后,杯子被放回了客厅的桌子上。现在,戒指在哪里?

ChatGPT-4o-Latest

o1-mini
从两者的回答来看,o1 在逻辑推理上的表现更加精准,其对问题的理解和回答的条理性都要优于 ChatGPT-4o-Latest。
测试三:2022 年高考数学的最后一道大题(仅测试第一问的推导过程)。

ChatGPT-4o-Latest

o1标准版
在这道题中,o1 模型的推导过程与标准答案完全一致,展示了它在数学逻辑上的严谨性和准确性。而 ChatGPT-4o-Latest 在推导过程中出现了错误,未能正确理解题目并给出符合标准的推导步骤。
o1:AI 推理能力的全新登场,价格却不够亲民
o1的发布标志着OpenAI在实现类人智能方面迈出了关键一步,尽管这一进展的成本相对较高。借助o1,AI不仅能够协助编写代码,还能解决那些需要深度思考的问题。然而,开发者若欲使用o1,成本将相当昂贵:在API中,每处理100万个输入令牌(一种计费方式)需支付15美元,输出令牌则需60美元。相比之下,GPT-4o的价格仅为5美元和15美元。

o1 的“特别训练”:AI 学到了什么?
OpenAI研究团队负责人Jerry Tworek透露,o1的训练方式与以往模型存在“根本性差异”。尽管他未详细说明这些创新技术,但他提到o1采用了一种全新的优化算法,并使用了专门设计的数据集进行训练。

传统的GPT模型擅长模仿训练数据中的模式,类似一只能说话的聪明鹦鹉。而o1则表现出自我学习的能力。OpenAI通过强化学习的方法训练o1解决问题,简单来说,就是“做对了给奖励,做错了则纠正”。此外,o1还采用了一种称为“思路链”的方法来处理问题,这类似于AI版的“步步为营”,让它能够像人类一样逐步分析和解决问题。

OpenAI表示,这种全新的训练方法使得o1变得更为智能和可靠。“我们发现模型的幻觉现象有所减少。”
o1 能力官方解读:单边天才?
与GPT-4o相比,o1在多个方面表现出显著优势:它在编码和数学问题上的处理能力更强,并且能够清晰地解释其推理过程。OpenAI首席研究官Bob McGrew甚至打趣道:“o1在解决AP数学考试题目上肯定比我当年表现得更好,尽管我大学期间还辅修了数学。”

OpenAI-Sam altman
为了验证o1的实力,OpenAI使用国际数学奥林匹克资格考试对其进行了测试。结果显示,GPT-4o仅答对13%的题目,而o1则表现优异,答对率高达83%。这一成绩无疑令人印象深刻,但也不可忽视其局限性。尽管o1在复杂推理方面表现出色,但在处理广泛的世界知识时却不及GPT-4o,甚至缺乏浏览网页、处理图像和文件的能力。换句话说,o1或许是个聪明的数学家,但仍然是“闭关修炼”的高手。尽管如此,OpenAI依然认为o1代表了一种全新的能力,象征着AI发展的新起点,并赋予其具有重启意义的名称——o1,暗示着AI进化的全新阶段。

外网对新模型的测试与使用评价

外网对新模型的测试与使用评价

外网对新模型的测试与使用评价
McGrew也坦诚道:“我们以前在命名方面确实不太成功,希望这次的o1能够成为我们命名风格的全新开始。”
AI的未来:推理能力只是开始
大型语言模型本质上并不具备真正的“智能”,它们只是通过大量数据寻找模式,预测下一个最可能出现的词语。举个例子,早期的ChatGPT甚至会错误地认为“strawberry”只有两个R,但新的o1模型则能够正确处理这一问题。

外网用户使用o1快速搭建一个ios app
据报道,OpenAI正在以1500亿美元的估值筹集更多资金,其未来的发展很大程度上寄希望于像o1这样的推理模型。毕竟,如果AI能够从简单的模式识别进化到真正的推理,不仅在医学和工程等领域将实现突破,甚至有可能成为未来自动化代理的基础。然而,目前o1的推理速度尚不够快,无法胜任真正的代理系统,加上开发者使用成本较高,OpenAI的梦想可能还需要更多时间才能实现。

正如McGrew所说:“我们在推理能力上已经研究了好几个月,因为我们认为这是AI的关键突破。”从根本上讲,o1代表了一种全新的模型模式,能够解决真正困难的问题,向类人智能迈出了重要一步。

展望未来,AI的发展将不仅仅局限于模式识别和简单的任务自动化。随着推理能力的提升,AI有望在更多复杂领域展现其潜力,辅助人类进行决策、创新和解决重大挑战。虽然当前的技术仍然存在诸多限制,但每一次突破都让我们离全面智能的AI世界更近一步。随着技术的不断进步和成本的逐步降低,AI将在教育、医疗、科研等各个领域发挥越来越重要的作用,成为推动社会进步的重要力量。
-
OpenAI首款“推理”模型o1:人工智能的下一场豪赌?
OpenAI 刚刚发布了其全新人工智能模型——o1。虽然名称听起来像是随便起的,但o1承载着OpenAI对未来AI发展的雄心壮志。简而言之,o1是一款先进的“推理”模型,具备处理更复杂问题的能力,并且运算速度超过人类。然而
2025-07-08 13:57:23 -
国网通信产业申请一种基于人工智能的人机交互对话系统专利,提升交互速率保障交互效果
专利摘要显示,本发明公开了一种基于人工智能的人机交互对话系统,本发明涉及人机交互技术领域,解决了所接收到的文本内容数量较多,其人机在交互时,便存在识别困难的问题,本发明通过确认唤醒语音的声纹图谱,
2025-07-08 13:33:23 -
江苏8款大模型通过国家人工智能服务备案
近日,国家互联网信息办公室公布一批生成式人工智能服务已备案信息,其中包括江苏汇智智能数字科技有限公司的CarrotAI大模型、智慧芽信息科技(苏州)有限公司的芽仔大模型。截至目前,江苏共有8款大模型通过国家备
2025-07-08 13:09:23 -
青岛恒星科技学院与两单位签订协议 在人工智能领域深度合作
签约仪式现场。(来源:青岛恒星科技学院) 信网9月18日讯(记者 赵宝辉)为了响应教育部对产教融合的号召,全面推行校企协同育人,9月13日,青岛恒星科技学院与华为云计算技术有限公司和深圳市讯方技术股份有限
2025-07-08 12:45:24 -
消息指贝莱德与微软计划成立超300亿美元人工智能投资基金
观点网讯:9月18日,据资本市场消息,全球领先的资产管理公司贝莱德与科技巨头微软计划共同成立一只规模超过300亿美元的人工智能投资基金。 该基金将专注于建设数据中心和能源项目,以满足人工智能日益增长的
2025-07-08 12:21:23 -
恒荣汇彬:AI时代智能化解决方案与未来发展
随着人工智能(AI)技术的飞速发展,我们正步入一个前所未有的智能化时代。AI以其强大的数据处理能力、自主学习能力和跨领域应用能力,为各行各业提供了创新的智能化解决方案,并深刻改变着我们的生活方式、工作
2025-07-08 11:57:23
-
OPPO发布全新手机端AI智能语音助手“新小布”1.0 Beta,并开启内测申请
OPPO宣布将携手芯片制造商联发科共同合作打造轻量化的大模型端侧部署方案,基于 AndesGPT 大模型打造的 OPPO 新小布 1 0 Beta 版尝鲜体验也正式开启。
2025-04-01 15:18:53 -
谷歌逆袭大杀器Gemini系列大模型:最强多模态模型,语义理解能力超越人类,多项指标碾压GPT-4
当地时间12月6日,谷歌的复仇大杀器Gemini,深夜忽然上线!被ChatGPT压着打了整整一年,谷歌选择在12月的这一天,展开最强反击战。
2025-03-25 09:01:33 -
OpenAI秘密文件曝光!AI悄悄自我编程,可轻松破解一切人类加密系统
奥特曼被公司罢免的前一天,一名OpenAI员工曾发帖声称:AI正在自行编程!传言称,「Q*」大模型想出了一种破解数字加密的方法
2025-03-25 10:47:43 -
开源AI草图变美图绘画工具_AI草图生成精美图片工具_AI手绘线稿生成图片工具
一键手绘变插画的工具Stable Doodle,它能将手绘草图变为精美图片。今天我发现已经有开源版本的一键手绘变插画工具。
2025-04-04 15:48:22 -
2024,AI开始改变世界
人工智能(AI)技术在经历几年的高速发展后,终于在2024年开始取得井喷式爆发的成果应用。无论是今年年初文生视频大模型Sora带来的巨大冲击,还是全球多地自动驾驶汽车的普及、AI机器人开始在各行各业投入使用,
2025-05-08 12:47:33 -
滁州学院成立人工智能学院
近日,滁州学院公布校内机构调整设置显示,该校人工智能学院(应急管理学院)正式成立。此前,在11月23日举行的滁州学院高质量特色发展研讨会上,安徽省委教育工委、滁州市委、市政府领导和共建企业领导共同为“人
2025-05-09 13:18:46 -
2024生态设计工程、人工智能与可持续发展国际研讨会在广州举行
12月21日,2024生态设计工程、人工智能与可持续发展国际研讨会在广州城建职业学院举行。会议由世界生态设计组织、中国工业设计协会设计教育分会指导,由清华大学艺术与科学研究中心、国家工业设计研究院(生态设
2025-05-09 16:32:00 -
张强医生集团Emily:AI医生面临三大挑战
下午,张强医生集团北京静脉曲张CHIVA中心依然忙碌,患者们陆续满意地离开。张强医生简单整理了一下当天的手术记录,坐在办公桌前,喝了一口热茶,转身对我说:“Emily,今天的患者都很顺利。现在,我们来聊聊昨天
2025-05-10 13:11:12 -
无人驾驶、智能诊疗……瞄准人工智能赛道,郑州拟出新文件
日前,郑州市科技局发布公告,对《郑州市场景驱动型人工智能创新发展行动方案》(以下简称《行动方案》)公开征求意见。 关于人工智能,河南省、郑州市都曾出台过多项支持政策,此次冠以“场景驱动”之名,有何内
2025-05-10 14:00:27 -
工信部:去年新增独角兽企业中,超半数来自新能源、人工智能等硬科技赛道
近年来,新增初创企业、独角兽企业数量有所减少,风投行业也面临各种挑战。对于创建独角兽企业面临的障碍,工业和信息化部副部长王江平在近日举行的国新办新闻发布会上表示,独角兽企业的成长,一方面需要企业自
2025-06-20 12:45:20