OpenAI奥特曼扮演“谜语人”疯狂预热新模型:神秘大模型「gpt2」火爆内测,传闻5月10日凌晨正式上线
最近的这一周,OpenAI正在秘密[A/B]对照组测试下一代大模型,实力超强,甚至被一部分网友怀疑是所谓的「GPT-4.5」,甚至是「GPT-5」。
就在奥特曼在推特(X)平台上频频发文当“谜语人”暗示之后,两款新模型悄悄上线大模型竞技场。
① Im-a-good-gpt2-chatbot
② Im-also-a-good-gpt2-chatbot
第一组对比提示词:画一个自由女神像。
GPT-4 Turbo是左边的结果输出,gpt2-chatbot是右边的结果输出,一目了然「gpt2」明显更胜一筹。
此前一款名为「gpt2-chatbot」的超强模型仅仅上线一天,热情的网友就把服务器挤爆了。
更多的网友们在听说此事后,已经纷纷前去测试,一探它们的底细了。
代码能力突出
和第一次露面有所不同,如今想要在大模型竞技场里边碰上「gpt2」,只能碰运气。有的人运气好,试了抽卡了5次就成功让这俩模型battle了一局。
结合几个示例来看,im-also-a-good-gpt2-chatbot生成的回答似乎总是更简洁一些。
代码生成方面,它能一次生成一个可执行的游戏代码。
提示词:Code Flappy Bird game in Python
效果如下:
如果回答的代码有误,可以进一步追问让它自己改正。
比如让它们写一个康威生命游戏的代码,在未告知使用Colab时,模型写出的代码有问题。
但继续追问并表示自己用的是Colab,im-also-a-good-gpt2-chatbot能够自己修改对代码,im-a-good-gpt2-chatbot不行。
还有在解决物理题方面,有Reddit用户说,im-also-a-good-gpt2-chatbot能解答出其他模型都答不对的特难物理题目。
比如这道题:
绿灯侠从一栋高楼楼顶跳下,他从静止状态开始做自由落体运动到地面,在他下落过程的最后一秒时,距离地面的距离是大楼一半的高度,这座楼有多高?
不过我们实测了下,im-a-good-gpt2-chatbot似乎也能做对。
还有人测试了一道推理题目,im-a-good-gpt2-chatbot可回答正确,im-also-a-good-gpt2-chatbot也能做到,但需要两次提示。
提问:现在有两个足球队。球队A赢了8次,球队B赢了5次,已知还剩7次比赛,球队B想要赢得整场比赛,还需要至少赢几次?
网友质疑:这是在白嫖大家反馈吗?
尽管OpenAI还是没有正式认领「gpt2-chatbot」,但网友几乎已经默认它们是一家了。因此有人觉得,「gpt2-chatbot」在竞技场上搞A/B测试,这不是让大家免费给他当志愿者。
OpenAI想要对内部模型进行人工评估,应该付给测试人员报酬,而不是在免费社区做。
有人觉得他们这么做,就是为了新模型准备上线而做的炒热度。
但现在gpt2-chatbot的底层模型到底是啥还不确定。
有人直接问了gpt2-chatbot,但可能存在幻觉,它表示自己基于GPT-4架构,是GPT-4.5的变体。
但之前奥特曼在公开演讲中已经否定了。测试网友表示自己没有给出过GPT-4.5相关的提示内容。
也有人怀疑,这两个模型大小不一样,叫这个名字是不是因为采用了GPT-2的架构来训练模型。
这和单纯的MoE不同,它们使用了「Q*」、合成数据,Sam的推特编辑历史是不是暗示了这一点?
值得一提的是,最近有大V爆料称,本周OpenAI将公布进军搜索引擎的消息。
OpenAI已经更新了网站主页,第一个轮番页是一个搜索框上面写着“向ChatGPT问任何事情”。
爆料说,这次新模式的发布时间会在北京时间本周五(5月10日)的凌晨2点。
总之,最近OpenAI的各种动向,都带着某种神秘感。
-
OpenAI奥特曼扮演“谜语人”疯狂预热新模型:神秘大模型「gpt2」火爆内测,传闻5月10日凌晨正式上线
最近的这一周,OpenAI正在秘密[A B]对照组测试下一代大模型,一款名为「gpt2-chatbot」的超强模型仅仅上线一天,热情的试玩网友就把服务器挤爆了。
2025-01-28 20:33:06 -
阿里云发布通义千问2.5大模型:号称多项能力赶超GPT-4,发布开源模型Qwen1.5-110B
阿里云 AI 智领者峰会-北京站活动中,阿里云对外发布了新版的通义千问大模型,V2 5版本大模型正式发布,该版大模型的多项能力赶超了GPT-4。
2025-01-28 20:09:47 -
苹果发布M4芯片:iPad Pro率先搭载,每秒38万亿次浮点运算算力爆表,最强移动芯片神经网络引擎
M4芯片以第二代3纳米制程工艺打造,采用SoC架构,还集成了全新的显示引擎,可帮助iPad Pro的突破性超精视网膜XDR显示屏实现惊人的精准度、色彩和亮度。
2025-01-28 19:45:17 -
摩根大通推出炒股AI机器人IndexGPT:使用ChatGPT来预测资本市场动向,进行资本风险投资
全球最大的金融机构之一摩根大通对外发布了一款AI炒股机器人「IndexGPT」,这款机器人可自动创建“主题投资篮子”策略。
2025-01-28 19:20:42 -
阿里云发布通义千问2.5丨最新消息:OpenAI下周一发布AI搜索产品丨苹果为iPad广告展现AI技术“碾压”人类创意道歉
【AI奇点网2024年5月10日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。
2025-01-28 18:55:48 -
美国计划出台限中制裁法案:拟禁止开源类AI大模型产品向中国、俄罗斯等竞争对手出口
修订于2018年《出口管制改革法案》,以防止外国竞争对手通过美国AI和其他技术用于其他目的。包括类ChatGPT、类Midjourney等开源AI大模型
2025-01-28 18:28:13
-
AI绘画comfyUI教程_图生图工作流程
本期的视频教程是关于在ComfyUI中搭建完整的图生图工作流的。视频中介绍了如何使用ComfyUI中的组件来实现图像的裁剪和重绘。
2024-12-18 13:42:28 -
商汤AI视频生成器如影使用方法_如影使用教程_AI视频生成测评
国内知名人工智能软件公司商汤科技近日宣布,“商汤如影SenseAvatar”数字人视频生成平台正式上线,产品愿景是“让每个人都可以轻松制作视频”,非常的直抒胸臆呀。
2024-12-17 03:24:28 -
怎么快速给模特换装_怎么用stable diffusion给模特换装
本篇教程主要运用StableDiffusion这个工具来进行操作,下面会通过几个小案例,给大家展示不同需求下,我们该如何使用StableDiffusion来辅助我们完成服装效果展示。本教程适用于电商设计场景、摄影场景等多个运用人物设计的实战中
2024-12-23 13:57:15 -
万万没想到,兵马俑都开始跳「科目三」:阿里云通义千问APP打造“全民舞王”视频创作工具,实测效果大赞
兵马俑跳《科目三》,是我万万没想到的。有人借助了阿里云之前走红的AI视频生成技术——「Animate Anyone」,生成出来了这个舞蹈片段。
2024-12-13 16:46:26 -
AIGC落地实践!四招帮你快速搞定运营设计
回顾这一年,随着 AIGC 浪潮的爆发,在掌握AI工具已经成为设计师必备技能。今天这篇文章,通过三个案例流程拆解带大家从新时代设计工作流,到必备「四大招式」,到图标设计六大方向,到训练专属模型,再到全流程手把手拆解设计项目,绝对干货满满
2024-12-18 16:57:17 -
stable diffusion初识_stable diffusion跟其他工具有什么区别]
关于Stable Diffusion的内容很多,在本篇教程里,我会先为你介绍Stable Diffusion模型的运行原理、发展历程和相较于其他AI绘图应用的区别。
2024-12-24 13:45:31 -
PikaAI怎么用_PIkaAI怎样生成视频_AI视频生成器Pika怎么用_AI视频生成工具Pika教程
Pika这款工具7月份在AIGC界横空出世,被圈内誉为目前“全球最好的文本生成视频AI工具”之一,也被认为是另外一款知名AI视频生成工具Runway的强有力挑战者。
2024-12-25 13:35:53 -
如何使用 ChatGPT 调试代码
当您的代码出现问题时,您可以向 ChatGPT 提供故障代码和问题描述。AI 工具将尝试识别并纠正问题。
2024-12-31 12:01:41 -
stable SR脚本安装_stable diffusion脚本网站
上节课我们讲的4xUltraSharp是不是觉得已经很强了! 那么如果我拿出Stable SR脚本你应该如何应对呢?
2024-12-31 13:49:18 -
怎么设置关键词权重_怎么设置Multi Prompts
AI 绘画,顾名思义就是利用人工智能进行绘画,是人工智能生成内容(AIGC)的一个应用场景。其主要原理简单来说就是收集大量已有作品数据,通过算法对它们进行解析,最后再生成新作品,Midjourney是一个由同名研究实验室开发的人工智能程序。
2025-01-03 10:00:57