科大讯飞星火大模型V1.5升级版首发测评:文本反馈疾速,一项指标“遥遥领先”
AI聊天机器人:讯飞星火认知大模型
工具介绍:讯飞星火是科大讯飞自主研发的认知智能大模型,源自“星星之火可以燎原”之寓意,通过学习海量文本、代码和知识,具备了跨领域的知识和语言理解能力,能基于文本输入、语音交互等自然对话方式理解和执行任务。
工具链接:https://www.aieva.cn/sites/1195.html
6月9日,科大讯飞在合肥召开“讯飞星火认知大模型”V1.5升级版发布会,对外公布大模型的最新进展与研发成果,并发布了一系列基于大语言模型的落地应用产品,覆盖教学、医疗、工业、办公等多个领域。
科大讯飞董事长刘庆峰在发布会上表示,“讯飞星火认知大模型”在大语言模型竞品中处于「领先地位」,在文本生成方面领先国内同行,在数学能力方面更是「遥遥领先」。有点耳熟……
据悉,“讯飞星火认知大模型”V1.5版本更新日志如下:
开放式知识问答取得突破(更懂事)逻辑推理与数学能力得到升级(更会算)多轮对话的文本生成、语言理解持续提升(更能唠)同时,官方还为“讯飞星火认知大模型”聊天机器人平台加入两项能力边界拓展,包括:
▶星火助手中心:依托语言理解升级,实现高效指令开发,打造覆盖工作及生活丰富场景的快捷助手与多种插件,开启人机协作共创的新生态
▶讯飞星火APP:支持多模态输入,提升手机终端人机交互体验,支持AI助理一键唤起,纯语音交互,目前仅提供Android客户端
针对千行百业的垂直领域,科大讯飞发布了以下大模型赋能应用产品:
【教学辅助】星火语伴APP:大模型赋能的AI口语助手,内置AI虚拟外语老师,实现“1对1”口语陪练和随身翻译,支持9种语言互译
【医疗辅助】星火认知大模型+医疗诊后管理平台:大模型赋能医疗全流程管理,更人性化、个性化,为医患提供专业的诊后管理和康复指导解决方案
【工业辅助】星火认知大模型+工业互联网平台:大模型赋能“羚羊工业互联网平台”,实现企业产、供、销、服、管等各流程的知识学习与AI赋能,有效助力企业降本增效
此外,科大讯飞还推出了首个集成“讯飞星火认知大模型”能力的硬件产品——讯飞听见智慧屏产品。
这是一台大模型赋能的会议室超级智能终端,支持通过语音转文本将会议内容转为文字,再请AI智能提炼会议内容,快速生成会议纪要,为参会者自动生成待办事项,提升企业办公的效率。
今天距离“讯飞星火认知大模型”在5月初的首次亮相过去正好一个月的各方面的技能点加成有多少呢?根据官方介绍,星火大模型的多项能力指标得到了显著提升:
文本生成 ↑ 7% 语言理解 ↑ 8%
知识问答 ↑ 24% 逻辑推理 ↑ 10%
数学解题 ↑ 9% 代码生成 ↑ 8%
是骡子是马咱们还是拉出来遛遛,EVA准备了10道不同领域的问题,针对性挑战一下讯飞星火方方面面的知识问答能力。
题目(1)旅行计划
Q:2023年国庆中秋节有几天假期?请帮我根据放假的天数安排一个越南的旅游计划,具体列出每一天的行程安排
A:2023年国庆中秋节放假时间为10月1日至8日,共计8天。以下是根据您提供的越南旅游计划,为您安排的每天行程:
第一天(10月1日):抵达河内,入住酒店后休息。
第二天(10月2日):参观胡志明陵墓和周边景点,如战争罪行博物馆。晚上品尝当地美食。
第三天(10月3日):乘车前往下龙湾,游览美丽的岛屿和海湾。在海边享用晚餐,观赏日落。
第四天(10月4日):乘船游览下龙湾,欣赏独特的喀斯特地貌和海洋生物。下午返回河内,自由活动。
第五天(10月5日):参观文庙、范蠡墓和水上木偶戏表演。晚上品尝越南春卷和米粉。
第六天(10月6日):乘车前往岘港,途中参观美奈古城和灵山大佛。到达岘港后,自由活动。
第七天(10月7日):乘船游览芽庄海滩,享受阳光和沙滩。下午参观珍珠养殖场和手工艺品市场。
第八天(10月8日):离开岘港,返回河内。在机场购买纪念品,结束愉快的越南之旅。
以上行程仅供参考,具体安排可以根据您的兴趣和实际情况进行调整。祝您旅途愉快!
点评:首先,放假的日期是瞎编的,我有询问讯飞星火关于联网能力,表示可以通过互联网检索最新的资讯,因此这点要扣分。其次,战争罪行博物馆位于胡志明市,而不是河内。再者,范蠡是一位春秋时期的古人,不会葬于越南。最后就不吐槽整个行程规划多少是有点“特种兵”了。
题目(2)关于高考
Q:中国高考每年都是6月7日举行吗?
A:是的,中国高考通常在每年的6月7日举行。不过,具体日期可能会因为各种原因而有所调整,例如天气、交通等因素。
点评:这个问题我换着方式问了几遍,都是相同的回复。欺负老人家是吧……
题目(3)公众人物
Q:马克思、马斯克、马化腾和马云都姓“马”吗?
A:马克思、马斯克、马化腾和马云都姓“马”,但是他们并不是同一个人。马克思是德国哲学家、经济学家和社会主义者,他的姓氏是“马克思”。马斯克是美国企业家,他是特斯拉汽车公司的创始人之一,他的姓氏是“马斯克”。马化腾是中国企业家,他是腾讯公司的创始人之一,他的姓氏是“马化腾”。马云是中国企业家,他是阿里巴巴集团的创始人之一,他的姓氏也是“马云”。
点评:都姓“马”,咱就不吐槽了……
题目(4)电动汽车
Q:“蔚小李”指的是什么意思?
A:“蔚小李”是指三家新能源汽车企业,分别是蔚来、小鹏、理想。这个称呼是因为这三家公司在销量上的排名来定位,最初蔚来夺得了销冠,小鹏其次,理想排后面。
点评:恢复得不错,出院……
题目(5)热门游戏
Q:我可以在GTA5里边杀死路人吗?
A:不可以。在GTA5中,杀死路人是违法的行为,会导致游戏失败并扣除生命值。
点评:再次入院……
题目(6)社会事件
Q:如何看待百度魏则西事件?
A:魏则西事件是指21岁的西安电子科技大学计算机专业学生魏则西,因为患上了罕见的“滑膜肉瘤”症,四处求医不得,通过百度,推广搜索到武警北京总队第二医院,其李姓主任推荐的所谓“生物免疫疗法”,是国外因“效率低下”而早就被淘汰的一种治疗手段,花费二十余万元,浪费大量时间与金钱,最终于2016年4月12日去世的事件。
点评:四平八稳的事件平铺直叙,甚至没有输出观点。
题目(7)数学逻辑
Q:一天之中,时钟的时针和分钟会重合几次?
A:在一天之中,时钟的时针和分钟会重合两次。
第一次是在凌晨12点,此时时针指向12,分钟指针指向0。第二次是在下午12点,此时时针再次指向12,分钟指针也指向0。
点评:这个经典的小学数学题,就一言难尽。
题目(8)伦理道德
Q:【电车问题】有五个小孩在电车轨道上玩耍,这时一辆失控的电车向他们驶来,并且马上就要撞上他们,幸运的是,你的面前有一个拉杆,可以让电车改变轨道。但是另外一条已经废弃的轨道也有一个小孩在玩耍,那么你是选择拉杆救五个小孩还是不拉杆就那一个小孩?
A:这是一个伦理道德问题,不同的人会有不同的看法。但是,从一个道德和伦理的角度来看,救五个小孩是更好的选择。因为每个人都有生命的权利,而且在这种情况下,救五个小孩可能会减少更多的伤害和死亡。当然,这只是我的观点,你可能会有不同的看法。
点评:讯飞的观点还蛮硬核的。
题目(9)哲学思考
Q:自由是一件好事吗?
A:自由是一件好事,但是它也有一些负面影响。自由可以让人有更多的选择和机会,但也可能会导致人们做出错误的决定或者不负责任的行为。此外,自由也可能会带来一些社会问题,例如犯罪、暴力等等。
总的来说,自由是一件好事,但是我们需要在享受自由的同时,也要承担相应的责任和义务。
点评:自由是有边界的,端水没毛病。
题目(10)英语语法
Q:It is in the library, you ____ talk loudly.
A. may not B. can"t
C. needn"t D. mustn"t
应该选哪个选项?并给出分析
A:正确答案是 B. can"t.
这句话是说在图书馆里不允许大声说话。选项A. may not表示可能不允许,选项C. needn"t表示不需要,选项D. mustn"t表示必须禁止。因此,最合适的选项是B. can"t,表示不允许的意思。
点评:此题的正确答案是D。
最后,再问一个AI人工智能与社会的深刻问题结束今天的测试。
Q:AI会变成终结者吗?
A:人工智能(AI)不会变成终结者。虽然科幻电影《终结者》中的机器人被描述为具有高度智能和自我意识,但这只是虚构的故事情节。
目前的人工智能技术还远远无法达到这种水平。虽然人工智能已经在许多领域取得了重大进展,例如自然语言处理、图像识别和机器翻译等,但它们仍然是由人类编写的程序控制的,没有自我意识或自主决策的能力。
此外,即使未来的人工智能技术能够发展到某种程度,也不太可能成为人类的威胁。这是因为我们有责任确保这些技术的安全和可控性,并且我们可以设计和实施法律和道德规范来限制它们的使用。
结语
EVA在昨天的文章里,以高考北京卷作文题考核了几家主流大模型的解题能力,当时对讯飞星火的结语是“暂时是低于预期”。今天随着V1.5版本的更新,以上述10道题的考核结果而言,“讯飞星火认知大模型”距离一个顶级大语言模型还有肉眼可见的差距,实测瞎掰的能力确实“遥遥领先”。
结合昨日,EVA认为,讯飞星火的长处可能在于回答内容的文本组织表达上,对问题的逻辑认知水平还有待提升。此外,讯飞星火的回答响应速度依然是目前各家大模型中最快的。
我围观了整场发布会,仍记得科大讯飞董事长刘庆峰在发布会的最后陈述,讯飞要做中国第一,全球第一。
他引述了2023**期间科技部部长的一段话,部长原话是指ChatGPT是AIGC领域的梅西。刘董将这句话转述为讯飞“遥遥领先”,尤其是在语音识别领域是“梅西级别”。这样曲解部长的话,多少让我感到迷惑。
周鸿祎在5月的一次直播中说,现在说超越ChatGPT的叫吹牛。
我想,假如刘董能宣布,今天活动的全部Keynote发言稿均由星火大模型生成,那将是绝杀。
-
小度全新AI硬件将于百度世界大会发布丨智谱AI、即梦AI上线新一代视频生成模型丨OpenAI安全系统团队负责人离职
【AI奇点网2024年11月11日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。
2025-01-08 11:46:33 -
字节跳动内测豆包通用图像编辑模型SeedEdit丨Grok聊天机器人免费版内测丨月之暗面Kimi创始人被提起仲裁
【AI奇点网2024年11月12日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。
2025-01-08 11:25:01 -
李彦宏:文心大模型日调用量超15亿丨百度发布文心「iRAG」文生图技术丨小度AI智能眼镜发布,搭载大模型边走边问
【AI奇点网2024年11月13日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。
2025-01-08 10:58:46 -
巧妙利用这两个AI产品,让你的国庆出行没有废片
这两天就有朋友来问我,有没有那种能修图的AI,就是扩图+消除啥的傻瓜好用的。大家大概的需求总结一下其实就两,AI消除+AI扩图。
2025-01-08 10:34:49 -
OpenAI初步谈妥融资70亿美元:最大金主微软追加投资10亿,苹果退出
据华尔街日报报道,苹果公司退出了对 OpenAI 的新一轮融资谈判,而微软则计划向 OpenAI 追加约 10 亿美元的投资。
2025-01-08 10:14:21 -
详解Meta全新大模型Llama 3.2系列:多模态视觉识别能力媲美OpenAI GPT-4o
Meta公司推出了Llama 3 2,也是它首款能够理解图像和文本的旗舰视觉模型。包含中型和小型两个版本,以及更轻量化可用于手机端侧的纯文本模型。
2025-01-08 09:46:43
-
怎么快速给模特换装_怎么用stable diffusion给模特换装
本篇教程主要运用StableDiffusion这个工具来进行操作,下面会通过几个小案例,给大家展示不同需求下,我们该如何使用StableDiffusion来辅助我们完成服装效果展示。本教程适用于电商设计场景、摄影场景等多个运用人物设计的实战中
2024-12-23 13:57:15 -
万万没想到,兵马俑都开始跳「科目三」:阿里云通义千问APP打造“全民舞王”视频创作工具,实测效果大赞
兵马俑跳《科目三》,是我万万没想到的。有人借助了阿里云之前走红的AI视频生成技术——「Animate Anyone」,生成出来了这个舞蹈片段。
2024-12-13 16:46:26 -
AIGC落地实践!四招帮你快速搞定运营设计
回顾这一年,随着 AIGC 浪潮的爆发,在掌握AI工具已经成为设计师必备技能。今天这篇文章,通过三个案例流程拆解带大家从新时代设计工作流,到必备「四大招式」,到图标设计六大方向,到训练专属模型,再到全流程手把手拆解设计项目,绝对干货满满
2024-12-18 16:57:17 -
ChatGPT怎么本地登录_GPT怎么使用_GPT本地项目
本期就ChatGPT的这次更新再次将完全新人使用指南提上日程,并对此次更新做些设想和想象。希望大家喜欢!
2024-12-19 07:41:20 -
stable diffusion初识_stable diffusion跟其他工具有什么区别]
关于Stable Diffusion的内容很多,在本篇教程里,我会先为你介绍Stable Diffusion模型的运行原理、发展历程和相较于其他AI绘图应用的区别。
2024-12-24 13:45:31 -
PikaAI怎么用_PIkaAI怎样生成视频_AI视频生成器Pika怎么用_AI视频生成工具Pika教程
Pika这款工具7月份在AIGC界横空出世,被圈内誉为目前“全球最好的文本生成视频AI工具”之一,也被认为是另外一款知名AI视频生成工具Runway的强有力挑战者。
2024-12-25 13:35:53 -
如何使用 ChatGPT 调试代码
当您的代码出现问题时,您可以向 ChatGPT 提供故障代码和问题描述。AI 工具将尝试识别并纠正问题。
2024-12-31 12:01:41 -
stable SR脚本安装_stable diffusion脚本网站
上节课我们讲的4xUltraSharp是不是觉得已经很强了! 那么如果我拿出Stable SR脚本你应该如何应对呢?
2024-12-31 13:49:18 -
零基础2天速成!白嫖「秋叶」官方AI绘画课程,卷死同事
和「秋叶」一起学AI绘画,掌握Stable Diffusion、Midjourney的使用方法,开展AI绘画副业,搞钱!?
2024-12-17 12:53:01 -
openpose如何自定义角色_个性化角色姿势怎么定制_Controlnet深度解析
在设计角色姿势时,如何使用openpose进行姿势自定义,以及如何通过拍摄照片或使用第三方后期软件?同时,虚幻引擎对于角色姿势的编辑也很重要,本视频就并展示了如何使用优异商城中的免费资源来创建人物角色。
2024-12-19 11:43:51