“通义千问”首发体验:响应速度出色 多轮对话有优势

  • “通义千问”首发体验:响应速度出色 多轮对话有优势已关闭评论
  • A+
所属分类:热点事件

  【御龙天下新闻】继3月份百度公布文心一言之后,国内的另外一家人工智能公司——阿里云,在4月7日宣布自研大模型“通义千问”开始邀请用户测试体验。据悉,该模型目前主要是定向邀请企业级用户进行体验测试,可通过官网申请,符合条件的用户可参与体验。

“通义千问”首发体验:响应速度出色 多轮对话有优势
通义千问

  据御龙天下了解,阿里的达摩院早已在该领域布局多年,并在2019年启动了大模型研发,于2022年9月发布了“通义”大模型系列。

  关于“通义千问”这个名称,从字面上就能够看出其自身的定位——通晓各类知识,回答千种问题。当然,这个只是笔者的个人理解,因此笔者直接将此问题询问了“通义千问”,其回答表示“通义”意味着该模型具有广泛的知识和普适性,可以理解和回答各种领域的问题。“千问”代表了模型可以回答各种问题,包括常见的、复杂的甚至是少见的问题。就如同其所具备的功能一样,回答问题、创作文字,表达观点以及撰写代码等。

“通义千问”首发体验:响应速度出色 多轮对话有优势
通义千问首页布局

  在该模型的体验界面上,罗列着一些建议指令,比如“写一段电影脚本,讲一个北漂草根创业逆袭的故事”、“作为手机斗地主游戏的产品经理,该如何做成国内爆款”、“团队开发了一个对话机器人,给老板写邮件介绍”等等。而与百度的文心一言不同的是,最下方则是有一个可以体验更多小应用的百宝袋。

“通义千问”首发体验:响应速度出色 多轮对话有优势
百宝袋页面

  点进这个百宝袋后,我们可以看到该页面主要将其内置的小应用分为了三个大类,分别是效率类,生活类以及娱乐类。效率类中提供了“写提纲”、“SWOT分析”和“商品描述生成”这三个功能,因此很明显此类功能是用以解决办公需求的,尤其是其中的商品描述生成,就与阿里旗下TO B、TO C的电商业务相匹配。

“通义千问”首发体验:响应速度出色 多轮对话有优势
百宝袋页面

  另外的生活类和娱乐类则是分别包括“会放飞的菜谱”、“小学生作文”、以及“然后呢”和“彩虹屁专家”、“写情书”和“为你写诗”。其中最让笔者感兴趣的是“然后呢”这个功能,个人认为该功能适合放在娱乐类里,而不是生活类。其介绍是为“写一个句子作为开头,然后看发生了什么”。笔者尝试输入了“在一个月亮变成红色的夜晚”,结果是生成了一篇短小的儿童故事,相信这项功能十分适合孩子处于学龄前时期的父母们,不必再担心没有足够的故事去哄孩子们睡觉。

“通义千问”首发体验:响应速度出色 多轮对话有优势
“然后呢”小应用生成结果

  为了分辨在功能区内输入与在常规问答中输入的区别,我又将刚才的“红月”输入到了常规界面,最终通义千问给出了十分科学的回答,解释了月亮变红的原因。由此可见,百宝袋中的各项小应用应该是加了更多的限制指令,从而实现了不同种类的功能呈现。

“通义千问”首发体验:响应速度出色 多轮对话有优势
常规界面生成的结果

  在实际体验后,笔者发现通义千问在语言的理解能力上表现得可圈可点,基本没有出现一些所问非所答的情况,并且在生成结果时的响应速度方面也表现得较为出色,但在内容的呈现较为粗略。

“通义千问”首发体验:响应速度出色 多轮对话有优势
通义千问生成结果

  笔者尝试与百度的文心一言做了对比,同时输入了“请以科幻小说的方式为神雕侠侣叙写结尾”的指令。虽然在响应速度以及结果输出的过程中,通义千问表现得十分快速且顺畅,但在最终的内容质量上,个人觉得文心一言的内容更好。因为通义千问所生成的内容更偏向一个内容梗概,而文心一言所处生成的内容细节则更加丰富。

“通义千问”首发体验:响应速度出色 多轮对话有优势
文心一言生成结果

  其他方面,笔者在尝试让其生成一份详细的旅游攻略时,所呈现出的结果曾出现排版错误的情况,但再后续的多次尝试中又恢复了正常。造成这个问题的原因可能是多方面的,比如开启内测后突然涌入了太多用户,又或者是其已经自动修复了此项问题。此外,通义千问对待一些较新、或者较为专业的信息的抓取与理解上略有不足。笔者曾让其生成一份魅族20手机(2023.3.30发布)的宣传视频脚本。暂且不论其脚本的完成度与可行性,其中关于手机的参数方面就出现了错误,如图中红框圈出的内容都是错误的呈现。

“通义千问”首发体验:响应速度出色 多轮对话有优势
通义千问出现的错误信息

  这种情况其实是可以理解,因为在笔者询问了通义千问是否是基于中文来理解的,其表示否认,并表示是“基于自然语言处理的技术实现的,可以理解中文,但我的主要语言是英文”。笔者还注意到,相较于国外的ChatGPT和国内的文心一言,阿里云的这款通义千问目前仅提供了文本交互的单一模态,并未支持语音、图片等其他方式的多模态功能。

“通义千问”首发体验:响应速度出色 多轮对话有优势
通义千问对于理解语言的回答

  总的来说,阿里云作为国内深耕AI领域的科技大厂,其推出的“通义千问”目前是国内第二个、世界第三个正式推出的AI大模型。可以说是已经走在了AI这条通向未来之路的前列。

  其实国内很多的企业都像阿里这样,很早就投入了关于AI大模型的研发之中,但估计是没有想到国外的ChatGPT能够在一个可用度很高的基础上迅速上线。而在国内厂商之中,能够快速跟上并且正式推出相关产品的企业一定也是准备得较为仓促。因此通义千问虽然还存在着一定的问题,却是可以理解的,并且通义千问作为一个改进工作与生活的AI工具、AI助手,其功能的完善与升级就是需要在用户的使用过程中不断地学习与进化。  

  目前,大语言模型已经成为了互联网和科技相关企业加速布局的热门赛道。在这场“马拉松赛跑”中,起步越早,所能获取的“进化”资源就会越多。同时多款产品的落地,也会促进该类产业的升级与发展。相信在未来,其他互联网巨头也会纷纷开启类似产品的内测。所以,这场有关AI大模型“战争”的“硝烟”才刚刚升起。