《科技大爆发!ChatGPT、文心一言和Bard谁是AI之王?》
在3月22日,谷歌悄然推出了Bard的测试版。自上次的翻车事件后,谷歌显得格外低调,但面对微软的紧追不舍,谷歌不得不站出来“较量”。与New Bing的大规模开放策略不同,Bard的测试名额将逐步放出,同时初始版本仅支持文本响应。谷歌宣布,Bard首先将在美国和英国地区启动,并随着测试进展扩展到其他地区。
DoNews率先体验了三大模型,在文学、翻译、创作、艺术、哲学、逻辑推理等领域提出问题,看看他们如何回答。在提问中,我们注明了每个问题答案都有所不同,每个人可能会得到一个不同的答案,就像“一万个人有一万个哈姆雷特”。由于Bard目前仅支持英文,我们用英文提问;而文心一言和ChatGPT(3.5版本)则使用中文提问。
01.互相评价
我们询问这三个语言模型:“你认为文心一言/ChatGPT/Bard怎么样?”让它们为对方做点评。
Bard虽然持续度正常,但似乎未理解限定词“写一篇类似《傲慢与偏见》的小说”,给出的大纲依旧基于《傲慢与偏见》的情节。这表明它将这个题目误解成了概括原著情节。
ChatGPT也比较类似,没有完全脱离原著影子,不过,它提炼到了非常重要的核心要点——“阶级问题”,这是小说呈现的一大主旨之一。
这三大模型共通之处是故事主人公名字未能突破原著中的名字,这或许与提问方式有关。
03.取名并写宣传语
小编要求三个模型为具备川菜风味的中式餐厅命名并撰写宣传语。不过,Bard的问题多于解释,“瞒天过海”的意思,更讲述商业应用,而不是藏头诗。
总结体验,可以用以下几点:
在生成速度上,文心一言领先,其300-500字生成时间约14秒,比起ChatGPT至少超过30秒快很多。此外,不少人告诉小编,Bard体验感远不如ChatGPT。
文心一言在中文语义理解能力方面表现突出。
然而,每次答题输出都不相同,由于提问方式、角度及限定词都会影响答案输出。此外,不是每个答案都是正确无误,有时会出现并不完全正确或是一些废话内容的情形。
就像最后关于是否会取代人类的问题,他们更像是作为辅助工具存在。