科技馆大挑战ChatGPT文心一言和Bard谁能让智慧灯塔闪耀

谷歌悄然发布Bard测试版,科技界再次掀起波澜

3月22日,谷歌在低调中推出了Bard的测试版本。自微软的ChatGPT成功上线后,谷歌不得不紧跟而出,以此来与竞争对手展开较量。在Bard面世之际,Google显得更加谨慎,但为了应对挑战,它仍决定“站出来打擂台”。

与新 Bing 的大规模开放策略不同,Bard的测试名额将逐步释放,并且初始版本仅限于文本响应。根据Google的声明,Bard首先将在美国和英国地区启动,其余地区随着测试推进而逐步上线。

DoNews 早已抢先体验了这三大模型,我们分别向它们提出文学、翻译、创作、艺术、哲学及逻辑推理等方面的问题,以探究他们给出的答案是否令人满意。

值得注意的是,每次提问都能得到不同的回答,这就如同莎士比亚曾说过:“一万个人有一万个哈姆雷特。”尽管如此,我们依旧可以从这些回答中找到各自独特之处。

由于目前只有英文版本可用,因此所有问题均以英文提出,而文心一言和ChatGPT(3.5版本)则使用中文回答。

01.相互评价

我们让每个模型评述另外两个:“你认为文心一言/ChatGPT/Bard怎么样?”结果如下:

Bard虽然没有完全理解限定词“写一个像《傲慢与偏见》的小说”,但它提供的大纲还是基于原著的情节。

ChatGPT虽然也有些许参考,但更好地提炼了核心要点——阶级问题,这也是《傲慢与偏见》的主要主题之一。

文心一言未能突破原著角色名字,不过可能是因为提问方式有关。

02.取名宣传语

我们要求三个模型为川菜风味餐厅命名并撰写宣传语。然而,不幸的是:

Bard的问题多样化,但更多讲述商业应用,而非藏头诗或相关故事。

ChatGPT也有不足之处,如网络延迟影响速度。

文心一言在300字内生成答案只需14秒,是最快的一次试炼。

03.总结体验

总结起来,可以看出:

在生成速度上,文心一言领先远去,其次是ChatGPT,再后是Bard。

在中文理解能力方面,由于每一次回答都不相同,每种角度都会影响输出内容,所以很难做出公正评价。

每个模型都有其局限性,有时会输出错误或废话内容。不过,他们被视为辅助工具存在价值最大化利用场景即便如此,它们仍然无法完全替代人类智慧和直觉。

本篇文章源自DoNews

标签: 科技行业资讯

猜你喜欢