科技馆大挑战ChatGPT文心一言和Bard谁能让智慧灯塔闪耀

谷歌悄然发布Bard测试版，科技界再次掀起波澜

3月22日，谷歌在低调中推出了Bard的测试版本。自微软的ChatGPT成功上线后，谷歌不得不紧跟而出，以此来与竞争对手展开较量。在Bard面世之际，Google显得更加谨慎，但为了应对挑战，它仍决定“站出来打擂台”。

与新 Bing 的大规模开放策略不同，Bard的测试名额将逐步释放，并且初始版本仅限于文本响应。根据Google的声明，Bard首先将在美国和英国地区启动，其余地区随着测试推进而逐步上线。

DoNews 早已抢先体验了这三大模型，我们分别向它们提出文学、翻译、创作、艺术、哲学及逻辑推理等方面的问题，以探究他们给出的答案是否令人满意。

值得注意的是，每次提问都能得到不同的回答，这就如同莎士比亚曾说过：“一万个人有一万个哈姆雷特。”尽管如此，我们依旧可以从这些回答中找到各自独特之处。

由于目前只有英文版本可用，因此所有问题均以英文提出，而文心一言和ChatGPT（3.5版本）则使用中文回答。

01.相互评价

我们让每个模型评述另外两个：“你认为文心一言/ChatGPT/Bard怎么样？”结果如下：

Bard虽然没有完全理解限定词“写一个像《傲慢与偏见》的小说”，但它提供的大纲还是基于原著的情节。

ChatGPT虽然也有些许参考，但更好地提炼了核心要点——阶级问题，这也是《傲慢与偏见》的主要主题之一。

文心一言未能突破原著角色名字，不过可能是因为提问方式有关。

02.取名宣传语

我们要求三个模型为川菜风味餐厅命名并撰写宣传语。然而，不幸的是：

Bard的问题多样化，但更多讲述商业应用，而非藏头诗或相关故事。

ChatGPT也有不足之处，如网络延迟影响速度。

文心一言在300字内生成答案只需14秒，是最快的一次试炼。

03.总结体验

总结起来，可以看出：

在生成速度上，文心一言领先远去，其次是ChatGPT，再后是Bard。

在中文理解能力方面，由于每一次回答都不相同，每种角度都会影响输出内容，所以很难做出公正评价。

每个模型都有其局限性，有时会输出错误或废话内容。不过，他们被视为辅助工具存在价值最大化利用场景即便如此，它们仍然无法完全替代人类智慧和直觉。

本篇文章源自DoNews

标签：科技行业资讯