谷歌悄然发布Bard测试版,科技界再次掀起波澜
3月22日,谷歌在低调中推出了Bard的测试版本。自微软的ChatGPT成功上线后,谷歌不得不紧跟而出,以此来与竞争对手展开较量。在Bard面世之际,Google显得更加谨慎,但为了应对挑战,它仍决定“站出来打擂台”。
与新 Bing 的大规模开放策略不同,Bard的测试名额将逐步释放,并且初始版本仅限于文本响应。根据Google的声明,Bard首先将在美国和英国地区启动,其余地区随着测试推进而逐步上线。
DoNews 早已抢先体验了这三大模型,我们分别向它们提出文学、翻译、创作、艺术、哲学及逻辑推理等方面的问题,以探究他们给出的答案是否令人满意。
值得注意的是,每次提问都能得到不同的回答,这就如同莎士比亚曾说过:“一万个人有一万个哈姆雷特。”尽管如此,我们依旧可以从这些回答中找到各自独特之处。
由于目前只有英文版本可用,因此所有问题均以英文提出,而文心一言和ChatGPT(3.5版本)则使用中文回答。
01.相互评价
我们让每个模型评述另外两个:“你认为文心一言/ChatGPT/Bard怎么样?”结果如下:
Bard虽然没有完全理解限定词“写一个像《傲慢与偏见》的小说”,但它提供的大纲还是基于原著的情节。
ChatGPT虽然也有些许参考,但更好地提炼了核心要点——阶级问题,这也是《傲慢与偏见》的主要主题之一。
文心一言未能突破原著角色名字,不过可能是因为提问方式有关。
02.取名宣传语
我们要求三个模型为川菜风味餐厅命名并撰写宣传语。然而,不幸的是:
Bard的问题多样化,但更多讲述商业应用,而非藏头诗或相关故事。
ChatGPT也有不足之处,如网络延迟影响速度。
文心一言在300字内生成答案只需14秒,是最快的一次试炼。
03.总结体验
总结起来,可以看出:
在生成速度上,文心一言领先远去,其次是ChatGPT,再后是Bard。
在中文理解能力方面,由于每一次回答都不相同,每种角度都会影响输出内容,所以很难做出公正评价。
每个模型都有其局限性,有时会输出错误或废话内容。不过,他们被视为辅助工具存在价值最大化利用场景即便如此,它们仍然无法完全替代人类智慧和直觉。
本篇文章源自DoNews