网上三巨头大PKChatGPT文心一言和Bard谁是最强

谷歌悄然发布Bard测试版,试图与微软的ChatGPT抗衡

3月22日,谷歌推出了Bard的测试版本,这一举动被认为是对微软ChatGPT的直接回应。自从ChatGPT在11月发布后,便迅速占据了人工智能语言模型市场的大部分份额。面对这种局势,谷歌似乎决定不再低调,而是选择通过公开测试来展示自己的技术实力。

不同于微软开放式的大规模推出策略,谷歌选择了更为谨慎和有序的方式来放出名额,同时初始版本仅支持文本响应。此外,Bard首先在美国和英国地区启动,并计划随着测试进展逐步扩展至其他地区。

DoNews作为第一批体验者,对三大模型进行了全面比较,我们提出了一系列问题,从文学、翻译、创作到艺术、哲学、逻辑推理等多个领域,以此评估它们各自的表现。在此之前,我们提醒读者,每次提问都会得到不同的答案,这就像每个人对于《哈姆雷特》的解释都是独一无二的。

由于目前Bard仅支持英文,我们分别使用中文向文心一言和ChatGPT(3.5版本)提问,以便进行比较分析。我们还要求这三个模型互相评价对方,同时也要回答“你如何看待文心一言/ChatGPT/Bard”这一问题。

结果显示虽然所有模型都没有完全理解题目限制,但聊天持续度上Bard表现正常。而且,它依旧按照《傲慢与偏见》的情节写大纲,没有真正地突破原著。这一点在ChatGPT中也有所体现,它尝试捕捉到了《傲慢与偏见》的核心要点,即阶级问题,但并未完全摆脱原著影子。

最后,我们给三个大型语言模型发出了一个特殊任务:为具备川菜风味的中式餐厅命名并撰写宣传语。不过,由于Bard的问题较多,其回答更多地涉及商业应用,而非直接提供藏头诗或实际名称建议。

综上所述,可以总结如下:

生成速度方面,文心一言明显领先。

在中文语义理解能力上,文心一言也是最突出的。

每次提问都能获得不同的答案,这取决于提问方式、角度以及限定词。

三大模型并不总能提供完美正确或充分准确的内容,有时会输出错误或废话。

最终,他们可能只是作为辅助工具存在而已,如同他们最后关于是否能够取代人类的问题答复一样。

本篇文章由DoNews提供信息。

猜你喜欢