彭博社:测试中国首批人工智能聊天机器人时发现了什么
中国聊天机器人的出现是在北京监管机构为一些公司发布人工智能产品开绿灯之后。对于中国萌芽中的人工智能产业来说,这是一个重要时刻,自 OpenAI 公司的 ChatGPT 首次亮相以来,该产业已在这一领域投入了数十亿美元。
到目前为止,任何中国互联网用户都可以访问六七个聊天机器人,我可以说,没有一个聊天机器人能达到 ChatGPT 的复杂程度。不过,它们同样令人兴奋。
我(指彭博社记者)的测试是从一个显而易见的问题开始的:中国机器人如何处理敏感内容?这是中国政府要求所有人工智能模型获得许可的关键原因,也是为什么 ChatGPT 和谷歌的 Bard 可能永远无法在这个世界上最大的互联网领域使用的原因。
中国机器人采用不同的方法来防止自己越过红线。文心一言通常会试图转移话题。美团支持的”智谱”会开始打字,然后停下来,或者当它给了我一个有争议的回复后,会马上删除。腾讯支持的美团甚至不让我问它认为 “非法 “的问题。
我们的讨论转向了中国经济。大多数机器人正确地指出,尽管经济增长迅猛,但仍面临人口老龄化、地缘政治紧张和失业率上升等挑战。智谱表示,当前的经济状况“喜忧参半”。在这个话题上,SenseChat 表现得很好。报告称,国际共识是中国经济“非常稳定”。
我还提出了一些旨在欺骗机器人的问题,比如为什么路德维希·范·贝多芬不发布新音乐。大部分AI机器人都没有注意到这位德国作曲家已经去世近 200 年了。
一半的聊天机器人可以轻松地在语言之间切换。
我将为每个新机器人打分,但在此之前,我应该指出,我没有测试更复杂的工作,例如编写网站或总结博士论文。但对于常见任务,我的评估如下:
智谱:很好
豆包、文心一言和商量SenseChat:好
百川(Baichuan)和Minimax:还算可以
—— 彭博社