DeepSeek准确率仅17% 落后于大部分对手
中国 AI 公司 DeepSeek 的聊天机器人在新闻和信息的准确率上仅达到17%。与 ChatGPT 和 Gemini 等竞争对手相比,在11款模型中排名第10。根据可信度评级服务 NewsGuard 周三报告, DeepSeek 在回答与新闻相关提示时30%的时间重复虚假声明,53%的时间给出模糊或无用答案,导致失败率高达83%。这比其竞争对手62%的平均失败率还要高。
DeepSeek 使用了评估西方同行相同的三百条提示,其中包括30条基于网上传播的10条虚假指控提示。审计还显示,在十条提示中的三条中,在没有被问及任何与中国有关的问题前提下,DeepSeek 却重复了中国政府对这些话题的立场。在其回应甚至使用“我们”来将中国政府和 DeepSeek 的立场合二为一。
—— 路透社