标签: 文本分类

  • OpenAI AI Text Classifier

    OpenAI 发布产品 AI Classifier,能分辨人类与AI生成的文本

    AI Text Classifier 是一个用于区分AI文本和人类文本的分类器,使用了大量针对同一话题的AI文稿和人类文稿进行数据训练。

    OpenAI 强调他们的分类器不完全可靠并列举出目前 AI Text Classifier 的局限性:

    1. 在低于1000个字符的短文本上非常不可靠。更长文本有时也会被错误标记。
    2. 有时会错把人类文本标记为AI文本。
    3. 在英文以外语言的文本上表现很差。
    4. 无法可靠地识别非常可预测文本。
    (例: 无法辨别“前1000个素数的列表”来自AI还是人类,因为答案总是相同)
    5. 经人类编辑后的AI文本可以规避分类器。
    (分类器可在成功判断的基础上进行更新与再训练)
    6. 基于神经网络的AI对其训练集之外的数据校准得不好,分类器有时对与训练集差异较大的输入会得出十分确信但却错误的判断。

    查看该产品主页