Gmail中的新矢量算法

作者：

在

Gmail中部署的新矢量算法将大幅度提高垃圾和钓鱼邮件的识别率

Google最近在 Google Colab 上开源了一个名为 RETVec 的新型多语言文本矢量化器，这个矢量化器已经部署在 Gmail 上，用来提升垃圾邮件和钓鱼邮件的识别率，同时降低误报率。

为什么要训练这样一种模型呢？因为 Gmail 每天收发的邮件都在千万级别，如果包含各类垃圾邮件的话可能有几十亿，而垃圾邮件制造者会对Google的检测系统进行规避，例如使用同形字。

根据Google自己的统计，将 RETVec 应用到 Gmail 后，垃圾邮件检测率比基准提高 38%、误报率降低 19.4%、张量处理单元 (TPU) 使用率降低了 83%。

—— cnBeta

gmail 矢量算法

更多文章

评论

发表回复取消回复