Gmail中部署的新矢量算法将大幅度提高垃圾和钓鱼邮件的识别率
Google最近在 Google Colab 上开源了一个名为 RETVec 的新型多语言文本矢量化器,这个矢量化器已经部署在 Gmail 上,用来提升垃圾邮件和钓鱼邮件的识别率,同时降低误报率。
为什么要训练这样一种模型呢?因为 Gmail 每天收发的邮件都在千万级别,如果包含各类垃圾邮件的话可能有几十亿,而垃圾邮件制造者会对Google的检测系统进行规避,例如使用同形字。
根据Google自己的统计,将 RETVec 应用到 Gmail 后,垃圾邮件检测率比基准提高 38%、误报率降低 19.4%、张量处理单元 (TPU) 使用率降低了 83%。
—— cnBeta
发表回复