Meta推出新多模式AI翻译模型 SeamlessM4T

Meta 推出 SeamlessM4T,一种用于语音和文本翻译的多模式 AI 模型。

Meta周二发布了 SeamlessM4T,这是一个新的多模式和多语言 AI ​​翻译模型,可以让说不同语言的人更有效地进行交流。

M4T 可以进行多达 100 种语言的语音到文本、文本到语音、语音到语音、文本到文本翻译和语音识别。

SeamlessM4T将使用研究许可证公开发布,以便研究人员和开发人员在此基础上开展工作。

Meta还将公布 SeamlessAlign 的元数据,这是迄今为止最大的开放多模式翻译数据集,挖掘的语音和文本对齐总计达 270,000 小时。

随着时间的推移,Meta将把这些翻译和转录方面的 AI 进展整合到Facebook、Instagram、WhatsApp、Messenger和Threads中。

—— Meta博客 、Github

更多文章

评论

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注