Meta 推出 SeamlessM4T,一种用于语音和文本翻译的多模式 AI 模型。
Meta周二发布了 SeamlessM4T,这是一个新的多模式和多语言 AI 翻译模型,可以让说不同语言的人更有效地进行交流。
M4T 可以进行多达 100 种语言的语音到文本、文本到语音、语音到语音、文本到文本翻译和语音识别。
SeamlessM4T将使用研究许可证公开发布,以便研究人员和开发人员在此基础上开展工作。
Meta还将公布 SeamlessAlign 的元数据,这是迄今为止最大的开放多模式翻译数据集,挖掘的语音和文本对齐总计达 270,000 小时。
随着时间的推移,Meta将把这些翻译和转录方面的 AI 进展整合到Facebook、Instagram、WhatsApp、Messenger和Threads中。
—— Meta博客 、Github
发表回复