标签: 多模式

  • Meta推出新多模式AI翻译模型 SeamlessM4T

    Meta 推出 SeamlessM4T,一种用于语音和文本翻译的多模式 AI 模型。

    Meta周二发布了 SeamlessM4T,这是一个新的多模式和多语言 AI ​​翻译模型,可以让说不同语言的人更有效地进行交流。

    M4T 可以进行多达 100 种语言的语音到文本、文本到语音、语音到语音、文本到文本翻译和语音识别。

    SeamlessM4T将使用研究许可证公开发布,以便研究人员和开发人员在此基础上开展工作。

    Meta还将公布 SeamlessAlign 的元数据,这是迄今为止最大的开放多模式翻译数据集,挖掘的语音和文本对齐总计达 270,000 小时。

    随着时间的推移,Meta将把这些翻译和转录方面的 AI 进展整合到Facebook、Instagram、WhatsApp、Messenger和Threads中。

    —— Meta博客 、Github