标签: 音频

  • 英伟达显示了可以生成音乐和音频的模型

    英伟达展示了可以生成音乐和音频的模型

    英伟达11月25日展示了一款用于生成音乐和音频的人工智能模型 Fugatto。该模型可以根据文本提示修改声音、产生新的声音。不过英伟达目前没有公开发布 Fugatto 技术。新模型面向音乐、电影和游戏制作商。可以改变录音的口音和情绪,将钢琴演奏转换成人声歌唱,具体来讲,Fugatto 可以分离歌曲中的人声,添加乐器,将钢琴换成歌剧歌手来改变旋律。英伟达表示,新模型可以创造出“从未听过的声音”,比如可以使小号吠叫或者萨克斯发出猫叫声。英伟达表示目前仍在讨论是否以及如何将其公开发布。

    —— 澎湃新闻、Fugatto

  • 安卓 16 将如何改变音频输入设备选择

    安卓 16 将如何改变音频输入设备选择

    安卓 16 可能会添加系统级音频输入切换

    Android 16 可能会在媒体切换器对话框中添加一个新部分,让用户可以更改所有应用的音频输入设备。智能手机内置的麦克风无法满足专业录音需求,这时就需要外置麦克风了。遗憾的是,部分安卓应用不支持选择外部麦克风,但 Android 16 可以通过引入系统范围的音频输入切换器来改变这种情况。如上图所示,用户可以方便地选择所需的音频输入设备。

    —— Android Authority

  • Google 推出 AI 功能让文档转化成音频播客

    Google 推出将用户文档转化为音频播客的 AI 功能

    Google 周三宣布,其人工智能笔记和研究应用 NotebookLM 将添加“音频概览”功能,为用户提供另一种方式来消化和理解他们上传到该应用的文档中的信息,例如课程阅读材料或法律摘要。此前该应用已经可以使用文字的方式帮助用户简化复杂内容。

    AI 生成的两位虚拟主持人将使用对话式的语音模式为用户总结其分享的材料。主持人将分享来自源材料的事实或引人注目的话题,并使用隐喻来解释复杂的概念。谷歌表示,聆听这些讨论将帮助用户找到文档之间的新联系或为他们的草稿获得灵感。

    —— TechCrunch

  • Spotify推出播客评论区

    音乐流媒体 Spotify 推出播客评论功能

    Spotify 正在通过推出播客评论区来缩小播客与听众之间的差距,评论区将于今日开始出现在播客节目中。听众在听完节目后,可以通过滚动播放控件或导航到节目页面来找到该服务的新评论区。发布评论时,所有帖子默认为私密,创建者可以完全控制其页面上显示的评论。他们有权发布或取消发布他们想要的任何回复。如果他们没有时间这样做,他们可以只为特定节目启用评论,或者完全退出该功能。

    —— Techcrunch、Engadget、TheVerge

  • Tidal 创新音频格式改进计划

    Tidal 正在改进其无损和沉浸式音频格式

    Tidal 正在对其音频格式进行调整。从7月24日开始,Tidal 将不再支持 Master Quality Authenticated (MQA) 和 360 Reality Audio 格式。未来,该流媒体服务表示 FLAC 将成为立体声的默认格式,而杜比全景声将成为沉浸式音效的首选格式。根据 Tidal 的常见问题解答,这些格式决定似乎是出于优先考虑访问和成本。例如,该流媒体表示之所以选择杜比全景声,是因为它具有广泛的“兼容设备、目录可用性和艺术家对该格式的采用”。

    —— TheVerge

  • android15将引入媒体音频共享

    Android 15 准备让你与附近的设备共享媒体音频

    Auracast 是蓝牙 LE 音频标准的一项功能,可将音频广播到附近无限数量的设备。当你想与朋友一起听音乐时,可通过 Auracast 共享给朋友,无需配对的麻烦。但广播器和接收器设备必须支持 Auracast 才能使此功能发挥作用。谷歌在 Android 13 中添加了对蓝牙 LE 音频的基本支持,包括对启动和连接音频流的支持。Android 15 可能会有一个专门的音频共享页面,在“设置”>“连接的设备”>“连接首选项”下,这表明 Auracast 可能是新操作系统的一个关键功能。

    —— Androidauthority