微闻

标签: 生成

  • 电商平台治理AI生成虚假图片

    电商平台治理AI生成虚假图片

    近日,电商平台首次针对AI生成的虚假图片问题出台相关治理措施。淘宝正式宣布启动全平台AI假图治理行动,重点打击利用人工智能技术合成显著失真的商品效果图等违规行为。

    根据新规,淘宝明确规定禁止使用AI等技术手段呈现与实际商品严重不符的信息效果图,以保护消费者知情权和商家权益。平台特别指出四种典型的违规场景:商品材质或款式与实物明显不符的”货不对板”、商品效果过度夸大或失真、明显的抠图拼接痕迹,以及违背物理规律的人体或场景展示。

    为应对这一新型电商痼疾,淘宝采取了多项治理措施:首先通过上线AI识别模型实现源头拦截;其次对存量违规图片进行全面清理;最后在商品页面设置标识提醒消费者注意辨别。这些举措将有助于遏制AI假图的蔓延,维护良好的网购环境。

    此次治理行动体现了电商平台对技术滥用问题的高度关注。尽管鼓励人工智能技术合理应用,但淘宝明确要求图片修饰必须适度,避免过度滤镜和失真处理。这一系列措施旨在平衡技术创新与消费者权益保护的关系,为电商行业健康发展提供了有益借鉴。

  • 阿里万相视频生成大模型开源

    阿里旗下万相视频生成大模型宣布开源

    阿里云旗下视觉生成基座模型万相2.1(Wan)宣布开源,开源采用的Apache2.0协议,14B和1.3B两个参数规格的全部推理代码和权重全部开源,同时支持文生视频和图生视频任务。据介绍,14B万相模型在指令遵循、复杂运动生成、物理建模、文字视频生成等方面表现突出,在权威评测集VBench中,万相2.1以总分86.22%的成绩超越Sora、Luma、Pika等国内外模型,稳居榜首位置。1.3B版本测试结果不仅超过了更大尺寸的开源模型,甚至还接近部分闭源模型,同时能在消费级显卡运行,仅需8.2GB显存就可以生成高质量视频,适用于二次模型开发和学术研究。

    —— Github、HuggingFace、魔搭社区

  • 谷歌Gemini将新增视频生成功能

    谷歌 Gemini 助理或将新增视频生成功能

    谷歌一直在为其人工智能数字助理 Gemini 添加功能。我们已经看到了一些功能,这些功能增加了更深层次的上下文,简化了文件处理,甚至可以跨应用链接。近期 Google 移动应用中包含代码显示,谷歌正在开发一项视频生成功能,可能会在未来的更新中添加到 Gemini 中。Google 应用 v16.6.23 包含的代码暗示谷歌将为 Gemini 添加视频生成功能。代码显示,“robin”旁边提到了“videogen”,而“robin”正是谷歌应用中 Gemini 的代号。此功能尚未上线,其发布日期尚不确定。

    —— AndroidAuthority

  • 英伟达显示了可以生成音乐和音频的模型

    英伟达展示了可以生成音乐和音频的模型

    英伟达11月25日展示了一款用于生成音乐和音频的人工智能模型 Fugatto。该模型可以根据文本提示修改声音、产生新的声音。不过英伟达目前没有公开发布 Fugatto 技术。新模型面向音乐、电影和游戏制作商。可以改变录音的口音和情绪,将钢琴演奏转换成人声歌唱,具体来讲,Fugatto 可以分离歌曲中的人声,添加乐器,将钢琴换成歌剧歌手来改变旋律。英伟达表示,新模型可以创造出“从未听过的声音”,比如可以使小号吠叫或者萨克斯发出猫叫声。英伟达表示目前仍在讨论是否以及如何将其公开发布。

    —— 澎湃新闻、Fugatto

  • 谷歌使用人工智能生成代码

    谷歌超过四分之一的新代码由人工智能生成

    谷歌公司正在开发一系列人工智能产品,并且在开发这些产品的过程中也大量使用人工智能。首席执行官皮查伊在公司2024年第三季度财报电话会议上表示:“谷歌超过四分之一的新代码是由人工智能生成的,然后由工程师审查和接受。Alphabet 报告本季度营收为883亿美元,其中谷歌服务 (包括搜索) 营收为765亿美元,同比增长13%,谷歌云 (包括为​​其他公司提供的人工智能基础设施产品) 营收为114亿美元,同比增长35%。谷歌服务营业利润 (Operating incomes) 达到309亿美元,高于去年的239亿美元;谷歌云营业利润达到19.5亿美元,远高于去年的2.7亿美元。

    —— The Verge

  • AI 生成图片比赛中的混淆

    AI 生成图片比赛中的混淆

    一张真实照片在 AI 生成图片比赛中获奖

    摄影师 Miles Astray 向享有盛誉的 1839 摄影奖的 AI 类别提交了一张照片。他的作品名为“F L A M I N G O N E”,最终获得了评委类别的铜奖和人民投票奖。唯一的问题是,这幅作品不是 AI 生成的,而是一张真正的火烈鸟的照片。

    由于该作品上传申报时并未披露其为真实摄影作品,并不符合该类别的要求,该组织现在已经撤销了该作品获得的两个奖项,并改为授予其“荣誉提名”。该组织和摄影作者都表示,该事件证明了艺术和现实世界在技术面前依然有独特的优势,该事件也将让更多人认识到这一点。

    —— Android Authority

  • Adobe Lightroom 添加人工智能生成移除工具

    Adobe Lightroom 获得基于人工智能的生成移除工具

    Adobe 正在向 Lightroom 添加一些新的生成式人工智能工具,使用基于 Adobe Firefly 生成式人工智能技术的“生成式移除”功能,可轻松移除相片中不要的物件和干扰。使用笔刷遮色片识别并强调显示物件后,Adobe Firefly 会自动将其移除,并产生与画面其他部分混合的填充内容。Adobe 还添加“镜头模糊”功能,为相片增加美学模糊效果。可快速为相片增加美学模糊与散景效果,以获得专业的外观。可以批次复制贴上“镜头模糊”设置,以获得一致的外观。

    —— Adobe

  • 苹果公司针对人工智能生成裸照应用进行行动

    苹果公司在媒体调查后删除了恶意的人工智能深度伪造应用

    当媒体 404media 发现这些应用宣传其能够创建未经同意的裸照后,苹果从 App Store 中下架了多款人工智能图像生成应用,这表明应用商店运营商开始对此类应用采取更多行动。苹果下架了三款应用,但前提是媒体向该公司提供了具体应用的链接及其相关广告,这表明该公司自己无法找到违反其政策的应用。在苹果采取行动之前,404media 于4月22日报道称 Instagram 广告宣传了未经同意的人工智能裸照应用。当 404media 举报这些广告时,Meta 删除了这些广告。苹果最初没有回应对此事发表评论的请求,但在报道发表后联系了 404media,要求提供更多信息。苹果4月23日表示,他已从 App Store 中删除了这三款应用。

    —— 404media

  • Meta扩大AI生成内容标记范围

    Meta 将扩大 AI 生成内容的标记范围而非直接删除它们

    从 5 月开始,Meta 会开始将更多视频、音频和图片内容标记为“AI 生成”。Meta 承认其当前的标签政策“过于狭隘”,需要更强大的系统来处理当今更多 AI 生成的内容和其他被操纵的内容。标签可以通过用户发布内容时的自我披露来生成,也可以根据事实核查人员的建议生成,或者通过 Meta 检测人工智能内容的隐形标记来生成。

    “我们会将这些内容保留在我们的平台上,以便我们可以添加标签和背景,” 该公司认为增加透明度比审查内容更好。但 Meta 将会“删除内容,无论它是由 AI 还是人类创建的,只要它违反了我们反对选民干预、欺凌和骚扰、暴力和煽动的政策或任何其他政策。”

    —— Axios,Meta

  • Adobe推出人工智能音乐生成工具

    Adobe 推出人工智能音乐生成工具

    在布鲁克林的 Hot Pod 峰会上,Adobe 推出了一款名为“Project Music GenAI Control”的人工智能音乐创作工具。该工具可以根据文本描述,例如“快乐的舞蹈”,“悲伤的爵士乐”来生成指定风格的音乐。通过工具内置的编辑控制器,用户还可以调整重复模式、速度、强度和结构。该工具尚未向公众开放,并且尚未公布正式发布日期。

    —— Adob​​e 博客