谷歌推出下一代 AI 模型 Gemini1.5
谷歌 CEO 皮查伊表示,我们已经准备好推出下一代 AI 模型 Gemini 1.5。它在许多方面都有显著的改进,1.5 Pro 达到了与 1.0 Ultra 相当的质量,同时使用了更少的计算。新一代模型在长上下文理解方面也取得了突破。从今天开始,开发人员和企业客户可以注册有限的私人预览版。
—— 皮查伊推特、谷歌博客
谷歌推出下一代 AI 模型 Gemini1.5
谷歌 CEO 皮查伊表示,我们已经准备好推出下一代 AI 模型 Gemini 1.5。它在许多方面都有显著的改进,1.5 Pro 达到了与 1.0 Ultra 相当的质量,同时使用了更少的计算。新一代模型在长上下文理解方面也取得了突破。从今天开始,开发人员和企业客户可以注册有限的私人预览版。
—— 皮查伊推特、谷歌博客
阿里巴巴的图像转视频模型在本周迅速走红,它抓取 TikTok 视频进行训练
中国零售和科技巨头阿里巴巴的研究团队本周发布了一篇论文,详细介绍了一种新模型,他们称之为“Animate Anybody”。网上对此的普遍反应是「RIP TikTokers」,暗示舞蹈类 TikTok 内容创作者将很快被人工智能取代。
该模型在接受输入「在他们的示例中为 TikTok 舞蹈视频」并创建一个新版本作为输出。其结果比之前尝试的类似模型略好。
阿里巴巴研究人员在论文中写道,他们使用的是“TikTok 数据集,包括 340 个训练和 100 个测试的单人舞蹈视频 (长 10-15 秒)”。该数据集源自明尼苏达大学 2021 年的一个项目“通过观看社交媒体舞蹈视频学习着装人类的高保真深度”,该项目概述了一种“人体深度估计和人体形状恢复方法”的技术,例如使用 AI 给视频中的某人穿上新衣服。
—— 404 Media
Stability AI发布最新图像生成模型Stable Diffusion XL 1.0
今天,Stability AI 宣布推出 Stable Diffusion XL 1.0,这是该公司迄今为止描述为“最先进”的文本到图像模型。Stable Diffusion XL 1.0 可在 GitHub 上以开源形式使用,并提供给 Stability 的 API 和消费者应用程序 ClipDrop 和 DreamStudio。Stability 声称,与其前代产品相比,Stable Diffusion XL 1.0 提供了“更生动”和“更准确”的颜色,更好的对比度、阴影和照明效果。
在接受采访时,Stability AI 的应用机器学习负责人Joe Penna 指出,Stable Diffusion XL 1.0 包含 35亿个参数,可以“在几秒钟内”生成多种长宽比的 100万像素分辨率的完整图像。“参数”是模型从训练数据中学习到的部分,基本上定义了模型在解决问题上的技能水平。
上一代稳定扩散模型稳定扩散 XL 0.9 也可以生成更高分辨率的图像,但需要更多的计算能力。
—— techcrunch 、 Stability AI
研究表明用AI产生的语料来训练AI将使其退化并最终崩溃
现在,随着越来越多的人使用 AI 来制作和发布内容,一个明显的问题出现了:当 AI 生成的内容在互联网上激增并且 AI 模型开始用其进行训练,而不是使用主要人类生成的内容时,会发生什么?
来自英国和加拿大的一组研究人员已经研究了这个问题,并且最近在开放获取期刊 arXiv 上发表了一篇关于他们工作的论文。他们的发现令当前的生成式 AI 技术及其未来令人担忧:“我们发现在训练中使用模型生成的内容会导致生成的模型出现不可逆转的缺陷。”
研究人员专门研究了文本到文本和图像到图像 AI 生成模型的概率分布,得出结论:“从其他模型生成的数据中学习会导致模型崩溃——一个退化过程,随着时间的推移,模型会忘记真正的底层数据分布……这个过程是不可避免的,即使对于具有近乎理想的长期学习条件的情况也是如此。”
“随着时间的推移,生成数据中的错误会复合并最终迫使从生成数据中学习的模型进一步错误地感知现实,”该论文的主要作者之一 Ilia Shumailov 在给 VentureBeat 的电子邮件中写道。“我们惊讶地观察到模型崩溃发生的速度有多快:模型可以迅速忘记他们最初从中学习的大部分原始数据。”
换句话说:当 AI 训练模型接触到更多 AI 生成的数据时,它的性能会随着时间的推移而变差,在其生成的响应和内容中产生更多错误,并在其响应中产生更少的非错误多样性。
—— VentureBeat
额外编辑:研究人员同样担忧,目前互联网上AI生成内容正在迅速增加,训练下一代ai的数据正在被迅速污染。
阿里巴巴正式推出类似 GPT 的 AI 模型通义千问
上海,4 月 11 日(路透社)——阿里巴巴集团控股有限公司周二推出了通义千问,这是一种类似于 GPT 的 AI 大语言模型,计划在不久的将来集成到公司的所有业务应用程序中。
它将首先集成到阿里巴巴的职场消息应用钉钉中,可用于总结会议记录、撰写电子邮件和起草商业计划书。 它还将被添加到阿里巴巴的语音助手天猫精灵中。
“我们正处于由生成人工智能和云计算驱动的技术分水岭时刻,各行各业的企业已经开始拥抱智能转型以保持领先地位,”首席执行官张勇在一份声明中表示。
阿里巴巴股价早盘上涨 3%。
阿里云计划向其客户开放通义千问,以便他们可以构建自己定制的大型语言模型。
—— 路透社