微闻

标签: 图像生成

  • OpenAI GPT-4o成ChatGPT默认图像生成模型

    OpenAI GPT-4o成ChatGPT默认图像生成模型

    OpenAI在图像生成领域取得重大突破:其人工智能系统GPT-4o现已升级为ChatGPT的默认图像生成模型,取代了之前的DALL-E 3。这一成果是经过与人类培训师一年的合作开发实现的。

    新的GPT-4o版本能够生成更逼真的图像,并且支持文本、视频、音频和图像等多种模态内容的处理。它不仅适用于个人用户,还包括团队版和Pro版等企业级服务,用户可以免费体验这一功能。值得注意的是,该模型尤其擅长创建清晰段落化的文本内容。

    GPT-4o去年首次亮相时就被视为当时最先进的人工智能模型之一,并因其多模态能力而备受关注。如今经过升级优化后,它使得消费者和企业能够更便捷地生成高质量图像,甚至可以用于制作公司徽标和幻灯片等专业需求。

    这一技术突破是生成式人工智能快速发展的缩影。自2020年以来,以ChatGPT和生成扩散模型为代表的人工智能技术取得了显著进展,不仅推动了技术进步,也为经济和社会发展带来了深远影响。

    可以预见,在OpenAI的持续探索下,生成式人工智能将在更多领域展现其潜力,为人类社会创造更大价值。

  • xAI发布新API支持图像生成

    马斯克旗下xAI推出图像生成API服务

    近日,人工智能公司xAI在其公开的API接口中新增了图像生成功能。目前,该API中唯一支持图像生成的模型是“grok-2-image-1212”,用户可以通过输入提示指令来触发模型生成图片。

    每次请求最多可生成10张JPG图片,但每秒最高允许请求5次,每张图片的成本为0.07美元。值得注意的是,当前API并不支持调整生成图片的质量、大小或样式,这些功能的实现还需等待未来的更新。

    此次推出图像生成服务并非xAI的首次尝试。自2024年10月推出其公开API以来,xAI便已通过加强训练和开发旗舰模型Grok 3来探索新的收入增长点。此外,公司还 recent收购了一家专注于生成式AI视频的内容制作公司,并计划通过扩建位于孟菲斯的数据中心来提升其对各种模型的训练与运行能力。

    未来,xAI希望通过这些新方向进一步巩固其在AI服务领域的领先地位。

  • ChatGPT 拒绝了超过25万张总统候选人图像生成请求

    ChatGPT 拒绝了25万张总统候选人图像生成

    OpenAI 公司在周五的博客中表示,该公司估计,聊天机器人 ChatGPT 在选举日之前拒绝了超过25万个生成2024年美国总统候选人图像的请求。OpenAI 表示,被拒绝的请求包括涉及当选总统唐纳德·特朗普、副总统卡马拉·哈里斯、总统乔·拜登、明尼苏达州州长蒂姆·沃尔兹和当选副总统J·D·万斯的图像生成请求。OpenAI 表示,尚未发现任何证据表明,利用该公司产品影响美国大选结果的秘密行动能够成功传播或吸引“持续的受众”。议员特别关注生成式人工智能时代的错误信息,该时代于2022年底随着 ChatGPT 的推出而开始腾飞。大型语言模型仍是新兴事物,并且经常会输出不准确和不可靠的信息。

    —— CNBC

  • OpenAI推出检测DALL-E 3图像的工具

    OpenAI 将推出检测 DALL-E 3 图像的工具

    当地时间5月7日,人工智能公司 OpenAI 宣布推出一款工具,可以检测其文本转图像生成器 DALL-E 3 创建的图像。该公司表示,该工具在内部测试中大约 98% 的时间都能正确识别 DALL-E 3 创建的图像,并且可以处理压缩等常见的修改,裁剪和饱和度变化对识别的影响极小。OpenAI 还计划添加防篡改水印,以难以删除的信号标记照片或音频等数字内容。

    此外,Dotdash Meredith 已与 OpenAI 签署了内容许可协议,以训练人工智能模型,并允许 ChatGPT 使用美国最大的数字和印刷出版商的摘要来回答查询。Dotdash Meredith 是美国最大的数字和印刷出版商,作为一家品牌管理公司,旗下有包括《人物》、《美好住宅与庭院》、《Verywell》等在内的40多个品牌。

    —— 路透社、路透社

  • WhatsApp 实时人工智能图像生成测试推出

    WhatsApp 新增实时人工智能图像生成功能

    Meta 公司正在为美国的 WhatsApp 用户推出实时人工智能图像生成测试版。在与 Meta AI 的聊天中,只要在聊天中输入文本到图像的提示,就会看到图像在添加有关要创建的内容的更多详细信息时的变化。此外,Meta 公司表示,其 Meta Llama 3 模型现在可以生成“更清晰、更高质量”的图像,并且更擅长显示文本。您还可以让 Meta AI 为您提供的任何图像制作动画,让您将它们转换为 GIF 与朋友分享。除了 WhatsApp 上的功能之外,美国用户还可以通过 Meta AI 网页版来使用实时图像生成功能。

    —— TheVerge

  • Meta Imagine AI 图像生成器產生历史錯誤

    Meta 的 Imagine AI 图像生成器也产生了和谷歌 Gemini 同样的历史错误

    Meta 的 Imagine AI 图像生成器正在产生历史错误,生成了大量不符合历史的图像。同样的问题导致谷歌两周前停止了 Gemini 聊天机器人中所有人类图像的生成。人工智能制造商正试图通过调高“多样性”设置来消除用于训练模型的数据中的偏见和刻板印象,但他们过度纠正并产生了有问题的结果。

    截止周五测试时, Imagine 没有响应“教皇”提示语,但当询问一组教皇时,它显示了黑人教皇。许多开国元勋的形象都包含了不同的群体。提示语“美国殖民时代的一群人”产生的是一群亚洲女性。“职业美式橄榄球运动员”的提示只显示了穿着橄榄球队服的女性照片。

    —— Axios

  • DALL-E 3 添加新的水印

    OPENAI 正在为 DALL-E 3 添加新的水印

    OPENAI 的图像生成器 DALL-E 3 将在图像元数据中添加水印,,以帮助用户识别人工智能生成的内容。该公司表示,C2PA 的水印将出现在 ChatGPT 网站和 DALL-E 3 模型的 API 生成的图像中。移动用户将于2月12日之前获得水印。它们将包含不可见的元数据组件和可见的 CR 符号,该符号将出现在每个图像的左上角。

    —— TheVerge

  • DALL-E 3 将添加 C2PA 水印

    DALL-E 3 将添加 C2PA 水印

    OPENAI 正在为 DALL-E 3 添加新的水印

    OPENAI 的图像生成器 DALL-E 3 将在图像元数据中添加水印,,以帮助用户识别人工智能生成的内容。该公司表示,C2PA 的水印将出现在 ChatGPT 网站和 DALL-E 3 模型的 API 生成的图像中。移动用户将于2月12日之前获得水印。它们将包含不可见的元数据组件和可见的 CR 符号,该符号将出现在每个图像的左上角。

    —— TheVerge

  • 谷歌推出人工智能图像生成器ImageFX

    谷歌宣布推出人工智能图像生成器 ImageFX

    当地时间2月1日,谷歌在博客文章中宣布推出了一款全新的图像生成工具 ImageFX,新工具由 Imagen 2 (谷歌 DeepMind 的最新文本到图像模型) 提供支持,可以通过简单的文字提示来创建高质量的图像。

    🗿用户可以在此体验:链接

    —— 谷歌博客

  • Meta 推出独立的人工智能图像生成器

    Meta 推出独立的人工智能图像生成器,目前免费但只支持英文提示词

    Meta 在网页上推出了一种新的、独立的生成式人工智能体验「Imagine with Meta」,它允许用户通过用自然语言描述图像来创建图像。

    新的人工图像生成器由 Meta 现有的 Emu 图像生成模型提供支持,可根据文本提示创建高分辨率图像。

    它目前对美国的英语用户免费使用,并且每个提示都会生成四个图像。

    —— META