微闻

标签: 模型

  • 阿里巴巴开源视频模型万相2.1

    阿里巴巴将开源旗下文生视频模型万相2.1

    从知情人士处获悉,阿里巴巴将于今日晚间全面开源旗下视频生成模型万相2.1模型。今年1月,阿里旗下万相刚宣布推出2.1 版本模型升级,视频生成、图像生成两大能力均获得提升。在视频生成方面,万相 2.1 通过自研的高效VAE和DiT架构增强了时空上下文建模能力,支持无限长1080P视频的高效编解码,首次实现了中文文字视频生成功能,登上VBench榜单第一。据此前介绍,万相2.1支持中英文视频,可以一键生成艺术字,还提供多种视频特效选项,以增强视觉表现力,例如过渡、粒子效果、模拟等。

    —— 新浪科技

  • 谷歌 AI 视频生成模型的定价

    谷歌 AI 视频生成模型 Veo 2 每分钟30美元

    谷歌悄然公布了其去年12月发布的视频生成 AI 模型 Veo 2 的定价。根据该公司的定价页面,使用 Veo 2 的成本为每秒50美分,换算下来,每分钟的费用为30美元,每小时则高达1800美元。DeepMind 研究员乔恩·巴伦将这一定价与漫威大片《复仇者联盟四:终局之战》进行了对比。后者据称制作成本高达 3.56 亿美元,平均每秒的成本大约为3.2万美元。另一种价格比较:OpenAI 公司最近向每月支付两百美元订阅 ChatGPT Pro 的订阅者提供了其 Sora 视频生成模型。

    —— Techcrunch

  • GPT-4.5 和 GPT-5 模型的推出计划

    微软正在为 OpenAI 的 GPT-5 模型做准备

    据了解公司计划的知情人士透露,微软工程师目前正在为 OpenAI 即将推出的 GPT-4.5 和 GPT-5 模型准备服务器容量。虽然 OpenAI 首席执行官 Sam Altman 最近承认 GPT-4.5 将在几周内推出,但据了解,微软预计最早下周就能托管这个新的 AI 模型。GPT-4.5 代号为 Orion,是 OpenAI 的下一个前沿模型,也是公司的最后一个非思维链模型。OpenAI 已经透露 GPT-4.5 可能比 GPT-4 强大得多,但该公司也在展望其 GPT-5 模型,其中将包含更多重大变化。微软公司预计 GPT-5 将在五月底发布,这与 Sam Altman 此前承诺的下一代模型将在几个月内到来相符。

    —— The Verge

  • 谷歌人工智能负责人对 DeepSeek 模型的态度

    谷歌人工智能负责人告诉员工,公司拥有“所有要素”足以保持领先于 DeepSeek

    在全体员工会议上,Alphabet 首席执行官皮查伊朗读了一个 AI 总结的员工提交问题,询问谷歌在训练未来模型时可以从 DeepSeek 的成功中“汲取哪些教训和启示”。被指名回答的谷歌 DeepMind 首席执行官哈萨比斯说,“当你深入了解细节时,关于 DeepSeek 的一些说法是夸大其词。实际上,我们的模型比 DeepSeek 更高效、性能更好。因此,我们对我们的战略非常冷静和自信,我们拥有在今年保持领先地位的所有要素。”但他承认 DeepSeek 的成就令人印象深刻。“我认为,这绝对是我见过的来自中国的最好的团队,所以值得认真对待,”哈萨比斯说,并指出这有“安全”和“地缘政治”影响。

    —— CNBC

  • 百度将文心下一代模型正式开源

    百度:文心下一代模型6月30日起正式开源

    百度公众号今日宣布:将在未来几个月中陆续推出文心大模型4.5系列,并于6月30日起正式开源。百度昨日还宣布,随着文心大模型的迭代升级和成本不断下降,文心一言将于4月1日0时起全面免费,所有PC端和APP端用户均可体验文心系列最新模型,以及超长文档处理、专业检索增强、高级AI绘画、多语种对话等功能。还透露即日起上线深度搜索功能,具备更强大的思考规划和工具调用能力,可为用户提供专家级内容回复,并处理多场景任务,实现多模态输入与输出。

    —— 新华社、百度

  • 埃隆·马斯克称赞他的新ChatGPT模型即将推出

    马斯克称 xAI 的 Grok 3 模型将在几周内推出

    埃隆·马斯克称赞他即将推出的 Grok 3 聊天机器人是迄今为止发布的所有人工智能模型中表现最优的,并表示全世界将在几周内看到它。亿万富翁企业家、现任美国总统特朗普的亲密顾问马斯克周四在迪拜世界政府峰会的视频会议上表示:“有时我觉得 Grok 3 聪明吓人。”马斯克表示,他旗下公司 xAI 即将推出的模型是使用合成数据训练的,并且能够通过反复检查数据来反思自己所犯错误,以期实现逻辑一致性。马斯克表示:“​我们实际上正处于 Grok 3 的最后完善阶段,将在大约一到两周内发布,所以会很快推出,”并补充说他不想“草率”地发布该模型。

    —— 彭博社

  • OpenAI 计划发布新人工智能模型

    OpenAI 计划在几周内发布 GPT-4.5 模型

    OpenAI首席执行官阿尔特曼周三在X平台上发帖称,Orion即该公司内部对一个已开发二十多个月的新人工智能模型的代号将不会像预期的那样成为该公司的下一个飞跃。阿尔特曼表示,该模型将在几周内发布,并将被命名为GPT-4.5,这表明它是对GPT-4的一次适度更新。阿尔特曼表示,GPT-5将整合Orion和名为o3的模型,后者目前处于预览阶段,它使用推理过程来回答问题。阿尔特曼表示,GPT-5将在“几个月内”发布,并将提供给ChatGPT的免费版本,不过付费使用高级版本的用户将能够获得“更高水平的智能”。

    —— 华尔街日报

  • 中国百度将发布下一代人工智能模型

    中国百度今年将发布下一代人工智能模型

    据知情人士透露,随着 DeepSeek 等新玩家正在颠覆这一领域,中国百度计划在今年下半年发布下一代人工智能模型。文心5.0被称为“基础模型”,将“在多模态能力方面有重大增强”,但没有具体说明其功能。“多模态”人工智能可以处理文本、视频、图像和音频等不同形式的数据,并进行转换和结合,比如将文本转化为视频,或反向操作。百度李彦宏本周在迪拜的世界政府峰会上说:“我们正处于一个令人激动的时代…12 个月内,基础模型的推理成本预计将下降90%以上。如果成本能够大幅降低,意味着生产力将呈同等比例提升。这也正是创新的核心所在。”

    —— CNBC

  • OpenAI 将 o3-mini 模型的思维过程透露

    OpenAI 披露更多 o3-mini 模型思维过程

    为了应对包括中国人工智能公司深度求索在内的竞争对手的压力,OpenAI 正在改变其最新人工智能模型 o3-mini 传达其“逐步”思考过程的方式。周四,OpenAI 宣布,该公司人工智能聊天机器人平台 ChatGPT 的免费和付费用户将看到更新的“思路链”,其中显示了该模型的更多“推理”步骤及其如何得出问题答案的。据 OpenAI 称,使用 o3-mini “高推理”配置的高级 ChatGPT 计划订阅者也将看到此更新的输出。OpenAI 发言人通过电子邮件回应表示:“我们为 o3-mini 模型引入了更新的 [思维链],旨在让人们更容易理解模型的思维方式。通过这次更新,用户将能够理解模型的推理,从而对其响应更加清晰和自信。”

    —— Techcrunch

  • “训练推理能力的人工智能模型”

    研究员以不到50美元训练出优质推理模型

    根据上周五发布的新研究论文,斯坦福大学和华盛顿大学的人工智能研究人员能够以不到50美元的云计算积分训练出具备“推理”能力的人工智能模型。该模型名为 s1,在数学和编程能力测试中表现出与 OpenAI 的 o1 和 DeepSeek 的 r1 等顶尖推理模型相似的水平。s1 模型可在 GitHub 上获取,同时还可获取用于训练该模型的数据和代码。s1 团队表示,他们从一个现成基础模型开始,然后通过“蒸馏”对其进行微调。研究人员称,s1 是从谷歌推理模型 Gemini 2.0 Flash Thinking Experimental 中蒸馏出来的。与伯克利分校的研究人员上个月以约450美元的价格创建人工智能推理模型所采用的方法相同。

    —— Techcrunch、GitHub