标签: 模型

  • 中国百度将发布下一代人工智能模型

    中国百度今年将发布下一代人工智能模型

    据知情人士透露,随着 DeepSeek 等新玩家正在颠覆这一领域,中国百度计划在今年下半年发布下一代人工智能模型。文心5.0被称为“基础模型”,将“在多模态能力方面有重大增强”,但没有具体说明其功能。“多模态”人工智能可以处理文本、视频、图像和音频等不同形式的数据,并进行转换和结合,比如将文本转化为视频,或反向操作。百度李彦宏本周在迪拜的世界政府峰会上说:“我们正处于一个令人激动的时代…12 个月内,基础模型的推理成本预计将下降90%以上。如果成本能够大幅降低,意味着生产力将呈同等比例提升。这也正是创新的核心所在。”

    —— CNBC

  • OpenAI 将 o3-mini 模型的思维过程透露

    OpenAI 披露更多 o3-mini 模型思维过程

    为了应对包括中国人工智能公司深度求索在内的竞争对手的压力,OpenAI 正在改变其最新人工智能模型 o3-mini 传达其“逐步”思考过程的方式。周四,OpenAI 宣布,该公司人工智能聊天机器人平台 ChatGPT 的免费和付费用户将看到更新的“思路链”,其中显示了该模型的更多“推理”步骤及其如何得出问题答案的。据 OpenAI 称,使用 o3-mini “高推理”配置的高级 ChatGPT 计划订阅者也将看到此更新的输出。OpenAI 发言人通过电子邮件回应表示:“我们为 o3-mini 模型引入了更新的 [思维链],旨在让人们更容易理解模型的思维方式。通过这次更新,用户将能够理解模型的推理,从而对其响应更加清晰和自信。”

    —— Techcrunch

  • “训练推理能力的人工智能模型”

    研究员以不到50美元训练出优质推理模型

    根据上周五发布的新研究论文,斯坦福大学和华盛顿大学的人工智能研究人员能够以不到50美元的云计算积分训练出具备“推理”能力的人工智能模型。该模型名为 s1,在数学和编程能力测试中表现出与 OpenAI 的 o1 和 DeepSeek 的 r1 等顶尖推理模型相似的水平。s1 模型可在 GitHub 上获取,同时还可获取用于训练该模型的数据和代码。s1 团队表示,他们从一个现成基础模型开始,然后通过“蒸馏”对其进行微调。研究人员称,s1 是从谷歌推理模型 Gemini 2.0 Flash Thinking Experimental 中蒸馏出来的。与伯克利分校的研究人员上个月以约450美元的价格创建人工智能推理模型所采用的方法相同。

    —— Techcrunch、GitHub

  • 谷歌 Gemini 应用添加新预览模型

    Google Gemini 应用添加了 2.0 Pro 和 2.0 Flash Thinking 预览模型

    谷歌在 2.0 Flash 面向消费者发布后,推出了新的预览模型 2.0 Pro 和 2.0 Flash Thinking ,这些模型将在 Gemini 应用中提供测试。谷歌表示,2.0 Pro Experimental 是其“迄今为止编码性能和复杂提示方面的最佳模型”。它还“比我们迄今为止发布的任何模型都具有更好的理解和推理世界知识的能力”。Gemini Advanced 订阅用户今天开始能够在网页和应用上预览 2.0 Pro Experimental。

    Gemini 2.0 Flash Thinking Experimental 将在 Gemini 应用中向所有用户免费提供测试。谷歌表示,该模型具有 2.0 Flash 的速度和性能,并表示“经过训练,可以将提示分解为一系列步骤,以增强其推理能力并提供更好的响应。” 同时,谷歌还提供了“2.0 Flash Thinking Experimental with apps”,可以推理并“与 YouTube、搜索和谷歌地图等应用交互”。

    —— 9to5google

  • 对下载中国人工智能模型进行干预的法律制裁

    参议员提议对下载 DeepSeek 的人判处监禁

    美国密苏里州共和党参议员乔希·霍利提出了一项新法案,如果该法案获得通过,故意下载中国开发的人工智能模型的人可能会面临最高二十年的监禁、一百万美元的罚款,或两者并罚。乔希·霍利于上周三提出了这项名为《将美国人工智能能力与中国脱钩法案》的立法。​乔希·霍利参议员的新法案是在中国推出“DeepSeek”模型之后提出的。这是一种数据收集、低成本的人工智能模型,引发国际社会关注,并导致美国科技股暴跌。这项法案的目标是禁止从中国进口或向中国出口人工智能技术、禁止美国公司在中国或与中国公司合作进行人工智能研究以及禁止美国公司向中国人工智能开发投资。

    —— 乔希·霍利

  • 英伟达上线DeepSeek-R1模型

    英伟达开发者平台上线DeepSeek-R1模型

    美国人工智能巨头英伟达宣布在其开发者平台上线中国深度求索大语言模型。英伟达1月30日在官网宣布,DeepSeek-R1模型可作为NVIDIA NIM微服务预览版使用。目前英伟达面向开发者的网站已将DeepSeek-R1模型纳入“最受欢迎的模型”栏目,且已可在NVIDIA NIM微服务上使用。英伟达开发者网站称,DeepSeek-R1模型是最先进、高效的大型语言模型,在推理、数学和编码方面表现出色。据英伟达官网介绍,NVIDIA NIM是NVIDIA AI Enterprise 的一部分,为跨云、数据中心和工作站的自托管GPU 加速推理微服务提供容器,用于预训练和自定义AI 模型。

    —— 新加坡联合早报

  • 微软在 Azure 上推出 AI 模型

    微软在 Azure 上推出 DeepSeek 的 AI 模型

    微软周三表示,已将中国初创公司 DeepSeek 的 R1 人工智能模型在其 Azure 云计算平台和 GitHub 开发者工具上提供。该人工智能模型将在平台上的模型目录中提供,并将加入微软提供的 1800 多个模型。此举正值微软寻求减少对 OpenAI 的依赖之际。微软一直致力于添加内部和第三方人工智能模型,为其旗舰人工智能产品 Microsoft 365 Copilot 提供支持。微软公司还表示,客户很快就能在自己的 Copilot+ 电脑上本地运行 R1 模型,此举可能会缓解人们对使用该模型的隐私和数据共享方面的担忧。DeepSeek 表示,该公司将用户信息存储在中国的服务器中,这可能是其在美国采用的一个症结所在。

    —— 路透社

  • DeepSeek模型与审查有关

    DeepSeek 的模型回避与中国有关敏感话题

    中国 AI 聊天机器人 DeepSeek 近期登顶应用商店排行榜,其是中国对冲基金幻方量化的子公司,该模型性价比令人印象深刻。然而,越来越多的报告记录了该 AI 聊天机器人不愿讨论某些事情,包括天安门与台湾等敏感话题。这一点甚至在开源模式下也得到体现,引发了对审查和其他影响的担忧。

    安全公司 PromptFoo 新报告发现 DeepSeek 的 R1 推理模型拒绝回答1360个敏感话题“提示”中的约85%,而该模型的预设回答充斥着“过度的民族主义语气”。未被拒绝的约15%提示通常不够针对中国。敏感提示的完整数据集已发布在 Hugging Face 上。研究人员还指出,DeepSeek 很容易被越狱,这表明该公司以生硬的方式实施了中国审查制度。

    —— TechCrunch

  • xAI 的Grok 3模型即将上线

    xAI 的 Grok 3 模型似乎已对部分用户上线

    埃隆·马斯克的人工智能公司 xAI 的下一个旗舰人工智能模型可能即将发布。上周末,包括逆向工程师 Alexey Shabanov 在内的几位 X 平台用户报告称,他们通过 X 的 Grok 聊天机器人应用访问了 Grok 3 模型,这是 xAI 当前模型 Grok 2 的继任者。在访问权限被官方撤销之前,用户表示他们设法让该模型回答一系列查询,包括逻辑推理和与编码相关的问题。据用户称,Grok 3 模型能够成功回答谜语并处理诸如“为轮盘赌场生成 HTML 和 JavaScript 代码”之类的请求。然而,该模型并不完美。在轮盘赌场代码中,Grok 3 遗漏了一些细节 — — 并犯了一个编程错误。马斯克预计 Grok 3 将于1月或2月初发布。

    —— Techcrunch

  • 阿里通义千问:推出了新视觉理解模型Qwen2.5-VL

    阿里开源全新视觉理解模型Qwen2.5-VL

    阿里通义千问今日宣布开源全新的视觉理解模型 Qwen2.5-VL,推出了3B、7B和72B三个尺寸版本。主要特点:◆视觉理解:不仅擅长识别常见物体,还能够分析图像中的文本、图表、图标、图形和布局。◆代理:直接作为一个视觉 Agent,可以推理并动态地使用工具,初步具备了使用电脑和使用手机的能力。◆理解长视频和捕捉事件:能够理解超过1小时的视频,精准定位相关视频片段来捕捉事件。◆视觉定位:可以通过生成 bounding boxes 或者 points 来准确定位图像中的物体,并能够为坐标和属性提供稳定的 JSON 输出。◆结构化输出:对于发票、表单、表格等数据,支持内容的结构化输出。

    —— 阿里通义千问