标签：模型

“训练推理能力的人工智能模型”

研究员以不到50美元训练出优质推理模型

根据上周五发布的新研究论文，斯坦福大学和华盛顿大学的人工智能研究人员能够以不到50美元的云计算积分训练出具备“推理”能力的人工智能模型。该模型名为 s1，在数学和编程能力测试中表现出与 OpenAI 的 o1 和 DeepSeek 的 r1 等顶尖推理模型相似的水平。s1 模型可在 GitHub 上获取，同时还可获取用于训练该模型的数据和代码。s1 团队表示，他们从一个现成基础模型开始，然后通过“蒸馏”对其进行微调。研究人员称，s1 是从谷歌推理模型 Gemini 2.0 Flash Thinking Experimental 中蒸馏出来的。与伯克利分校的研究人员上个月以约450美元的价格创建人工智能推理模型所采用的方法相同。

—— Techcrunch、GitHub

2025年2月6日
谷歌 Gemini 应用添加新预览模型

Google Gemini 应用添加了 2.0 Pro 和 2.0 Flash Thinking 预览模型

谷歌在 2.0 Flash 面向消费者发布后，推出了新的预览模型 2.0 Pro 和 2.0 Flash Thinking ，这些模型将在 Gemini 应用中提供测试。谷歌表示，2.0 Pro Experimental 是其“迄今为止编码性能和复杂提示方面的最佳模型”。它还“比我们迄今为止发布的任何模型都具有更好的理解和推理世界知识的能力”。Gemini Advanced 订阅用户今天开始能够在网页和应用上预览 2.0 Pro Experimental。

Gemini 2.0 Flash Thinking Experimental 将在 Gemini 应用中向所有用户免费提供测试。谷歌表示，该模型具有 2.0 Flash 的速度和性能，并表示“经过训练，可以将提示分解为一系列步骤，以增强其推理能力并提供更好的响应。” 同时，谷歌还提供了“2.0 Flash Thinking Experimental with apps”，可以推理并“与 YouTube、搜索和谷歌地图等应用交互”。

—— 9to5google

2025年2月6日
对下载中国人工智能模型进行干预的法律制裁

参议员提议对下载 DeepSeek 的人判处监禁

美国密苏里州共和党参议员乔希·霍利提出了一项新法案，如果该法案获得通过，故意下载中国开发的人工智能模型的人可能会面临最高二十年的监禁、一百万美元的罚款，或两者并罚。乔希·霍利于上周三提出了这项名为《将美国人工智能能力与中国脱钩法案》的立法。乔希·霍利参议员的新法案是在中国推出“DeepSeek”模型之后提出的。这是一种数据收集、低成本的人工智能模型，引发国际社会关注，并导致美国科技股暴跌。这项法案的目标是禁止从中国进口或向中国出口人工智能技术、禁止美国公司在中国或与中国公司合作进行人工智能研究以及禁止美国公司向中国人工智能开发投资。

—— 乔希·霍利

2025年2月4日
英伟达上线DeepSeek-R1模型

英伟达开发者平台上线DeepSeek-R1模型

美国人工智能巨头英伟达宣布在其开发者平台上线中国深度求索大语言模型。英伟达1月30日在官网宣布，DeepSeek-R1模型可作为NVIDIA NIM微服务预览版使用。目前英伟达面向开发者的网站已将DeepSeek-R1模型纳入“最受欢迎的模型”栏目，且已可在NVIDIA NIM微服务上使用。英伟达开发者网站称，DeepSeek-R1模型是最先进、高效的大型语言模型，在推理、数学和编码方面表现出色。据英伟达官网介绍，NVIDIA NIM是NVIDIA AI Enterprise 的一部分，为跨云、数据中心和工作站的自托管GPU 加速推理微服务提供容器，用于预训练和自定义AI 模型。

—— 新加坡联合早报

2025年2月2日
微软在 Azure 上推出 AI 模型

微软在 Azure 上推出 DeepSeek 的 AI 模型

微软周三表示，已将中国初创公司 DeepSeek 的 R1 人工智能模型在其 Azure 云计算平台和 GitHub 开发者工具上提供。该人工智能模型将在平台上的模型目录中提供，并将加入微软提供的 1800 多个模型。此举正值微软寻求减少对 OpenAI 的依赖之际。微软一直致力于添加内部和第三方人工智能模型，为其旗舰人工智能产品 Microsoft 365 Copilot 提供支持。微软公司还表示，客户很快就能在自己的 Copilot+ 电脑上本地运行 R1 模型，此举可能会缓解人们对使用该模型的隐私和数据共享方面的担忧。DeepSeek 表示，该公司将用户信息存储在中国的服务器中，这可能是其在美国采用的一个症结所在。

—— 路透社

2025年1月30日
DeepSeek模型与审查有关

DeepSeek 的模型回避与中国有关敏感话题

中国 AI 聊天机器人 DeepSeek 近期登顶应用商店排行榜，其是中国对冲基金幻方量化的子公司，该模型性价比令人印象深刻。然而，越来越多的报告记录了该 AI 聊天机器人不愿讨论某些事情，包括天安门与台湾等敏感话题。这一点甚至在开源模式下也得到体现，引发了对审查和其他影响的担忧。

安全公司 PromptFoo 新报告发现 DeepSeek 的 R1 推理模型拒绝回答1360个敏感话题“提示”中的约85%，而该模型的预设回答充斥着“过度的民族主义语气”。未被拒绝的约15％提示通常不够针对中国。敏感提示的完整数据集已发布在 Hugging Face 上。研究人员还指出，DeepSeek 很容易被越狱，这表明该公司以生硬的方式实施了中国审查制度。

—— TechCrunch

2025年1月29日
xAI 的Grok 3模型即将上线

xAI 的 Grok 3 模型似乎已对部分用户上线

埃隆·马斯克的人工智能公司 xAI 的下一个旗舰人工智能模型可能即将发布。上周末，包括逆向工程师 Alexey Shabanov 在内的几位 X 平台用户报告称，他们通过 X 的 Grok 聊天机器人应用访问了 Grok 3 模型，这是 xAI 当前模型 Grok 2 的继任者。在访问权限被官方撤销之前，用户表示他们设法让该模型回答一系列查询，包括逻辑推理和与编码相关的问题。据用户称，Grok 3 模型能够成功回答谜语并处理诸如“为轮盘赌场生成 HTML 和 JavaScript 代码”之类的请求。然而，该模型并不完美。在轮盘赌场代码中，Grok 3 遗漏了一些细节 — — 并犯了一个编程错误。马斯克预计 Grok 3 将于1月或2月初发布。

—— Techcrunch

2025年1月28日
阿里通义千问：推出了新视觉理解模型Qwen2.5-VL

阿里开源全新视觉理解模型Qwen2.5-VL

阿里通义千问今日宣布开源全新的视觉理解模型 Qwen2.5-VL，推出了3B、7B和72B三个尺寸版本。主要特点：◆视觉理解：不仅擅长识别常见物体，还能够分析图像中的文本、图表、图标、图形和布局。◆代理：直接作为一个视觉 Agent，可以推理并动态地使用工具，初步具备了使用电脑和使用手机的能力。◆理解长视频和捕捉事件：能够理解超过1小时的视频，精准定位相关视频片段来捕捉事件。◆视觉定位：可以通过生成 bounding boxes 或者 points 来准确定位图像中的物体，并能够为坐标和属性提供稳定的 JSON 输出。◆结构化输出：对于发票、表单、表格等数据，支持内容的结构化输出。

—— 阿里通义千问

2025年1月28日
OpenAI将发布更智能的GPT o3模型

OpenAI最快下月发布更智能的GPT o3模型

OpenAI 首席产品官凯文·维尔在接受采访时表示，OpenAI 预计将在2月或3月发布更智能的 GPT o3 模型。此外，该公司还将在第一季度推出其首批 AI 智能体工具，使 ChatGPT 能够在计算机上执行实际操作。凯文·维尔举了一个例子，说明 ChatGPT 可以帮助他的孩子填写并提交足球报名表。

Anthropic 首席执行官达里奥·阿莫代21日接受采访时预测，在两到三年内，可能就会出现超越人类智能的 AI。维尔暗示，这甚至可能在2027年之前就会发生。维尔表示，希望特朗普政府对 AI 监管采取不干预的方式，他强调美国需要继续在 AI 发展方面保持领先地位：“我不希望看到中国赢得 AI 竞赛。”

—— 华尔街日报

2025年1月23日
OpenAI将推出新推理AI模型o3 mini

OpenAI将在几周内推出o3 mini推理AI模型

当地时间周五，人工智能研究公司OpenAI首席执行官奥尔特曼表示，OpenAI已完成其新推理AI模型o3 mini的版本，并将在几周内推出。奥尔特曼周五在社交媒体平台X上宣布了这一消息，他表示，公司考虑了用户的反馈意见，因此计划同时发布应用编程接口（API）和ChatGPT版本。OpenAI去年9月发布了o1的预览版，并于12月发布了完整版本。不同于普通大模型，o1在回答问题之前会进行“思考”，使得它在处理复杂的任务、科学和编程时比GPT-4o更优秀。去年12月，OpenAI透露其正在测试新版本推理AI模型o3和o3 mini。该公司当时表示，预计将于1月底推出OpenAI o3-mini，完整版本的o3将在之后发布。OpenAI此前表示，o3和o3 mini模型将比此前发布的o1模型更强大。

—— 财联社

2025年1月19日

标签： 模型

标签：模型