标签： DeepSeek

DeepSeek 的硬件支出可能高达 5 亿美元

新分析估计 DeepSeek 的硬件支出可能高达 5 亿美元

半导体研究和咨询公司 SemiAnalysis 的一份新报告为 DeepSeek 的开支提供了更多背景信息。该公司估计，DeepSeek 的硬件支出“在公司历史上远高于 5 亿美元”，并补充说研发成本和总拥有成本相当高。SemiAnalysis 表示：“这是因为他们必须进行实验，提出新的架构，收集和清理数据，支付员工工资等等。”为模型生成训练所需的“合成数据”需要“大量的计算”。DeepSeek 的论文并没有包括其完整计算成本的估计，其明确警告称，称“600 万美元”成本仅包括模型“正式训练”的 GPU 成本，并不包括与“架构、算法或数据的先前研究和消融实验”相关的成本。

—— CNBC

2025年2月1日
DeepSeek占据全球应用商店榜首

DeepSeek 应用在全球下载量居首印度贡献最多

深度求索的人工智能助手在140个市场的移动应用下载量排行榜上位居榜首，其中印度占据了新增用户的最大比例。Appfigures 的数据显示 (不包括中国的第三方应用商店)，这款推理人工智能聊天机器人于1月26日登上苹果公司应用商店的榜首，此后一直保持全球第一的位置。Sensor Tower 的研究显示，这款应用还占据了美区谷歌 Play 商店的榜首位置，该应用在发布后的前18天内下载量达到1600万次，几乎是 OpenAI 的 ChatGPT 首次发布时的900万次的两倍。数据显示，自推出以来，印度占所有平台下载量的15.6%。

—— 彭博社

2025年2月1日
意大利封锁中国人工智能模型DeepSeek

意大利以数据保护为由封锁 DeepSeek 应用

意大利数据保护机构周四表示，由于缺乏有关其使用个人数据的信息，该机构已封锁中国人工智能模型 DeepSeek。意大利隐私监管机构 Garante 要求提供有关其个人数据使用情况的信息后，周三，DeepSeek 在意大利的苹果和谷歌应用商店中下架。特别是，希望能了解收集了哪些个人数据、从哪些来源收集、用于什么目的、基于什么法律依据以及是否存储在中国。该机构在其网站的说明中表示，该决定是在深度求索提供的信息“被认为完全不充分”之后做出的。Garante 还补充道，该决定“立即生效”，并且已启动调查。

—— 路透社

2025年1月31日
DeepSeek 数据库泄露

DeepSeek 公开暴露了包含聊天提示和内部数据的数据库

云安全公司 Wiz 研究人员周三公布的研究结果，表明中国 AI 公司 DeepSeek 将其一个关键的 ClickHouse 数据库暴露在互联网上，并未配置身份验证过程。数据库泄露了系统日志、用户聊天提示，甚至用户的 API 身份验证令牌，总计超过 100 万条记录，任何人都可以获取这些记录。这是个非常低级的配置错误，表明这家年轻公司还未完全准备好。

Wiz 的研究人员表示，他们自己也不确定如何向该公司披露他们的发现，只是在周三将有关这一发现的信息发送给了他们能找到或猜到的每个 DeepSeek 电子邮件地址和领英个人资料。研究人员尚未收到回复，但在尝试大规模联系的半小时内，他们发现的数据库已被锁定，未经授权的用户无法访问。

—— 连线

2025年1月30日
澳大利亚政府警告公民谨慎使用 DeepSeek

澳大利亚敦促公民谨慎使用 DeepSeek

澳大利亚财政部长吉姆·查尔默斯周三敦促澳大利亚人在使用中国 AI 模型 DeepSeek 时要谨慎，这是澳大利亚政府对该模型使用发出的最新警告。吉姆·查尔默斯周一在新闻发布会上表示：“我们敦促澳大利亚人对这项新技术保持谨慎。显然我们不断收到这方面的建议。”DeepSeek 是中国一种低成本人工智能模型，可能威胁到美国竞争对手的主导地位。模型本周发布时引发全球市场动荡，英伟达股价周一下跌17%，随后有所反弹。

—— 路透社

2025年1月30日
DeepSeek 在意大利被移除

DeepSeek 在意大利的苹果和谷歌应用商店中已不可用

周三，中国人工智能应用 DeepSeek 在意大利的苹果和谷歌应用商店下架。苹果 App Store 应用商店向客户发出的通知称，该应用“目前在您所在的国家或地区不可用”。

—— 路透社

2025年1月29日
白宫评估人工智能应用DeepSeek对国家安全影响

白宫正在评估DeepSeek对国家安全的影响

白宫新闻秘书卡罗琳·莱维特周二称，美国官员正在研究中国人工智能应用DeepSeek对美国产生的国家安全影响。白宫人工智能和加密货币事务负责人大卫·萨克斯表示，这可能涉及知识产权盗窃。莱维特表示，国家安全委员会正在审查该应用的影响。“这是对美国人工智能行业的警钟，”她补充道，同时表示白宫正在努力“确保美国人工智能的主导地位”。萨克斯被问及DeepSeek的崛起是否涉及知识产权盗窃。“嗯，这是有可能的。人工智能中有一种叫“蒸馏”的技术，它指的是一个模型从另一个模型中学习的过程。我认为，在接下来的几个月里美国领先的人工智能公司将采取措施，试图防止‘蒸馏’。”

—— 路透社

2025年1月29日
DeepSeek 使用 Nvidia PTX 进行高效突破

DeepSeek 使用了比 CUDA 更底层的 Nvidia PTX 进行编程

DeepSeek 高效突破是通过实施大量细粒度优化和使用 Nvidia 的汇编式语言 PTX (并行线程执行) 编程而不是标准的 CUDA 实现的。PTX 是 Nvidia 为其 GPU 设计的中间指令集架构，位于高级 GPU 编程语言 (如 CUDA C/C++ 或其他语言前端) 和低级机器代码 (流式汇编或 SASS) 之间。它将 GPU 公开为数据并行计算设备，因此允许细粒度优化，例如寄存器分配和线程/warp 级别调整，这是 CUDA C/C++ 和其他语言前端无法实现的。

在训练其 V3 模型时，DeepSeek 重新配置了 H800 GPU：在 132 个流式多处理器中，它分配了 20 个用于服务器间通信，可能用于压缩和解压数据，以克服处理器的连接限制并加快速度。为了最大限度地提高性能，DeepSeek 还实现了高级管道算法，可能是通过进行超精细的线程/warp 级别调整。这些修改远远超出了标准 CUDA 级开发，维护起来非常困难，这种级别的优化反映了 DeepSeek 工程师的卓越技能。

—— Tom’s Hardware

2025年1月29日
微软调查 DeepSeek 关联组织获取 OpenAI 数据

微软正在调查 DeepSeek 关联组织是否以不当方式获取 OpenAI 数据

据知情人士透露，微软和 OpenAI 正在调查 OpenAI 技术生成的数据是否被一个与中国人工智能初创公司 DeepSeek 有关的团体以未经授权的方式获取。微软的安全研究人员在去年秋季观察到他们认为可能与 DeepSeek 有关的个人使用 OpenAI 应用程序编程接口 (API) 窃取了大量数据。作为 OpenAI 技术合作伙伴和最大投资者的微软已将这一活动通知了 OpenAI。此类活动可能违反 OpenAI 的服务条款，也可能表明该组织采取行动取消了 OpenAI 对其可获取数据量的限制。特朗普总统的人工智能主管戴维·萨克斯周二表示，有“大量证据”表明 DeepSeek 依靠 OpenAI 模型的输出来开发自己的技术。

—— 彭博社

2025年1月29日
中国人工智能实验室 DeepSeek 的GPU数量高达50,000

中国人工智能实验室 DeepSeek 拥有 50,000 个 H100 GPU

Scale AI 创始人兼首席执行官 Alexandr Wang 分享了该公司名为“人类的最后考试”的最新 AI 测试的细节，该测试使用“数学、物理、生物、化学教授”提供的与最新研究相关的“最难的问题”。中国人工智能实验室 DeepSeek 的模型 R1 在 Scale AI 公司最具挑战性的人工智能测试中达到或击败了所有表现最佳的模型，或大致与美国最好的模型是 o1 相当。

Alexandr 表示，对于中国是否能获得先进 GPU 这个问题，“现实情况是既可以又不能。中国实验室拥有的 H100 数量比人们想象的要多。”他补充说，据他了解，“DeepSeek 拥有大约 50,000 个 H100。”他补充道，“他们显然不能谈论这个问题，因为这违反了美国实施的出口管制。”然而，该公司可能会发现很难采购更多芯片，“从长远来看，他们将受到芯片管制和出口管制的限制。”

—— wccftech

2025年1月26日