DeepSeek 深度思考和联网搜索功能均暂时不可用
近期 DeepSeek 频繁出现问题,当前 DeepSeek 的深度思考(R1)和联网搜索功能均无法使用。打开搜索功能时,对话窗口会提示“由于技术原因,联网搜索暂不可用”;使用深度思考时,会提示“服务器繁忙,请稍后再试”。不过如果关闭深度思考和联网搜索功能,还可以正常对话,但可用性会大打折扣。
—— 三言财经
DeepSeek 深度思考和联网搜索功能均暂时不可用
近期 DeepSeek 频繁出现问题,当前 DeepSeek 的深度思考(R1)和联网搜索功能均无法使用。打开搜索功能时,对话窗口会提示“由于技术原因,联网搜索暂不可用”;使用深度思考时,会提示“服务器繁忙,请稍后再试”。不过如果关闭深度思考和联网搜索功能,还可以正常对话,但可用性会大打折扣。
—— 三言财经
新分析估计 DeepSeek 的硬件支出可能高达 5 亿美元
半导体研究和咨询公司 SemiAnalysis 的一份新报告为 DeepSeek 的开支提供了更多背景信息。该公司估计,DeepSeek 的硬件支出“在公司历史上远高于 5 亿美元”,并补充说研发成本和总拥有成本相当高。SemiAnalysis 表示:“这是因为他们必须进行实验,提出新的架构,收集和清理数据,支付员工工资等等。”为模型生成训练所需的“合成数据”需要“大量的计算”。DeepSeek 的论文并没有包括其完整计算成本的估计,其明确警告称,称“600 万美元”成本仅包括模型“正式训练”的 GPU 成本,并不包括与“架构、算法或数据的先前研究和消融实验”相关的成本。
—— CNBC
DeepSeek 应用在全球下载量居首 印度贡献最多
深度求索的人工智能助手在140个市场的移动应用下载量排行榜上位居榜首,其中印度占据了新增用户的最大比例。Appfigures 的数据显示 (不包括中国的第三方应用商店),这款推理人工智能聊天机器人于1月26日登上苹果公司应用商店的榜首,此后一直保持全球第一的位置。Sensor Tower 的研究显示,这款应用还占据了美区谷歌 Play 商店的榜首位置,该应用在发布后的前18天内下载量达到1600万次,几乎是 OpenAI 的 ChatGPT 首次发布时的900万次的两倍。数据显示,自推出以来,印度占所有平台下载量的15.6%。
—— 彭博社
意大利以数据保护为由封锁 DeepSeek 应用
意大利数据保护机构周四表示,由于缺乏有关其使用个人数据的信息,该机构已封锁中国人工智能模型 DeepSeek。意大利隐私监管机构 Garante 要求提供有关其个人数据使用情况的信息后,周三,DeepSeek 在意大利的苹果和谷歌应用商店中下架。特别是,希望能了解收集了哪些个人数据、从哪些来源收集、用于什么目的、基于什么法律依据以及是否存储在中国。该机构在其网站的说明中表示,该决定是在深度求索提供的信息“被认为完全不充分”之后做出的。Garante 还补充道,该决定“立即生效”,并且已启动调查。
—— 路透社
澳大利亚敦促公民谨慎使用 DeepSeek
澳大利亚财政部长吉姆·查尔默斯周三敦促澳大利亚人在使用中国 AI 模型 DeepSeek 时要谨慎,这是澳大利亚政府对该模型使用发出的最新警告。吉姆·查尔默斯周一在新闻发布会上表示:“我们敦促澳大利亚人对这项新技术保持谨慎。显然我们不断收到这方面的建议。”DeepSeek 是中国一种低成本人工智能模型,可能威胁到美国竞争对手的主导地位。模型本周发布时引发全球市场动荡,英伟达股价周一下跌17%,随后有所反弹。
—— 路透社
DeepSeek 在意大利的苹果和谷歌应用商店中已不可用
周三,中国人工智能应用 DeepSeek 在意大利的苹果和谷歌应用商店下架。苹果 App Store 应用商店向客户发出的通知称,该应用“目前在您所在的国家或地区不可用”。
—— 路透社
DeepSeek 的模型回避与中国有关敏感话题
中国 AI 聊天机器人 DeepSeek 近期登顶应用商店排行榜,其是中国对冲基金幻方量化的子公司,该模型性价比令人印象深刻。然而,越来越多的报告记录了该 AI 聊天机器人不愿讨论某些事情,包括天安门与台湾等敏感话题。这一点甚至在开源模式下也得到体现,引发了对审查和其他影响的担忧。
安全公司 PromptFoo 新报告发现 DeepSeek 的 R1 推理模型拒绝回答1360个敏感话题“提示”中的约85%,而该模型的预设回答充斥着“过度的民族主义语气”。未被拒绝的约15%提示通常不够针对中国。敏感提示的完整数据集已发布在 Hugging Face 上。研究人员还指出,DeepSeek 很容易被越狱,这表明该公司以生硬的方式实施了中国审查制度。
—— TechCrunch
白宫正在评估DeepSeek对国家安全的影响
白宫新闻秘书卡罗琳·莱维特周二称,美国官员正在研究中国人工智能应用DeepSeek对美国产生的国家安全影响。白宫人工智能和加密货币事务负责人大卫·萨克斯表示,这可能涉及知识产权盗窃。莱维特表示,国家安全委员会正在审查该应用的影响。“这是对美国人工智能行业的警钟,”她补充道,同时表示白宫正在努力“确保美国人工智能的主导地位”。萨克斯被问及DeepSeek的崛起是否涉及知识产权盗窃。“嗯,这是有可能的。人工智能中有一种叫“蒸馏”的技术,它指的是一个模型从另一个模型中学习的过程。我认为,在接下来的几个月里美国领先的人工智能公司将采取措施,试图防止‘蒸馏’。”
—— 路透社
DeepSeek 使用了比 CUDA 更底层的 Nvidia PTX 进行编程
DeepSeek 高效突破是通过实施大量细粒度优化和使用 Nvidia 的汇编式语言 PTX (并行线程执行) 编程而不是标准的 CUDA 实现的。PTX 是 Nvidia 为其 GPU 设计的中间指令集架构,位于高级 GPU 编程语言 (如 CUDA C/C++ 或其他语言前端) 和低级机器代码 (流式汇编或 SASS) 之间。它将 GPU 公开为数据并行计算设备,因此允许细粒度优化,例如寄存器分配和线程/warp 级别调整,这是 CUDA C/C++ 和其他语言前端无法实现的。
在训练其 V3 模型时,DeepSeek 重新配置了 H800 GPU:在 132 个流式多处理器中,它分配了 20 个用于服务器间通信,可能用于压缩和解压数据,以克服处理器的连接限制并加快速度。为了最大限度地提高性能,DeepSeek 还实现了高级管道算法,可能是通过进行超精细的线程/warp 级别调整。这些修改远远超出了标准 CUDA 级开发,维护起来非常困难,这种级别的优化反映了 DeepSeek 工程师的卓越技能。
—— Tom’s Hardware
微软正在调查 DeepSeek 关联组织是否以不当方式获取 OpenAI 数据
据知情人士透露,微软和 OpenAI 正在调查 OpenAI 技术生成的数据是否被一个与中国人工智能初创公司 DeepSeek 有关的团体以未经授权的方式获取。微软的安全研究人员在去年秋季观察到他们认为可能与 DeepSeek 有关的个人使用 OpenAI 应用程序编程接口 (API) 窃取了大量数据。作为 OpenAI 技术合作伙伴和最大投资者的微软已将这一活动通知了 OpenAI。此类活动可能违反 OpenAI 的服务条款,也可能表明该组织采取行动取消了 OpenAI 对其可获取数据量的限制。特朗普总统的人工智能主管戴维·萨克斯周二表示,有“大量证据”表明 DeepSeek 依靠 OpenAI 模型的输出来开发自己的技术。
—— 彭博社