微闻

标签: DeepSeek

  • DeepSeek功能暂时不可用

    DeepSeek 深度思考和联网搜索功能均暂时不可用

    近期 DeepSeek 频繁出现问题,当前 DeepSeek 的深度思考(R1)和联网搜索功能均无法使用。打开搜索功能时,对话窗口会提示“由于技术原因,联网搜索暂不可用”;使用深度思考时,会提示“服务器繁忙,请稍后再试”。不过如果关闭深度思考和联网搜索功能,还可以正常对话,但可用性会大打折扣。

    —— 三言财经

  • DeepSeek 的硬件支出可能高达 5 亿美元

    新分析估计 DeepSeek 的硬件支出可能高达 5 亿美元

    半导体研究和咨询公司 SemiAnalysis 的一份新报告为 DeepSeek 的开支提供了更多背景信息。该公司估计,DeepSeek 的硬件支出“在公司历史上远高于 5 亿美元”,并补充说研发成本和总拥有成本相当高。SemiAnalysis 表示:“这是因为他们必须进行实验,提出新的架构,收集和清理数据,支付员工工资等等。”为模型生成训练所需的“合成数据”需要“大量的计算”。DeepSeek 的论文并没有包括其完整计算成本的估计,其明确警告称,称“600 万美元”成本仅包括模型“正式训练”的 GPU 成本,并不包括与“架构、算法或数据的先前研究和消融实验”相关的成本。

    —— CNBC

  • DeepSeek占据全球应用商店榜首

    DeepSeek 应用在全球下载量居首 印度贡献最多

    深度求索的人工智能助手在140个市场的移动应用下载量排行榜上位居榜首,其中印度占据了新增用户的最大比例。Appfigures 的数据显示 (不包括中国的第三方应用商店),这款推理人工智能聊天机器人于1月26日登上苹果公司应用商店的榜首,此后一直保持全球第一的位置。Sensor Tower 的研究显示,这款应用还占据了美区谷歌 Play 商店的榜首位置,该应用在发布后的前18天内下载量达到1600万次,几乎是 OpenAI 的 ChatGPT 首次发布时的900万次的两倍。数据显示,自推出以来,印度占所有平台下载量的15.6%。

    —— 彭博社

  • 意大利封锁中国人工智能模型DeepSeek

    意大利以数据保护为由封锁 DeepSeek 应用

    意大利数据保护机构周四表示,由于缺乏有关其使用个人数据的信息,该机构已封锁中国人工智能模型 DeepSeek。意大利隐私监管机构 Garante 要求提供有关其个人数据使用情况的信息后,周三,DeepSeek 在意大利的苹果和谷歌应用商店中下架。特别是,希望能了解收集了哪些个人数据、从哪些来源收集、用于什么目的、基于什么法律依据以及是否存储在中国。该机构在其网站的说明中表示,该决定是在深度求索提供的信息“被认为完全不充分”之后做出的。Garante 还补充道,该决定“立即生效”,并且已启动调查。

    —— 路透社

  • 澳大利亚政府警告公民谨慎使用 DeepSeek

    澳大利亚敦促公民谨慎使用 DeepSeek

    澳大利亚财政部长吉姆·查尔默斯周三敦促澳大利亚人在使用中国 AI 模型 DeepSeek 时要谨慎,这是澳大利亚政府对该模型使用发出的最新警告。吉姆·查尔默斯周一在新闻发布会上表示:“我们敦促澳大利亚人对这项新技术保持谨慎。显然我们不断收到这方面的建议。”DeepSeek 是中国一种低成本人工智能模型,可能威胁到美国竞争对手的主导地位。模型本周发布时引发全球市场动荡,英伟达股价周一下跌17%,随后有所反弹。

    —— 路透社

  • DeepSeek 在意大利被移除

    DeepSeek 在意大利的苹果和谷歌应用商店中已不可用

    周三,中国人工智能应用 DeepSeek 在意大利的苹果和谷歌应用商店下架。苹果 App Store 应用商店向客户发出的通知称,该应用“目前在您所在的国家或地区不可用”。

    —— 路透社

  • DeepSeek模型与审查有关

    DeepSeek 的模型回避与中国有关敏感话题

    中国 AI 聊天机器人 DeepSeek 近期登顶应用商店排行榜,其是中国对冲基金幻方量化的子公司,该模型性价比令人印象深刻。然而,越来越多的报告记录了该 AI 聊天机器人不愿讨论某些事情,包括天安门与台湾等敏感话题。这一点甚至在开源模式下也得到体现,引发了对审查和其他影响的担忧。

    安全公司 PromptFoo 新报告发现 DeepSeek 的 R1 推理模型拒绝回答1360个敏感话题“提示”中的约85%,而该模型的预设回答充斥着“过度的民族主义语气”。未被拒绝的约15%提示通常不够针对中国。敏感提示的完整数据集已发布在 Hugging Face 上。研究人员还指出,DeepSeek 很容易被越狱,这表明该公司以生硬的方式实施了中国审查制度。

    —— TechCrunch

  • 白宫评估人工智能应用DeepSeek对国家安全影响

    白宫正在评估DeepSeek对国家安全的影响

    白宫新闻秘书卡罗琳·莱维特周二称,美国官员正在研究中国人工智能应用DeepSeek对美国产生的国家安全影响。白宫人工智能和加密货币事务负责人大卫·萨克斯表示,这可能涉及知识产权盗窃。莱维特表示,国家安全委员会正在审查该应用的影响。“这是对美国人工智能行业的警钟,”她补充道,同时表示白宫正在努力“确保美国人工智能的主导地位”。萨克斯被问及DeepSeek的崛起是否涉及知识产权盗窃。“嗯,这是有可能的。人工智能中有一种叫“蒸馏”的技术,它指的是一个模型从另一个模型中学习的过程。我认为,在接下来的几个月里美国领先的人工智能公司将采取措施,试图防止‘蒸馏’。”

    —— 路透社

  • DeepSeek 使用 Nvidia PTX 进行高效突破

    DeepSeek 使用了比 CUDA 更底层的 Nvidia PTX 进行编程

    DeepSeek 高效突破是通过实施大量细粒度优化和使用 Nvidia 的汇编式语言 PTX (并行线程执行) 编程而不是标准的 CUDA 实现的。PTX 是 Nvidia 为其 GPU 设计的中间指令集架构,位于高级 GPU 编程语言 (如 CUDA C/C++ 或其他语言前端) 和低级机器代码 (流式汇编或 SASS) 之间。它将 GPU 公开为数据并行计算设备,因此允许细粒度优化,例如寄存器分配和线程/warp 级别调整,这是 CUDA C/C++ 和其他语言前端无法实现的。

    在训练其 V3 模型时,DeepSeek 重新配置了 H800 GPU:在 132 个流式多处理器中,它分配了 20 个用于服务器间通信,可能用于压缩和解压数据,以克服处理器的连接限制并加快速度。为了最大限度地提高性能,DeepSeek 还实现了高级管道算法,可能是通过进行超精细的线程/warp 级别调整。这些修改远远超出了标准 CUDA 级开发,维护起来非常困难,这种级别的优化反映了 DeepSeek 工程师的卓越技能。

    —— Tom’s Hardware

  • 微软调查 DeepSeek 关联组织获取 OpenAI 数据

    微软正在调查 DeepSeek 关联组织是否以不当方式获取 OpenAI 数据

    据知情人士透露,微软和​​ OpenAI 正在调查 OpenAI 技术生成的数据是否被一个与中国人工智能初创公司 DeepSeek 有关的团体以未经授权的方式获取。微软的安全研究人员在去年秋季观察到他们认为可能与 DeepSeek 有关的个人使用 OpenAI 应用程序编程接口 (API) 窃取了大量数据。作为 OpenAI 技术合作伙伴和最大投资者的微软已将这一活动通知了 OpenAI。此类活动可能违反 OpenAI 的服务条款,也可能表明该组织采取行动取消了 OpenAI 对其可获取数据量的限制。特朗普总统的人工智能主管戴维·萨克斯周二表示,有“大量证据”表明 DeepSeek 依靠 OpenAI 模型的输出来开发自己的技术。

    —— 彭博社