微闻

标签: DeepSeek

  • DeepSeek开源EP通信库

    DeepSeek开源周第二日:开源EP通信库

    DeepSeek官宣,今日开源DeepEP,第一个用于MoE模型训练和推理的开源EP通信库。特点有:高效、优化的全员沟通;节点内和节点间均支持NVLink和RDMA;用于训练和推理预填充的高吞吐量内核;用于推理解码的低延迟内核;原生FP8调度支持;灵活的GPU资源控制,实现计算-通信重叠。DeepEP是一款专为混合专家(MoE)和专家并行(EP)设计的通信库,提供了高吞吐量和低延迟的all-to-all GPU内核,常用于MoE派发和合并操作。该库还支持低精度计算,包括FP8。

    —— DeepSeek

  • DeepSeek 开源周首发:高效 MLA 解码内核

    DeepSeek 发布“开源周”首个项目为针对 Hopper GPU 优化的高效 MLA 解码内核

    DeepSeek 今天开始了连续五天的“开源周”,并发布了首个开源代码库 FlashMLA。该代码库是针对英伟达 Hopper GPU 优化的高效多层注意力 (MLA) 解码内核。FlashMLA 的灵感源自 FlashAttention 2&3 和 cutlass 项目,专门优化了变长序列的并行处理,支持分页式KV缓存的快速访问,通过高度优化的 CUDA 内核实现注意力计算加速。

    FlashMLA 要求使用英伟达 Hopper GPU,并在 CUDA 12.3 及以上版本以及 PyTorch 2.0 及以上版本的环境中运行。在 CUDA 12.6 环境下,H800 SXM5 内存受限配置下可实现 3000 GB/s 的带宽,计算受限配置下则可达 580 TFLOPS 的算力,展现出卓越的计算效率。

    —— DeepSeek

  • DeepSeek 宣布开源代码库

    DeepSeek 宣布下周起陆续开源五个代码库

    DeepSeek 在 X 发文宣布,下周起会陆续开源五个代码库,每日都有新内容解锁,进一步分享新的进展。DeepSeek 介绍,当前在线服务的模块已经经过测试、部署完备,可以投入生产环境。DeepSeek 公司将自己定义为小公司,并表示每一次分享都会变成强有力的势能,加速行业发展的旅程。DeepSeek 还称这个领域没有高高在上的象牙塔,只有纯粹的车库创业精神与社区共筑的创新力量。

    从上线以来至2月9日,DeepSeek App 的累计下载量超1.1亿次,周活跃用户规模最高近9700万。其中,1月20日至1月26日,APP周下载量达到226万次。次周,下载量则直接飙升至6300万次,环比增长超2700%。

    —— DeepSeek、每日经济新闻

  • DeepSeek首次考虑外部融资

    人工智能公司DeepSeek首次考虑外部融资

    DeepSeek迄今尚未筹集外部资金,部分原因是为了避免投资者要求其产品过快商业化的压力。但据了解内部讨论的人士透露,自几周前该公司的人工智能聊天机器人应用一夜成名以来,由于需要更多的人工智能芯片和服务器来应对快速增长的使用并支持模型开发,该公司已考虑进行外部融资。包括阿里巴巴和国家基金在内众多实力雄厚的投资人皆展现出浓厚兴趣。DeepSeek及其对冲基金母公司幻方量化的高管们还在讨论是否应该从主要关注研究转向打造一项能够产生可观收入并最终实现利润的业务。DeepSeek创始人梁文峰对外部筹资仍持谨慎态度。

    —— The Information

  • 微信搜一搜正式接入DeepSeek

    微信又上线新功能:接入DeepSeek

    2月15日,有媒体透露,微信搜一搜在测试接入DeepSeek-R1。记者就此询问腾讯相关人士,得到确认答复:微信搜一搜在调用混元大模型丰富AI搜索的同时,近日正式灰度测试接入DeepSeek。被灰度到的用户,可在对话框顶部搜索入口,看到“AI搜索”字样,点击进入后,可免费使用DeepSeek-R1满血版模型,获得更多元化的搜索体验。“AI搜索”的回答引用消息源既包括公众号推文,也包括网页信息,页面最下方还支持继续提问。另外微信搜索出的结果具备社交功能,提问页面可直接转发到朋友或朋友圈。

    —— 广州日报

  • 谷歌人工智能负责人对 DeepSeek 模型的态度

    谷歌人工智能负责人告诉员工,公司拥有“所有要素”足以保持领先于 DeepSeek

    在全体员工会议上,Alphabet 首席执行官皮查伊朗读了一个 AI 总结的员工提交问题,询问谷歌在训练未来模型时可以从 DeepSeek 的成功中“汲取哪些教训和启示”。被指名回答的谷歌 DeepMind 首席执行官哈萨比斯说,“当你深入了解细节时,关于 DeepSeek 的一些说法是夸大其词。实际上,我们的模型比 DeepSeek 更高效、性能更好。因此,我们对我们的战略非常冷静和自信,我们拥有在今年保持领先地位的所有要素。”但他承认 DeepSeek 的成就令人印象深刻。“我认为,这绝对是我见过的来自中国的最好的团队,所以值得认真对待,”哈萨比斯说,并指出这有“安全”和“地缘政治”影响。

    —— CNBC

  • 谷歌AI大佬称DeepSeek是中国最好的作品

    谷歌AI大佬:DeepSeek或是中国最好作品

    美东时间周日,谷歌旗下 DeepMind 首席执行官戴米斯·哈萨比斯表示,Deepseek 的人工智能模型“可能是中国最好的作品”。但他补充说,Deepseek 公司并没有展示出任何全新的技术革新,外界对其的炒作可能有点夸大了。“我认为这可能是我在中国看到的最好的作品,”哈萨比斯在参加一场谷歌在巴黎举办的人工智能活动时表示,DeepSeek 的人工智能模型表明,Deepseek 在工程方面完成得“极其出色”。他说:“尽管有很多人吹捧,但其实这背后并没有真正的新的科学进步,它在人工智能中使用的是已知的技术。”他补充说,围绕 DeepSeek 的炒作“有点夸张”。

    —— 财联社

  • 中国三家电信企业全面接入DeepSeek

    中国三家基础电信企业全面接入DeepSeek

    从中国工信部获悉,中国三家基础电信企业均全面接入 DeepSeek 开源大模型,实现在多场景、多产品中应用。工信部称,2025年春节期间,中国基础电信企业积极利用AI开展创新服务,融合其在5G、云平台、大数据等方面能力,多领域布局,拓展人工智能应用场景,丰富人工智能应用供给。中国三家基础电信企业均全面接入 DeepSeek 开源大模型,实现在多场景、多产品中应用,针对热门的 DeepSeek-R1 模型提供专属算力方案和配套环境,助力国产大模型性能释放。

    —— 新京报、中国新闻网

  • DeepSeekiOS应用存在多个严重安全漏洞

    DeepSeek 的 iOS 应用程序被发现多个安全漏洞

    移动安全公司 NowSecure 分析发现 DeepSeek 的 iOS 应用程序中存在多个安全漏洞。DeepSeek 全局禁用了 iOS 平台级保护“应用程序传输安全” (ATS),并通过互联网发送未加密的数据。而在数据加密时,该应用选择了已知被破解的加密算法 (3DES),这使数据机密性受到严重损害。应用还将用户名、密码和加密密钥以不安全的方式存储。

    此外,DeepSeek 还进行广泛的数据收集和用户追踪,收集了可用于跟踪和去匿名化的用户和设备数据,大大超出正常应用提供服务所需信息的范围。收集的用户数据还被分享给其他第三方公司,例如被传输到字节跳动的火山引擎。

    —— 9to5mac

  • 美国议员计划提出法案禁用DeepSeek应用

    美议员推动禁止政府设备使用DeepSeek应用

    美国议员计划周四提出一项法案,禁止政府拥有的设备使用 DeepSeek 的聊天机器人应用,担心该应用可能会向中国政府提供用户信息。这项由伊利诺伊州共和党众议员达林·拉胡德和新泽西州民主党众议员乔什·戈特海默共同起草的法案,呼应了国会此前禁止政府设备使用 TikTok 的策略。“就我们应该立即采取行动防止敌人从我国政府获取信息而言,这应该是一个无需动脑子的问题,”戈特海默说。“我们决不允许一家中共公司获取敏感的政府或个人数据,”拉胡德说。

    —— 华尔街日报