微闻

标签: NVIDIA

  • DeepSeek 使用 Nvidia PTX 进行高效突破

    DeepSeek 使用了比 CUDA 更底层的 Nvidia PTX 进行编程

    DeepSeek 高效突破是通过实施大量细粒度优化和使用 Nvidia 的汇编式语言 PTX (并行线程执行) 编程而不是标准的 CUDA 实现的。PTX 是 Nvidia 为其 GPU 设计的中间指令集架构,位于高级 GPU 编程语言 (如 CUDA C/C++ 或其他语言前端) 和低级机器代码 (流式汇编或 SASS) 之间。它将 GPU 公开为数据并行计算设备,因此允许细粒度优化,例如寄存器分配和线程/warp 级别调整,这是 CUDA C/C++ 和其他语言前端无法实现的。

    在训练其 V3 模型时,DeepSeek 重新配置了 H800 GPU:在 132 个流式多处理器中,它分配了 20 个用于服务器间通信,可能用于压缩和解压数据,以克服处理器的连接限制并加快速度。为了最大限度地提高性能,DeepSeek 还实现了高级管道算法,可能是通过进行超精细的线程/warp 级别调整。这些修改远远超出了标准 CUDA 级开发,维护起来非常困难,这种级别的优化反映了 DeepSeek 工程师的卓越技能。

    —— Tom’s Hardware

  • Nvidia 将机器人技术作为其未来增长的重要动力

    Nvidia 押注机器人技术推动未来增长

    Nvidia 将机器人技术视为其下一个重要增长动力,因为其核心人工智能芯片制造业务面临着日益激烈的竞争。Nvidia 将于 2025 年上半年推出其最新一代人形机器人紧凑型计算机,名为 Jetson Thor。Nvidia 将自己定位为即将到来的机器人革命的领先平台。该公司销售“全栈”解决方案,从用于训练人工智能机器人的软件层到内置芯片。Nvidia 机器人副总裁 Deepu Talla 称:“物理人工智能和机器人的 ChatGPT 时刻即将到来”,并补充说他相信市场已经达到了“临界点”。

    —— 金融时报

  • Nvidia 将机器人技术推动未来增长

    Nvidia 押注机器人技术推动未来增长

    Nvidia 将机器人技术视为其下一个重要增长动力,因为其核心人工智能芯片制造业务面临着日益激烈的竞争。Nvidia 将于 2025 年上半年推出其最新一代人形机器人紧凑型计算机,名为 Jetson Thor。Nvidia 将自己定位为即将到来的机器人革命的领先平台。该公司销售“全栈”解决方案,从用于训练人工智能机器人的软件层到内置芯片。Nvidia 机器人副总裁 Deepu Talla 称:“物理人工智能和机器人的 ChatGPT 时刻即将到来”,并补充说他相信市场已经达到了“临界点”。

    —— 金融时报

  • 英伟达Nvidia App影响游戏性能

    英伟达承认Nvidia App会致游戏性能损失15%

    使用 Nvidia 最新的“Nvidia App”测试了游戏性能,发现该 App 会导致某些游戏的性能降低高达 15%。英伟达发布声明表示:“我们已获悉与游戏滤镜相关的性能问题,并正在积极调查。您可以从 NVIDIA App 的‘设置’>‘功能’>‘覆盖’>‘游戏滤镜和照片模式’中关闭游戏滤镜,然后重新启动游戏。”经过测试,确认禁用游戏滤镜和照片模式确实有效。问题似乎源于过滤器导致性能损失,即使没有被主动使用。因此,如果您只需要 Nvidia App 提供的视频捕捉功能或游戏优化,则可以通过禁用过滤器和照片模式来获得“正常”性能。

    —— Tom’s Hardware

  • Nvidia App会导致某些游戏的性能降低高达 15%

    英伟达承认Nvidia App会致游戏性能损失15%

    使用 Nvidia 最新的“Nvidia App”测试了游戏性能,发现该 App 会导致某些游戏的性能降低高达 15%。英伟达发布声明表示:“我们已获悉与游戏滤镜相关的性能问题,并正在积极调查。您可以从 NVIDIA App 的‘设置’>‘功能’>‘覆盖’>‘游戏滤镜和照片模式’中关闭游戏滤镜,然后重新启动游戏。”经过测试,确认禁用游戏滤镜和照片模式确实有效。问题似乎源于过滤器导致性能损失,即使没有被主动使用。因此,如果您只需要 Nvidia App 提供的视频捕捉功能或游戏优化,则可以通过禁用过滤器和照片模式来获得“正常”性能。

    —— Tom’s Hardware

  • 英伟达 PC 端新应用 Nvidia 正式上线

    英伟达 PC 端的新应用 Nvidia 正式上线

    英伟达公司今天正式在 PC 上推出 Nvidia 应用程序,旨在全面取代 GeForce Experience 应用。Nvidia 应用于今年早些时候进入测试阶段,如今其功能已趋于完善,因此正式发布,并且该应用很快将与 GeForce 驱动程序捆绑在一起。新应用支持 4K 120fps AV1 视频录制。此外,用户可以直接在 Nvidia 应用中配置显示器、启用 G-Sync 和调整 GPU 性能,无需再进入单独的控制面板应用。英伟达仍在努力将其控制面板应用的更多功能迁移到 Nvidia 应用。新的 Nvidia 应用也将作为可选安装的一部分捆绑在 Nvidia GeForce 驱动程序中,无需登录英伟达账户即可使用。

    —— TheVerge

  • Nvidia Blackwell GPU供应量已售罄

    Nvidia 的 Blackwell GPU 在未来 12 个月的供应量已售罄

    摩根士丹利分析师分享了最近与 Nvidia 领导层(包括 CEO 黄仁勋)会面后得到的结果。会议期间该公司透露,未来 12 个月的 Blackwell GPU 订单已经售罄。这意味着今天下订单的新客户必须等到明年年底才能收到货。Nvidia 的传统客户(AWS、CoreWeave、Google、Meta、Microsoft 和 Oracle 等)已经购买了 Nvidia 及其合作伙伴台积电未来几个季度能够生产的所有 Blackwell GPU。

    如此巨大的需求可能表明,尽管来自 AMD、英特尔、云服务提供商(提供专有产品)以及各种小公司的竞争日趋激烈,但 Nvidia 明年仍可能获得市场份额的增长。

    —— Tom’s Hardware

  • Nvidia 下一代 AI 芯片因设计缺陷而推迟

    Nvidia 下一代 AI 芯片因设计缺陷而推迟发货

    据两名帮助 Nvidia 生产芯片和服务器硬件的人士的信息,因为存在设计缺陷, Nvidia 即将推出的 AI 芯片将被推迟至少三个月。这可能会对 Meta、谷歌和微软等客户造成影响,这些客户总共订购了价值数百亿美元的芯片。另据一名微软员工和另一位知情人士透露, Nvidia 本周告诉其最大客户之一的微软和另一家大型云提供商,其新 Blackwell 系列芯片中最先进的 AI 芯片将被推迟。

    —— The Information

  • NVIDIA 将全面转向开源 GPU 内核模块

    NVIDIA 全面转向开源 GPU 内核模块

    NVIDIA 于 2022 年 5 月发布了一组 Linux GPU 内核模块,作为具有双重 GPL 和 MIT 许可的开源模块。当时该公司宣布,NVIDIA 开放内核模块最终将取代闭源驱动程序。现在,由于开源 GPU 内核模块实现了同等甚至更好的应用程序性能,NVIDIA 将在即将发布的 R560 驱动程序版本中完全过渡到开源 GPU 内核模块。

    对于 Grace Hopper 或 Blackwell 等最新平台,用户必须使用开源 GPU 内核模块,这些平台不支持专有驱动程序。对于 Turing、Ampere、Ada Lovelace 或 Hopper 架构的较新 GPU,NVIDIA 建议切换到开源 GPU 内核模块。对于 Maxwell、Pascal 或 Volta 架构的较旧 GPU,开源 GPU 内核模块与平台不兼容,将继续使用 NVIDIA 专有驱动程序。

    —— NVIDIA

  • NVIDIA改进生成AI图像和视频技术

    NVIDIA 正在设法大幅提高生成 AI 图像和视频的速度

    Nvidia 多伦多人工智能实验室的研究人员正在解决生成图像和视频的时间问题,本周在该公司的 GTC 2024 会议上,他们概述了这项工作的一些成果,展示了旨在实现这一目标的进步更快(因此更经济)生成“噪音”明显更少的图像和更详细的 3D 图像,将时间从几周或几个月缩短为几天或几分钟。

    对于图像生成,研究人员着眼于加速扩散模型的工作,该模型用于解决生成高保真度高分辨率图像的棘手问题,并且是 OpenAI 的 Dall-E3 等文本到图像模型的基础谷歌的图像。从本质上讲,它们消除了“噪声”——图像原始场景内容中不存在的伪影,但这些伪影可能使图像看起来模糊、像素化、颗粒状或以其他方式表现不佳。

    —— The Next Platform