微闻

标签: 高效

  • DeepSeek 使用 Nvidia PTX 进行高效突破

    DeepSeek 使用了比 CUDA 更底层的 Nvidia PTX 进行编程

    DeepSeek 高效突破是通过实施大量细粒度优化和使用 Nvidia 的汇编式语言 PTX (并行线程执行) 编程而不是标准的 CUDA 实现的。PTX 是 Nvidia 为其 GPU 设计的中间指令集架构,位于高级 GPU 编程语言 (如 CUDA C/C++ 或其他语言前端) 和低级机器代码 (流式汇编或 SASS) 之间。它将 GPU 公开为数据并行计算设备,因此允许细粒度优化,例如寄存器分配和线程/warp 级别调整,这是 CUDA C/C++ 和其他语言前端无法实现的。

    在训练其 V3 模型时,DeepSeek 重新配置了 H800 GPU:在 132 个流式多处理器中,它分配了 20 个用于服务器间通信,可能用于压缩和解压数据,以克服处理器的连接限制并加快速度。为了最大限度地提高性能,DeepSeek 还实现了高级管道算法,可能是通过进行超精细的线程/warp 级别调整。这些修改远远超出了标准 CUDA 级开发,维护起来非常困难,这种级别的优化反映了 DeepSeek 工程师的卓越技能。

    —— Tom’s Hardware

  • 美国实验室研发 10 倍功率高效的 BAT 激光器

    美国实验室正在开发10倍功率效率于CO2 EUV 激光器的 BAT 激光器

    美国劳伦斯•利弗莫尔国家实验室正在研发一种 PW 级大孔径铥(BAT)激光技术,据称其效率比 EUV 光刻工具中使用的二氧化碳激光器高 10 倍,并且可以在未来数年内将其取代。这一进步可能为新一代“超越 EUV”光刻系统铺平道路,该系统可以更快地生产芯片,并且功耗更低。与工作波长约为 10 微米的二氧化碳激光器不同, BAT 系统的工作波长约为 2 微米。理论上,当与锡液滴相互作用时,这可以实现更高的等离子体到 EUV 的转换效率。此外,与基于气体的 CO2 装置相比,BAT 系统中使用的二极管泵浦固态技术可以提供更好的整体电气效率和热管理。

    —— Tom’s Hardware

  • 特斯拉上海工厂实现高效的冷却系统

    特斯拉上海工厂冷却水循环利用率达98%

    特斯拉公司副总裁陶琳12月17日在微博表示,目前特斯拉上海超级工厂的冷却水循环利用率已经达到98%,每年回收的中水超过40万吨,经处理后排放的废水中绝对不含有一类重金属。陶琳谈到,上海超级工厂车间外的大鱼缸里用来养锦鲤的水,都是经过处理的工厂废水。陶琳还表示如何不断减少制造环节的直接用水,一直是特斯拉优先研究的课题之一,而根据最新的公开数据,2023年,特斯拉全球单车用水量已经下降到2.48立方米,比行业平均水平省水超过26%。

    ——陶琳