标签: 超级计算机

  • 软银拟推出首台搭载英伟达 Blackwell 芯片的超级计算机

    软银拟推出首台搭载英伟达 Blackwell 芯片的超级计算机

    日本​软银集团将率先使用英伟达公司新推出的 Blackwell 芯片设计打造超级计算机,这体现了这家日本公司在人工智能领域奋起直追的雄心。两家公司表示,软银电信部门计划打造日本最强大的人工智能超级计算机,以支持广泛的本地服务。这台计算机将基于英伟达的 DGX B200 产品,该产品将计算机处理器与人工智能加速器芯片相结合。后续计划将采用更先进的 Grace Blackwell 版本。软银集团的创办人孙正义表示,日本正处于变革的边缘,他经常批评日本政府和企业在采用新技术方面进展缓慢。他说,这一次日本政府不会阻碍人工智能的发展。

    —— 彭博社

  • 马斯克旗下的xAI计划在美国孟菲斯市开发巨型超级计算机

    马斯克旗下的xAI计划在美国孟菲斯市开发巨型超级计算机

    马斯克旗下的人工智能公司 xAI 计划在孟菲斯市新建一座工厂,来开发一台巨型超级计算机,此举是为了提高其在制造和提供聊天机器人等人工智能工具方面的能力。自3月初以来,马斯克和他在 xAI 的团队一直在与孟菲斯的官员合作规划新工厂,这将是“孟菲斯市历史上最大的数十亿美元投资”,大孟菲斯商会主席 Ted Townsend 说。Townsend 补充说,有关新工厂的许多细节尚未披露,包括总成本和将创造的就业岗位数量。他还表示,该市还讨论了提供 xAI 税收减免或其他商业激励措施,以吸引该项目来到孟菲斯,但具体细节仍未确定。

    —— 财联社、华尔街日报

  • 微软 Hiring Former Meta Executive to Strengthen AI Supercomputing Team

    微软聘请前Meta高管以加强AI超级计算团队

    前 Meta 高管 Jason Taylor 将加入微软人工智能超级计算团队。微软首席技术官凯文·斯科特22日在领英上发文称,Taylor 将担任公司副总裁兼副首席技术官,帮助”构建下一套系统,推动人工智能的前沿发展”。Taylor 于2009年至2022年在 Meta 工作,最近的职务是公司基础设施副总裁。根据他在领英上的个人简介,他负责人工智能、数据和隐私基础设施,并管理公司的服务器预算。Taylor 还曾在2015年至2017年期间担任开放计算项目基金会主席,该组织致力于促进数据中心的开源设计。

    —— TheVerge

  • 微软和OpenAI计划斥资1000亿美元打造“星际之门”AI超级计算机

    微软和 OpenAI 计划斥资 1000 亿美元打造“星际之门” AI 超级计算机

    据三名参与该提案私下对话的人士透露,微软和​​ OpenAI 的高管一直在为一个数据中心项目制定计划,该项目将包含一台超级计算机,配备数百万个专用服务器芯片,为 OpenAI 的人工智能提供动力。据一位曾与 OpenAI 首席执行官萨姆·奥尔特曼交谈过的人士以及一位看过微软初步成本估算的人士称,该项目的成本可能高达1000亿美元。微软可能会负责为该项目提供融资,该项目的成本比当今一些最大的数据中心高出100倍,这表明未来几年可能需要巨额投资来建立人工智能的计算能力。高管们预计,拟议中的位于美国的超级计算机 (他们将其称为“星际之门”) 是两家公司计划在未来六年内建造的一系列设施中最大的一个。微软高管希望最早在2028年发布“星际之门” AI 超级计算机。此外,微软和 OpenAI 计划为 AI 开发数据中心项目。

    —— The Information

  • NASA 超级计算机短缺导致任务推迟

    NASA 的任务因超级计算机短缺而被推迟

    美国宇航局(NASA)的超级计算能力未能跟上最新技术发展的步伐,并且“超额认购和负担过重”,导致任务延迟,有时需要由团队购买自己的基础设施来解决。 NASA 内部审计机构监察长办公室发布的审计报告称“NASA 需要新的承诺和持续的领导关注,以重振其高端计算工作。如果不做出重大改变,该机构的高端计算可能会限制未来的任务优先事项和目标。” NASA 当前的超级计算设施存在超额分配、超负荷使用和过时的问题。例如,NASA 的“先进超级计算设施”只有 48 个 GPU 和 18,000 个 CPU。而 SLS 团队每年花费25万美元购买独立计算资源,而不是等待现有的资源可用。

    —— The Register

  • 中国推出高性能超级计算机

    中国神威推出新型 CPU,性能比上一代提高了四倍,表明中国在美国制裁下依然能建造高性能超级计算机

    今年早些时候,位于无锡的国家超级计算中心(被美国列入黑名单的实体) 推出了 基于增强型中国设计的神威 SW26010 Pro 处理器(384 个内核)的新型超级计算机。

    据 Chips and Cheese 称,Sunway 的 SW26010 Pro CPU 不仅比其非 Pro SW26010 前身拥有更多内核,而且由于微架构和系统架构的改进,其 FP64 计算吞吐量增加了四倍 以上。然而,虽然众核 CPU 表面上很好,但它存在一些性能瓶颈。

    众核 Sunway SW26010 Pro CPU 和使用它的超级计算机的第一个细节 早在 2021 年就出现了。现在,该公司在最近的 SC23 上展示了实际的处理器,并披露了有关其架构和设计的更多细节,这代表了性能的重大飞跃。新的CPU预计将使中国能够建造完全基于国产处理器的高性能超级计算机。每台 Sunway SW26010 Pro 的最大 FP64 吞吐量为 13.8 TFLOPS,这是一个巨大的数字。相比之下,AMD 的 96 核 EPYC 9654 的峰值 FP64 性能约为 5.4 TFLOPS。

    SW26010 Pro 不仅比前代产品运行速度更快(CPE 运行频率为 2.25 GHz,MPE 运行频率为 2.10 GHz,而不是前代产品上 CPE 和 MPE 的 1.45 GHz),而且 SW26010 Pro CPU 上的全新 64 位 RISC 微架构经过彻底改造,处理器的 FP64 数据处理吞吐量增加了四倍。

    —— Tom’s Hardware

  • NVIDIA GH200 超级计算机技术

    NVIDIA GH200 超级计算机技术

    谷歌、Meta、微软将是新一代AI显卡 NVIDIA GH200 的首批用户

    在 COMPUTEX 2023 上,NVIDIA 发布专为AI打造的 DGX GH200 超级计算机,通过 NVLink 互连技术使256个 GH200 超级芯片可以作为单个 GPU 执行,这提供了 1 exaflop 的性能和144TB的共享内存。可量产的 DGX GH200 与500强超算第一名的 Frontier 相比只落后 0.1 exaflop 算力,与2020年发布的 DGX A100 相比多了近500倍内存。

    GH200 超级芯片通过使用 NVLink-C2C 技术将基于 Arm 的 Grace CPU 与 H100 GPU 组合在同一封装,从而消除了对传统 CPU 到 GPU PCIe 连接的需求。与最新的 PCIe 技术相比,这将 GPU 和 CPU 之间的带宽提高了7倍,将互连功耗降低了5倍以上,并为单卡提供了 600GB 内存。

    —— LatentSpace