标签： AI芯片

台积电将停止为内地生产先进AI芯片

台积电从11日起停止为内地生产先进AI芯片

台积电已通知中国芯片设计公司，将暂停生产这些公司最先进的人工智能芯片。三位知情人士表示，全球最大的代工芯片制造商台积电告诉中国客户，从下周一开始，将不再向这些客户提供七纳米或更先进的工艺制程的芯片。其中两位知情人士表示，台积电未来向中国客户供应此类半导体，可能都需要经过华盛顿方面的审批。台积电推出新政策之际，美国商务部正在调查该集团为一家中国客户制造的尖端芯片是如何最终出现在华为人工智能设备上的。

—— 英国金融时报 (全文）、南华早报

2024年12月5日
AMD发布AI芯片

AMD 发布英伟达竞品 AI 芯片：MI325X

AMD 在10月10日举办了一场人工智能主题发布会，推出包括 MI325X 算力芯片在内的一众新品。MI325X 基于 CDNA 3 架构，采用 256GB 的 HBM3e 内存，内存带宽最高可达 6TB/ 秒。公司预期这款芯片将从四季度开始生产，并将在明年一季度通过合作的服务器生产商供货。AMD 掌门苏姿丰在发布会上强调：“你们能看到的是，MI325 在运行 Llama 3.1 时，能提供比英伟达 H200 高出多达 40% 的性能。”根据官方文件，与 H200 相比，具有参数优势的 MI325 能够提供 1.3 倍的峰值理论 FP16 (16位浮点数) 和 FP8 计算性能。苏姿丰表示，数据中心人工智能加速器的市场将在2028年增长至5000亿美元。

—— 财联社

2024年12月5日
中国租用英伟达AI芯片比美国便宜

在中国租用英伟达AI芯片比美国便宜

使用英伟达人工智能芯片提供的云服务在中国的租赁成本低于美国。以一台配备8枚英伟达A100处理器(基本配置)的服务器来看，4家小型中国云服务提供商向本土科技公司收取每小时约6美元的使用费。美国的小型云服务供应商对同样配置的服务器每小时收费约10美元。芯片经销商和科技初创企业表示，这些产品相对容易获得。在小红书和淘宝等平台以及电子产品市场，A100和H100存货被公开推销售卖，价格略高于海外定价。一家中国小型云提供商的负责人表示，国内运营成本较低，帮助抵消了服务提供商购买走私的英伟达处理器所支付的较高价格。“工程师很便宜，电很便宜，而竞争激烈，”他说道。

—— 英国金融时报

2024年12月5日
华为AI芯片存在性能问题阻碍中国人工智能进步

华为的软硬件缺陷阻碍中国在人工智能芯片领域取代英伟达的努力

华为的 AI 芯片被广泛采用，但客户抱怨其产品存在性能问题，而且从英伟达软件平台切换过来存在困难。多名业内人士称，这些华为芯片在模型的初步训练方面仍远远落后于英伟达。他们将原因归咎于稳定性问题、芯片之间的连接速度较慢，以及华为开发的软件 Cann 较差。研究人员称，该软件使得昇腾产品“难用且不稳定”，并阻碍了测试工作。这些芯片频繁崩溃，使 AI 开发工作复杂化。

华为研究员对此表示，崩溃的原因在于硬件难用，“人们对这款硬件本身了解不多，很容易得到糟糕的结果。”知情人士透露，为了应对这个问题，华为已经派遣工程师到客户公司协助将之前针对 Cuda 编写的训练代码迁移到 Cann 上。百度、科大讯飞和腾讯等科技公司已接受华为工程师团队的帮助。

—— 金融时报

2024年12月5日
SK海力士获美方9.5亿美元资助AI芯片研发

SK海力士获美国9.5亿美元资助 AI 芯片研发

SK 海力士公司将获得美国4.5亿美元的初始拨款和5亿美元的贷款，以在印第安纳州建设先进的芯片封装和研究设施，该项目将增强美国人工智能供应链关键部分的产能。这座投资38.7亿美元的工厂将封装高带宽内存芯片，供英伟达等 AI 芯片制造商使用，而这家韩国公司在这一领域占据主导地位。据商务部官员表示，SK 海力士预计将从韩国向其美国工厂运送自己的内存芯片。该工厂预计将创造约1,000个就业岗位。除了补助金和贷款外，SK 海力士预计将像其他在美国建厂的公司一样享受 25% 的税收抵免。

—— 彭博社

2024年12月5日
Nvidia 下一代 AI 芯片因设计缺陷而推迟

Nvidia 下一代 AI 芯片因设计缺陷而推迟发货

据两名帮助 Nvidia 生产芯片和服务器硬件的人士的信息，因为存在设计缺陷， Nvidia 即将推出的 AI 芯片将被推迟至少三个月。这可能会对 Meta、谷歌和微软等客户造成影响，这些客户总共订购了价值数百亿美元的芯片。另据一名微软员工和另一位知情人士透露， Nvidia 本周告诉其最大客户之一的微软和另一家大型云提供商，其新 Blackwell 系列芯片中最先进的 AI 芯片将被推迟。

—— The Information

2024年12月5日
英伟达为中国市场准备新AI芯片

Nvidia 正在为中国市场准备新的旗舰 AI 芯片特供版本

三位知情人士称，英伟达正在开发一款面向中国市场的新型旗舰 AI 芯片，该芯片将符合与美国目前的出口管制要求。在该公司将于今年晚些时候量产的 “Blackwell” 芯片系列中，旗舰芯片 B200 在某些任务上的速度比其前代产品快 30 倍。两位消息人士称，英伟达将与其在中国的主要分销合作伙伴之一浪潮集团合作，推出和分销这款暂定名为“B20”的芯片。此前，英伟达开发了三款专门针对中国市场的芯片。浪潮信息证券部门回应：“公司目前未开展与‘B20’相关业务与合作，该消息不属实。感谢您对公司的关注。”

—— 路透社

2024年12月5日
微软积累 AI 芯片目标

内部文件显示微软公司的目标是在今年年底前积累 180 万块 AI 芯片

据一份文件显示，微软计划在2024年将 GPU 数量增加两倍，目标到2024年年底积累180万块 AI 芯片。微软正试图让生成式人工智能更快、更好、更便宜，但这一努力在很大程度上依赖于微软购买芯片、图形处理单元，主要来自英伟达。该公司与 OpenAI 合作，处于生成式人工智能热潮的前沿。保持这一领域的领先地位代价不菲。两位知情人士透露，从本财年到2027财年，微软预计将在 GPU 和数据中心上花费约1000亿美元。

—— 商业内幕

2024年12月5日
Meta推出下一代定制AI芯片

Meta 公司推出新一代定制 AI 芯片

当地时间周三，Meta 公布了其芯片开发的最新成果。该芯片被称为“下一代”Meta 训练和推理加速器 (MTIA)，是去年 MTIA v1 的后继产品。目前，MTIA 主要训练排名和推荐算法，但 Meta 表示，其目标是最终扩展芯片功能，开始训练生成式人工智能，如其 Llama 语言模型。Meta 表示，新的 MTIA 芯片将“从根本上”侧重于提供计算、内存带宽和内存容量之间的适当平衡。该芯片拥有 256MB 的片上内存和 1.35GHz 的主频，采用 5 纳米工艺制造，相较于 MTIA v1 的 128MB 和 800MHz 整体性能提高了 3 倍。

—— Theverge、Techcrunch

2024年12月5日
谷歌推出新的AI加速芯片和CPU

谷歌推出基于 Arm 的数据中心处理器 Axion 和下一代 TPU 芯片

谷歌9日在其年度云计算会议上公布了其下一代数据中心 AI 加速芯片 TPU 的细节，并宣布推出自行设计的基于 ARM 架构的数据中心 CPU。

谷歌的张量处理单元 (TPU) 是英伟达制造的先进 AI 芯片的少数可行替代品之一，但开发人员只能通过谷歌云访问它们，而不能直接购买。谷歌表示，下一代 TPU v5p 芯片可在8,960个芯片的芯片集群中运行，原始性能可达到上一代 TPU 的两倍。为了确保芯片组以最佳性能运行，谷歌采用了液体冷却技术。TPU v5p 将于9日在谷歌云正式发布。

谷歌计划通过谷歌云提供被称为 Axion 的基于 ARM 的 CPU。Axion 芯片的性能比通用 ARM 芯片高出30%，比英特尔和 AMD 生产的当前一代 x86 芯片高出50%。Axion 已在多项谷歌服务中使用，并计划于今年晚些时候向公众开放。

—— 华尔街日报

2024年12月5日