大模型创新不再依赖最先进硬件

官媒:大模型创新不一定要依赖最先进硬件

OpenAI以规模作为大模型的制胜法宝:为追求更高的性能,模型体积不断膨胀,参数数量呈现指数级增长。这种开发模式,带来了惊人的能源消耗和训练成本,难以为继。而中国公司运用剪枝、量化、知识蒸馏等一系列创新技术,开启了大模型瘦身新风尚,走出一条“小而强”的新路径。以DeepSeek公司为例,R1在多个基准测试中与OpenAI的o1持平,但成本仅为o1的三十分之一。DeepSeek的成功证明,大模型创新不一定要依赖最先进的硬件,而是可以通过聪明的工程设计和高效的训练方法实现。这种技术突破不仅降低了AI大模型的硬件门槛和能源消耗,更重要的是为AI技术普惠化铺平了道路。

—— 中国官媒《经济日报》

更多文章

评论

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注