Hugging Face 社区的研究人员正构建更开源的 DeepSeek 模型
DeepSeek 发布其 R1“推理”人工智能模型后不到一周,人工智能模型社区 Hugging Face 宣布了 Open-R1 项目。目标是在几周内使用配备 768 个 H100 GPU 的科学集群完全复制 R1 模型,计划填补 DeepSeek 没有开源的全部组件。虽然 R1 模型的权重已经提供,但用于训练模型的数据集和代码或说明却并未提供。Hugging Face 将完全开源该项目的所有数据集、代码和训练细节。这项工作非常重要,其可以作为研究人员、科学家和企业负担得起的模型,以促进创新和突破。该项目工程师表示:“完全开源 R1 的完整架构不仅是为了透明度,也是为了释放其潜力。”
—— TechCrunch、Open-R1 项目