Hugging Face 正推出 Open-R1 项目

Hugging Face 社区的研究人员正构建更开源的 DeepSeek 模型

DeepSeek 发布其 R1“推理”人工智能模型后不到一周,人工智能模型社区 Hugging Face 宣布了 Open-R1 项目。目标是在几周内使用配备 768​​ 个 H100 GPU 的科学集群完全复制 R1 模型,计划填补 DeepSeek 没有开源的全部组件。虽然 R1 模型的权重已经提供,但用于训练模型的数据集和代码或说明却并未提供。Hugging Face 将完全开源该项目的所有数据集、代码和训练细节。这项工作非常重要,其可以作为研究人员、科学家和企业负担得起的模型,以促进创新和突破。该项目工程师表示:“完全开源 R1 的完整架构不仅是为了透明度,也是为了释放其潜力。”

—— TechCrunch、Open-R1 项目

更多文章

评论

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注