中国的人工智能公司DeepSeek近日宣布推出其最新版本的大语言模型——DeepSeek-V3-0324,并在Hugging Face平台上正式开源。此次更新主要集中在提升模型的推理能力、搜索能力和中文写作水平,较上一版本实现了显著优化。
作为一家总部位于杭州的AI企业,DeepSeek此前已凭借低成本、高性能的产品在市场上崭露头角。其最新推出的V3-0324版本不仅在MMLU-Pro等基准测试中取得了75.9%到81.2%(提升幅度达5.3个百分点)的进步,还在各项评测中展现了超越美国公司Anthropic的Claude Sonnet 3.5模型的实力,被研究者认为可能成为当前最强大的非推理模型。
DeepSeek-V3-0324模型采用MIT许可证协议开源发布,允许开发者自由使用和修改。这一举措不仅体现了企业对技术创新和开放共享的支持,也为全球AI技术的发展提供了新的可能性。
发表回复