标签：大模型

大模型创新不再依赖最先进硬件

官媒：大模型创新不一定要依赖最先进硬件

OpenAI以规模作为大模型的制胜法宝：为追求更高的性能，模型体积不断膨胀，参数数量呈现指数级增长。这种开发模式，带来了惊人的能源消耗和训练成本，难以为继。而中国公司运用剪枝、量化、知识蒸馏等一系列创新技术，开启了大模型瘦身新风尚，走出一条“小而强”的新路径。以DeepSeek公司为例，R1在多个基准测试中与OpenAI的o1持平，但成本仅为o1的三十分之一。DeepSeek的成功证明，大模型创新不一定要依赖最先进的硬件，而是可以通过聪明的工程设计和高效的训练方法实现。这种技术突破不仅降低了AI大模型的硬件门槛和能源消耗，更重要的是为AI技术普惠化铺平了道路。

—— 中国官媒《经济日报》

2025年1月26日
Gemma 2 大模型升级

Google 推出开源大模型更新 Gemma 2

Google 今天发布了其下一代开源大模型 Gemma 2，有 9B 和 27B 两种参数大小。与第一代相比，其性能更高、推理效率更高，并且内置了显著的安全改进。 Google称， 27B 的模型性能可以与比其大两倍的模型相媲美。这些大模型可在单个 NVIDIA H100 GPU 或 TPU 主机实现全精度推理，从而显著降低部署成本。 Gemma 2 也可以在 CPU 上使用量化版本进行本地推理，或者在配备 NVIDIA RTX 或 GeForce RTX 的个人电脑上使用。

—— Google 博客

2024年12月5日
小红书内测自研大模型

社交平台小红书内测自研大模型“小地瓜” 社交和搜索是落地方向

36氪从多个独立信源获悉，由小红书AI创新负责人张德兵牵头的大模型团队，在部分内部产品灰度测试自研通用大模型基座“小地瓜”。小红书AI产品的探索，则主要由小红书产品和设计负责人邓超负责。几名知情者透露，小红书对上线新AI产品的态度非常谨慎，原因是害怕破坏现有的内容生态。一名知情者说：“小红书的内容生态是活人种草，AI在里面怎么样才不违和，这是困扰小红书的一个问题。”社交和搜索，则是小红书希望走出图文种草的舒适区，用AI触达更多用户的新场景。

—— 36氪

2024年12月5日
Mistral 8x22B 大模型开源

Mistral AI 开源 Mistral 8x22B Moe 大模型

Mistral AI 公司刚刚再次用磁力链接开源了一款大模型 Mistral 8x22B，模型文件大小为 281.24 GB。从模型的名字来看，Mistral 8x22B 是去年开源的「mixtral-8x7b」的超级大杯版本，参数规模增长三倍不止，由 8 个 220 亿参数规模 (8×22B) 的专家网络组成。
磁力链接地址：magnet:?xt=urn:btih:9238b09245d0d8cd915be09927769d5f7584c1c9&dn=mixtral-8x22b&tr=udp%3A%2F%2Fopen.demonii.com%3A1337%2Fannounce&tr=http%3A%2F%2Ftracker.opentrackr.org%3A1337%2Fannounce

—— Mistral AI、oschina

2024年12月5日
阿里推出大模型和行业应用类模型

有消息说：阿里版ChatGPT本月11日亮相

潮新闻记者从圈内人士得到的独家消息，2023阿里云峰会上将正式推出阿里大模型，接下来还有各类的行业应用类模型会面世。

“阿里11日推出大模型，18日推出行业应用类模型。”潮新闻记者从圈内人士得到的独家消息。

“我们没有任何可以公布的消息”“我也是从你这里得到的消息”“一切以我们的公告为准”。不过，潮新闻记者从阿里云人士处得到的消息，全是“不知道”。

之前，有博主测试了天猫精灵，发现已经上线了阿里版ChatGPT语音助手版，那位博主一共测试了15个问题，有10个的回答表现都优于竞品。

“这是测试版，天猫精灵的确已经接入了大模型产品。” 一位阿里内部人士确认，大模型产品已经在阿里内部各个产品线接入并进行了内测，表现很惊艳。

—— 第一财经

2024年12月5日

标签： 大模型

大模型创新不再依赖最先进硬件

Gemma 2 大模型升级

小红书内测自研大模型

Mistral 8x22B 大模型开源

阿里推出大模型和行业应用类模型

标签：大模型