微闻

标签: 大模型

  • 大模型创新不再依赖最先进硬件

    官媒:大模型创新不一定要依赖最先进硬件

    OpenAI以规模作为大模型的制胜法宝:为追求更高的性能,模型体积不断膨胀,参数数量呈现指数级增长。这种开发模式,带来了惊人的能源消耗和训练成本,难以为继。而中国公司运用剪枝、量化、知识蒸馏等一系列创新技术,开启了大模型瘦身新风尚,走出一条“小而强”的新路径。以DeepSeek公司为例,R1在多个基准测试中与OpenAI的o1持平,但成本仅为o1的三十分之一。DeepSeek的成功证明,大模型创新不一定要依赖最先进的硬件,而是可以通过聪明的工程设计和高效的训练方法实现。这种技术突破不仅降低了AI大模型的硬件门槛和能源消耗,更重要的是为AI技术普惠化铺平了道路。

    —— 中国官媒《经济日报》

  • Gemma 2 大模型升级

    Google 推出开源大模型更新 Gemma 2

    Google 今天发布了其下一代开源大模型 Gemma 2,有 9B 和 27B 两种参数大小。与第一代相比,其性能更高、推理效率更高,并且内置了显著的安全改进。 Google称, 27B 的模型性能可以与比其大两倍的模型相媲美。这些大模型可在单个 NVIDIA H100 GPU 或 TPU 主机实现全精度推理,从而显著降低部署成本。 Gemma 2 也可以在 CPU 上使用量化版本进行本地推理,或者在配备 NVIDIA RTX 或 GeForce RTX 的个人电脑上使用。

    —— Google 博客

  • 小红书内测自研大模型

    社交平台小红书内测自研大模型“小地瓜” 社交和搜索是落地方向

    36氪从多个独立信源获悉,由小红书AI创新负责人张德兵牵头的大模型团队,在部分内部产品灰度测试自研通用大模型基座“小地瓜”。小红书AI产品的探索,则主要由小红书产品和设计负责人邓超负责。几名知情者透露,小红书对上线新AI产品的态度非常谨慎,原因是害怕破坏现有的内容生态。一名知情者说:“小红书的内容生态是活人种草,AI在里面怎么样才不违和,这是困扰小红书的一个问题。”社交和搜索,则是小红书希望走出图文种草的舒适区,用AI触达更多用户的新场景。

    —— 36氪

  • Mistral 8x22B 大模型开源

    Mistral AI 开源 Mistral 8x22B Moe 大模型

    Mistral AI 公司刚刚再次用磁力链接开源了一款大模型 Mistral 8x22B,模型文件大小为 281.24 GB。从模型的名字来看,Mistral 8x22B 是去年开源的「mixtral-8x7b」的超级大杯版本,参数规模增长三倍不止,由 8 个 220 亿参数规模 (8×22B) 的专家网络组成。
    磁力链接地址:magnet:?xt=urn:btih:9238b09245d0d8cd915be09927769d5f7584c1c9&dn=mixtral-8x22b&tr=udp%3A%2F%2Fopen.demonii.com%3A1337%2Fannounce&tr=http%3A%2F%2Ftracker.opentrackr.org%3A1337%2Fannounce

    —— Mistral AI、oschina

  • 阿里推出大模型和行业应用类模型

    有消息说:阿里版ChatGPT本月11日亮相

    潮新闻记者从圈内人士得到的独家消息,2023阿里云峰会上将正式推出阿里大模型,接下来还有各类的行业应用类模型会面世。

    “阿里11日推出大模型,18日推出行业应用类模型。”潮新闻记者从圈内人士得到的独家消息。

    “我们没有任何可以公布的消息”“我也是从你这里得到的消息”“一切以我们的公告为准”。不过,潮新闻记者从阿里云人士处得到的消息,全是“不知道”。

    之前,有博主测试了天猫精灵,发现已经上线了阿里版ChatGPT语音助手版,那位博主一共测试了15个问题,有10个的回答表现都优于竞品。

    “这是测试版,天猫精灵的确已经接入了大模型产品。” 一位阿里内部人士确认,大模型产品已经在阿里内部各个产品线接入并进行了内测,表现很惊艳。

    —— 第一财经