微闻

标签: 深度学习

  • DeepMind AI 在几何题中超越国际数学奥林匹克金牌得主

    DeepMind 的 AI 系统在几何问题中表现优于国际数学奥林匹克金牌得主

    Google DeepMind 开发的人工智能系统 AlphaGeometry2 是去年 1 月发布的 AlphaGeometry 系统的改进版。在一项新发表的研究中,该模型可以解决过去 25 年来国际数学奥林匹克 (IMO)中 84% 的几何问题。该系统解决了 50 道题中的 42 道,超过了金牌得主的平均得分 40.9。测试中还发现系统能够产生人类通常无法想到的、既有创意又高效的解法。

    AlphaGeometry2 包括来自谷歌 Gemini 的语言模型和“符号引擎”。Gemini 模型帮助符号引擎使用数学规则推断问题的解决方案,得出给定几何定理的可行证明。这或许证明了符号操作和神经网络这两种方法的结合是探索可通用人工智能的一条有希望的道路。根据论文,仅具有神经网络架构的 OpenAI o1 无法解决 AlphaGeometry2 能够解答的任何 IMO 问题。

    —— TechCrunch

  • 亚马逊云科技全面上线深 seek-r1 模型

    DeepSeek-R1 模型全面上线亚马逊云科技

    亚马逊云科技公众号宣布,今日起用户可以在Amazon Bedrock和Amazon SageMaker AI中部署DeepSeek-R1模型。Amazon Bedrock最适合那些希望通过API快速集成预训练模型的团队;Amazon SageMaker AI则非常适合自己进行高级定制、训练和部署、调用基础设施的团队。此外,用户还可以通过Amazon EC2、Amazon SageMaker AI,使用Amazon Trainium和Amazon Inferentia,用更具性价比的方式部署DeepSeek-R1-Distill。

    —— 亚马逊云科技

  • 谷歌深度intelligence开发的人工智能模型alphachip

    谷歌 DeepMind 开源用于芯片设计的人工智能模型 AlphaChip

    谷歌 DeepMind 周四宣布人工智能驱动的电子芯片设计领域突破:AlphaChip。它始于2020年的一个研究项目,是一种用于设计芯片布局的强化学习方法。谷歌称已经在其三代张量处理单元 (TPU) 中使用 AlphaChip 创建了“超人芯片布局”。谷歌声表示它可以在数小时内生成高质量的芯片布局,而人类专家则需要数周或数月的努力,而且模型生成的设计性能也超越人类专家。

    相关技术细节已经以论文形式发表在《自然》杂志上。谷歌还在 GitHub 上开源了 AlphaChip 的预训练检查点分享模型权重。该公司报告称,AlphaChip 的影响已经超出了谷歌的范围,除了其新一代 ARM 架构数据中心芯片 Axion,联发科和三星等芯片设计公司都在采用和构建该技术用于他们的芯片。AlphaChip 引发了芯片设计人工智能领域的新研究方向,有可能优化从计算机架构到制造的芯片设计周期的每个阶段。

    —— Google 博客

  • DeepMind 设计智能体机器人

    DeepMind 推出“足球运动员”智能体机器人

    Google DeepMind 研发的具身智能体(agent)微型人形机器人,不仅可以快速“奔跑”“过人”“进攻”,还可以阅读比赛,正确预测足球移动方向,以及阻挡对手射门等,并且可以在现实环境中进行对抗。使用深度强化学习训练低成本的现成机器人踢多机器人足球,机器人在训练后展现出的敏捷性和流畅性远超期望。智能体也涌现出了一些意想不到的策略,这些策略比脚本策略更充分地利用了系统的全部功能,而这些策略可能是人类根本没有想到的。该研究以4月封面文章的形式已发表在 Science Robotics 上,题为“利用深度强化学习让双足机器人掌握敏捷足球技能”。

    视频中左侧为具有学习能力的机器人,右侧是作为参照以脚本编程的机器人。

    —— Science Robotics ,arxiv

  • Stable LM 3B

    Stability AI 发布最新语言模型:Stable LM 3B

    Stability AI 发布了其最新语言模型:Stable LM 3B,设计用于在手持设备和笔记本电脑等便携式数字设备上运行。

    Stable LM 3B 拥有30 亿个参数(业界通常使用的参数为 70 亿到 700 亿个),是一种紧凑型语言模型。Stable LM 3B 的主要优势之一是其更小的尺寸和更高的效率。与大型模型不同,这些模型需要的资源更少,因此大多数用户都可以轻松使用它们。

    与之前的稳定 LM 版本相比,该版本在保持了快速的执行速度的同时,在生成文本方面明显更好。在常见自然语言处理基准测试(包括常识推理和常识测试)中,它的的下游性能得到了提高。

    —— Stability AI

  • 深度强化学习足球机器人

    DeepMind 的深度强化学习足球机器人

    在 MuJoCo 物理引擎中进行模拟训练,再转移进真实机器人。可以无缝做出抢断、起身、踢球和追球动作,还对比赛有了基本的战略理解,学习预测球的运动和阻挡对手的射门。

    —— Google