标签: 深度学习

  • 谷歌深度intelligence开发的人工智能模型alphachip

    谷歌 DeepMind 开源用于芯片设计的人工智能模型 AlphaChip

    谷歌 DeepMind 周四宣布人工智能驱动的电子芯片设计领域突破:AlphaChip。它始于2020年的一个研究项目,是一种用于设计芯片布局的强化学习方法。谷歌称已经在其三代张量处理单元 (TPU) 中使用 AlphaChip 创建了“超人芯片布局”。谷歌声表示它可以在数小时内生成高质量的芯片布局,而人类专家则需要数周或数月的努力,而且模型生成的设计性能也超越人类专家。

    相关技术细节已经以论文形式发表在《自然》杂志上。谷歌还在 GitHub 上开源了 AlphaChip 的预训练检查点分享模型权重。该公司报告称,AlphaChip 的影响已经超出了谷歌的范围,除了其新一代 ARM 架构数据中心芯片 Axion,联发科和三星等芯片设计公司都在采用和构建该技术用于他们的芯片。AlphaChip 引发了芯片设计人工智能领域的新研究方向,有可能优化从计算机架构到制造的芯片设计周期的每个阶段。

    —— Google 博客

  • DeepMind 设计智能体机器人

    DeepMind 推出“足球运动员”智能体机器人

    Google DeepMind 研发的具身智能体(agent)微型人形机器人,不仅可以快速“奔跑”“过人”“进攻”,还可以阅读比赛,正确预测足球移动方向,以及阻挡对手射门等,并且可以在现实环境中进行对抗。使用深度强化学习训练低成本的现成机器人踢多机器人足球,机器人在训练后展现出的敏捷性和流畅性远超期望。智能体也涌现出了一些意想不到的策略,这些策略比脚本策略更充分地利用了系统的全部功能,而这些策略可能是人类根本没有想到的。该研究以4月封面文章的形式已发表在 Science Robotics 上,题为“利用深度强化学习让双足机器人掌握敏捷足球技能”。

    视频中左侧为具有学习能力的机器人,右侧是作为参照以脚本编程的机器人。

    —— Science Robotics ,arxiv

  • Stable LM 3B

    Stability AI 发布最新语言模型:Stable LM 3B

    Stability AI 发布了其最新语言模型:Stable LM 3B,设计用于在手持设备和笔记本电脑等便携式数字设备上运行。

    Stable LM 3B 拥有30 亿个参数(业界通常使用的参数为 70 亿到 700 亿个),是一种紧凑型语言模型。Stable LM 3B 的主要优势之一是其更小的尺寸和更高的效率。与大型模型不同,这些模型需要的资源更少,因此大多数用户都可以轻松使用它们。

    与之前的稳定 LM 版本相比,该版本在保持了快速的执行速度的同时,在生成文本方面明显更好。在常见自然语言处理基准测试(包括常识推理和常识测试)中,它的的下游性能得到了提高。

    —— Stability AI

  • 深度强化学习足球机器人

    DeepMind 的深度强化学习足球机器人

    在 MuJoCo 物理引擎中进行模拟训练,再转移进真实机器人。可以无缝做出抢断、起身、踢球和追球动作,还对比赛有了基本的战略理解,学习预测球的运动和阻挡对手的射门。

    —— Google