微闻

标签: 推理

  • 富士康推出台湾首个推理人工智能大模型

    富士康推出台湾首个推理人工智能大模型

    富士康当地时间周一表示,该公司推出自有大语言模型,该模型具有推理能力,由公司内部开发,仅用四周时间就完成了训练。富士康称,这款名为FoxBrain的人工智能模型最初是为公司内部应用而设计,涵盖数据分析、数学、推理和代码生成等功能。富士康表示,英伟达提供了其台湾超级计算机的支持和技术咨询,使模型训练取得成功,并打算将该模型开源。该公司表示,栗永徽的团队使用120块英伟达H100图形处理器,在大约四周时间内完成了FoxBrain的训练。模型以Meta Llama 3.1为基础架构,是台湾首个具有先进推理能力的大语言模型,专为繁体中文设计和优化,富士康表示,其模型的部分性能略逊于中国DeepSeek部分模型。

    —— 华尔街日报

  • 亚马逊新推理 AI 模型

    亚马逊正在开发一款新的“推理” AI 模型

    亚马逊正在开发一款具备先进“推理”能力的人工智能模型。据一位直接参与该项目的知情人士透露,这款新产品计划最早在六月以“Nova”品牌发布,这是亚马逊去年底推出的一系列生成式人工智能模型。这位知情人士补充说,亚马逊希望新模型采用一种“混合推理”方式,既能快速给出答案,又能在同一系统中进行更为复杂的思考。亚马逊首要目标之一是让其Nova推理模型在价格上优于竞争对手。亚马逊此前表示,其现有的Nova模型比通过 Bedrock 平台提供的第三方模型便宜至少 75%。亚马逊另一个目标是让即将推出的推理模型在外部基准测试中排名前五。

    —— 商业内幕

  • Anthropic发布新AI模型,让用户决定推理程度

    Anthropic 的新AI模型让用户决定推理程度

    人工智能公司Anthropic正在发布一款新的人工智能模型,让用户决定是想要快速回答一个简单的问题,还是想要模仿人类推理的更耗时的回答。借助 Claude 3.7 Sonnet,用户将能够根据查询的复杂程度选择让人工智能系统花费更多或更少的时间来计算答案。该模型于周一向免费和付费用户推出,尽管非付费用户最初将无法使用额外的计算能力来响应他们的提示。如果用户要求花费更多时间计算响应,该模型将显示其遵循的思路链过程的书面细节。Claude 3.7 Sonnet 将包含 “计算机使用” 功能,可以解读用户在计算机上看到的内容,并在用户许可下代表他们执行浏览互联网、打字和点击按钮等操作。

    —— 彭博社

  • “训练推理能力的人工智能模型”

    研究员以不到50美元训练出优质推理模型

    根据上周五发布的新研究论文,斯坦福大学和华盛顿大学的人工智能研究人员能够以不到50美元的云计算积分训练出具备“推理”能力的人工智能模型。该模型名为 s1,在数学和编程能力测试中表现出与 OpenAI 的 o1 和 DeepSeek 的 r1 等顶尖推理模型相似的水平。s1 模型可在 GitHub 上获取,同时还可获取用于训练该模型的数据和代码。s1 团队表示,他们从一个现成基础模型开始,然后通过“蒸馏”对其进行微调。研究人员称,s1 是从谷歌推理模型 Gemini 2.0 Flash Thinking Experimental 中蒸馏出来的。与伯克利分校的研究人员上个月以约450美元的价格创建人工智能推理模型所采用的方法相同。

    —— Techcrunch、GitHub

  • 黄仁勋提到“推理”AI将依赖于更低成本的计算

    黄仁勋称“推理”AI将依赖于更低成本的计算

    ​英伟达首席执行官黄仁勋表示,人工智能的未来将是能够“推理”的服务,但这样的阶段需要先把计算成本降下来。黄仁勋表示,下一代工具将能够通过数百或数千个步骤来响应查询,并对自己的结论进行反思。这将赋予未来的软件推理能力,使其与当前系统区分开来。黄仁勋表示,英伟达将在相同的成本和能耗水平下,每年将其芯片性能提高两到三倍为这些进步奠定基础。这将改变人工智能系统处理推理的方式,即发现模式并得出结论的能力。“我们能够大幅降低智能成本,”他说。“我们都意识到了这一点的价值。如果我们能够大幅降低成本,我们就可以在执行任务时进行推理之类的操作。”

    —— 彭博社

  • OpenAI开发草莓推理技术

    OpenAI正在开发代号为“草莓”的新推理技术

    据知情人士和查阅的内部文件,OpenAI 正在一个代号为“Strawberry”的项目中开发一种新的人工智能模型。该项目的细节此前从未被报道过,目前该公司正在努力展示其提供的模型类型能够提供高级推理能力。这位知情人士说,即使在公司内部,Strawberry 的工作原理也是一个严格保密的秘密。知情人士还透露,该内部文件描述了一个使用 Strawberry 模型的项目,目的是使该公司的人工智能不仅能够生成查询的答案,而且能够提前做好足够的计划,自主可靠地在互联网上导航,以执行 OpenAI 所说的“深度研究”。

    —— 路透社