微闻

标签: 训练

  • “Breaking: OpenAI训练出擅长创意写作的人工智能生成精准元小说”

    OpenAI训练出非常擅长创造性写作的AI

    当地时间周二,OpenAI CEO 萨姆·奥尔特曼在社交平台X上发文称,公司已训练出了一个“新模型”,在创意写作方面“非常出色”。他发布了一篇由该模型生成的长篇样本,提示词是:“请写一篇关于人工智能和悲伤的短篇元小说故事。”奥尔特曼表示:“目前还不确定如何/何时发布,但这是我第一次真正被人工智能写的东西所打动,它精准地把握住了元小说的氛围。”创意写作并非 OpenAI 过去探索的 AI 应用领域。该公司大部分时间都专注于数学、编程等较为严谨和可预测的挑战。而开始尝试写作领域,可能意味着其最新一代模型在语言表达能力上会有巨大的提升。

    —— Techcrunch

  • Meta内部AI训练芯片测试部署

    Meta 开始测试其首款内部 AI 训练芯片

    两位消息人士透露,Meta公司正在测试其首款用于训练人工智能系统的内部芯片,这是该公司转向设计更多自己的定制芯片并减少对英伟达等外部供应商依赖的一个重要里程碑。消息人士表示,这家社交媒体公司已开始小规模部署这款芯片,并计划如果测试顺利,就增加产量以进行大规模使用。推动内部芯片开发是该公司长期计划的一部分,目的是降低庞大的基础设施成本。这款新训练芯片是一款专用加速器,专门用于处理人工智能相关任务。Meta公司正在与台湾芯片制造商台积电合作生产该芯片。测试部署是在Meta完成芯片的首次“流片”后启动的。

    —— 路透社

  • “训练推理能力的人工智能模型”

    研究员以不到50美元训练出优质推理模型

    根据上周五发布的新研究论文,斯坦福大学和华盛顿大学的人工智能研究人员能够以不到50美元的云计算积分训练出具备“推理”能力的人工智能模型。该模型名为 s1,在数学和编程能力测试中表现出与 OpenAI 的 o1 和 DeepSeek 的 r1 等顶尖推理模型相似的水平。s1 模型可在 GitHub 上获取,同时还可获取用于训练该模型的数据和代码。s1 团队表示,他们从一个现成基础模型开始,然后通过“蒸馏”对其进行微调。研究人员称,s1 是从谷歌推理模型 Gemini 2.0 Flash Thinking Experimental 中蒸馏出来的。与伯克利分校的研究人员上个月以约450美元的价格创建人工智能推理模型所采用的方法相同。

    —— Techcrunch、GitHub

  • YouTube允许第三方公司使用视频进行人工智能训练

    YouTube创作者可选是否允许第三方AI训练

    YouTube 平台正在推出一种方法,让创作者允许第三方公司使用他们的视频来训练人工智能模型。需要明确的是,默认设置是关闭的,这意味着如果您不想让第三方公司抓取您的视频用于人工智能训练,无需执行任何操作。但如果出于某种原因确实想允许,这将是一个选择。YouTube 将在“未来几天”在 YouTube Studio 中推出该设置,并且“仍然禁止”未经授权的抓取。创作者可以从第三方公司列表中挑选允许使用您视频进行训练的公司,或者选择允许所有第三方公司。名单包括 AI21 Labs、Adobe、IBM、Meta、字节跳动、Cohere、Anthropic、Runway、英伟达、苹果、微软、OpenAI、Perplexity、亚马逊、Pika Labs、Stability AI 和 xAI。

    —— TheVerge

  • 美国国防公司将保存战场数据以训练AI模型

    美国国防公司将保存战场数据以训练AI模型

    美国软件公司帕兰提尔科技和美国国防技术公司安杜里尔工业计划加速人工智能在美国军队中的应用,并邀请其他公司加入这一努力。根据周五宣布的一项协议,传感器、车辆、机器人和武器产生的战场信息将由安杜里尔的 Lattice 软件收集,然后输入安全的帕兰提尔平台,该平台将为用于人工智能培训和开发的数据做好准备。收集的数据将包括最高机密级别的信息。这是国防科技公司本周宣布的一系列合作中的最新一项,旨在将人工智能技术更多地应用于军事领域。周三,安杜里尔公布了与OpenAI合作开发反无人机系统的计划,而帕兰提尔周四与 Shield AI 签署协议,合作开发自动飞行系统。

    —— 彭博社

  • 微软否认利用用户数据训练人工智能

    微软否认利用用户数据训练人工智能模型

    微软周三否认了其使用包括 Word 和 Excel 在内的 Microsoft 365 应用程序中的客户数据来训练人工智能模型的说法。此前,一些用户在社交媒体上指出,微软要求用户退出“连接体验”功能,他们认为该功能被用于训练人工智能模型。微软发言人表示,这些说法是不真实的,微软不会使用来自 Microsoft 365 消费者和商业应用的客户数据来训练基础大型语言模型。该发言人补充说,“连接体验”可实现共同创作和云存储等功能,与公司如何训练其大型语言模型没有任何关系。

    —— 路透社

  • 蓝天应用表示不会利用用户帖子的数据进行人工智能训练

    Bluesky 表示不会在你的帖子上训练人工智能

    社交应用 Bluesky 周五表示,不会利用用户的帖子来训练生成式人工智能。该声明与社交平台 X 和 Threads 的人工智能训练政策形成了鲜明对比。Bluesky 表示:“许多艺术家和创作者都在 Bluesky 上安家,我们听到了他们对其他平台使用他们的数据进行训练的担忧,我们不会使用您的任何内容来训练生成式人工智能,也不打算这样做。”在后续帖子中,该去中心化社交平台澄清说,确实在使用人工智能来帮助内容审核。“Bluesky 在内部使用人工智能来协助内容审核,这有助于我们对帖子进行分类,并保护人类版主免受有害内容的侵害,但这些都不是基于用户内容训练的生成式人工智能系统。”

    —— The Verge

  • 物理学家用物理工具 Training 人工神经网络

    诺贝尔物理学奖获得者因“利用物理学工具训练人工神经网络”而获奖

    诺奖委员委员会表示,今年的两位诺贝尔物理学奖得主利用物理学工具开发出的方法,为当今强大的机器学习奠定了基础,并进一步阐述其获奖工作的细节。

    约翰·霍普菲尔德发明了一种网络,它使用一种保存和重新创建模式的方法。霍普菲尔德网络利用物理学来描述材料由于原子自旋而产生的特性。整个网络的描述方式相当于物理学中自旋系统的能量,并通过寻找节点之间连接的值来进行训练,以便保存的图像具有较低的能量。当霍普菲尔德网络被输入扭曲或不完整的图像时,它会有条不紊地处理节点并更新它们的值,从而降低网络的能量。因此,网络逐步找到与输入的不完美图像最相似的保存图像。

    杰弗里·辛顿以霍普菲尔德网络为基础,创建了一个采用不同方法的新网络:玻尔兹曼机,它可以学习识别给定类型数据中的特征元素。辛顿使用了统计物理学的工具,统计物理学是由许多相似组件构建的系统科学。通过输入机器运行时很可能出现的示例来训练机器。玻尔兹曼机可用于对图像进行分类或创建训练模式类型的新示例。辛顿在此基础上继续发展,帮助开启了机器学习的爆炸式发展。

    —— 诺贝尔奖

  • 美国国土安全局计划使用入境移民儿童的面部数据进行训练

    美国国土安全局将收集移民儿童的面部扫描数据

    美国国土安全局 (DHS) 正在寻求改进其面部识别算法,计划使用入境移民儿童的面部数据进行训练。该机构打算收集和分析14岁以下儿童的面部图像。参与政府生物识别服务开发的国土安全局生物识别身份管理办公室助理主任约翰·博伊德表示,收集的对象将包括婴儿。通常,收集入境移民的生物特征信息甚至DNA样本的计划仅适用于14岁至79岁之间的人。博伊德称,至少据他所知,国土安全局尚未开始根据该计划收集生物特征信息,但他可以确认他的办公室正在为该项目提供资金。该计划收集的数据有助于提高面部识别技术对人类年龄变化的理解。最终可以帮助当局在多年后找到失踪儿童。

    —— 《麻省理工技术评论》

  • 谷歌深度智慧使用Gemini AI训练机器人

    谷歌 DeepMind 正在使用 Gemini 来训练机器人使其变得更聪明

    谷歌正在使用 Gemini AI 训练其机器人,以便它们能够更好地导航和完成任务,DeepMind 机器人团队在一篇新的研究论文中解释了如何使用 Gemini 1.5 Pro 的长上下文窗口,让用户可以使用自然语言指令更轻松地与其 RT-2 机器人进行交互。

    其工作原理是拍摄指定区域的视频,研究人员使用 Gemini 1.5 Pro 让机器人“观看”视频以了解环境,然后机器人可以根据情况执行命令。 DeepMind 表示其 Gemini 驱动的机器人在超过 50 个任务中的成功率高达 90%。研究人员还发现“初步证据”表明,Gemini 使其机器人能够计划如何执行导航以外的指令,例如,当办公桌上有很多可乐罐的用户询问机器人“是否有他们最喜欢的饮料”时,Gemini 就会知道“机器人应该导航到冰箱,检查是否有可乐,然后返回给用户报告结果。”DeepMind 表示计划进一步调查这些结果。

    —— The Verge,arxiv