标签: 研究人员

  • 亚马逊向AI研究人员提供免费计算能力

    亚马逊向AI研究人员提供免费的计算能力

    亚马逊云计算部门周二表示,将向想要使用其定制人工智能芯片的研究人员提供免费计算能力,旨在挑战英伟达在研究人员中的受欢迎程度。亚马逊 AWS 表示,将向希望使用其 Trainium 芯片的研究人员提供价值1.1亿美元的云数据中心使用额度。Trainium 是亚马逊用于开发人工智能模型的芯片,与英伟达、AMD 和 Alphabet 云部门的芯片竞争。

    AWS 表示,卡内基梅隆大学和加州大学伯克利分校的研究人员正在参与该项目。该公司计划为该项目提供四万块第1代 Trainium 芯片。AWS 计划发布有关其芯片指令集架构的文档,并让客户直接对芯片进行编程。

    —— 路透社

  • 马斯克的星链发射引发研究人员对环境危害的担忧

    百余名研究人员呼吁马斯克暂停星链发射

    研究人员敦促联邦政府暂停进一步的低轨道互联网卫星发射,直到进行全面审查以确定可能造成的潜在环境破坏。在致美国联邦通信委员会 (FCC) 航天局局长朱莉·科尔尼的信中,100多名研究人员对低轨道卫星的快速发展表示担忧,并敦促国际合作确定最佳前进道路。“发射这么多卫星对环境的危害尚不清楚。这是因为联邦政府没有进行环境审查来了解其影响。但我们知道的是,更多的卫星和更多的发射会导致大气中存在更多的有害气体和金属,”研究人员在信中写道。研究人员指出,在短短五年多的时间里,马斯克的卫星互联网服务“星链”已经发射了6000多颗卫星,占所有卫星的60%。此外,他们还批评FCC以“先到先得”的方式发放许可证,并指出轨道空间和广播频谱不是无限的。

    —— 国会山报

  • 中国研究人员开发出基于Meta Llama的军用人工智能工具

    中国研究人员以 Meta 模型开发军用AI工具

    与中国人民解放军相关的顶尖研究机构已经使用 Meta 公开的 Llama 模型开发出潜在的军事应用人工智能工具。路透社看到的一篇6月论文中,来自三家机构的六名中国研究人员详细介绍了他们如何将 Meta 的 Llama 早期版本作为基础开发出所谓的 ChatBIT。研究人员使用了 Meta 早期的 Llama 2 13B 大型语言模型,结合自己的参数构建了一个以军事为重点的 AI 工具来收集和处理情报,并为作战决策提供准确可靠的信息。ChatBIT 经过微调并“针对军事领域的对话和问答任务进行了优化”,性能优于其他一些 AI 模型,这些模型能力约为 OpenAI 强大 ChatGPT-4 的90%。

    —— 路透社

  • 苹果公司人工智能研究人员挑战大语言模型LLM的能力

    苹果研究人员表示AI模型不具有推理能力

    苹果公司的六位人工智能研究人员刚刚发表了一篇关于大语言模型LLM的极好文章,他们勇于挑战主流模式。其中有一段很关键:“我们在语言模型中没有发现形式推理的证据 …. 它们的行为可以用复杂的模式匹配来更好地解释。事实上,这种模式匹配非常脆弱,改变名称可以使结果改变大约10%!”(一句话)改变一个词以不相关的方式重复两遍或添加一些不相关的信息可能会给你不同的答案。

    LLM 缺乏足够抽象和正规推理的另一个表现是,问题越大,性能往往越差。在解决小问题时性能还可以,但很快就会下降。我们可以在整数运算中看到同样的情况。无论是旧模型还是新模型,在越来越大的乘法运算问题上,我们都能多次观察到运算速度下降的现象。埃隆·马斯克的自动驾驶出租车可能也会遭遇类似的问题:它们在最常见的情况下可能能够安全运行,但在某些情况下也可能难以进行足够的抽象推理。

    —— Marcus on AI

  • 哥伦布市阻止研究人员报告被盗警方数据被泄漏

    哥伦布市阻止研究人员报告被盗的警方数据

    当黑客袭击俄亥俄州哥伦布市,导致数据泄露和911服务中断时,市长安德鲁·金瑟淡化了事件的影响,称出现在暗网上的被盗信息对欺诈者而言毫无用处,因为这些信息是加密的或已损坏。网络研究员康纳·古德沃尔夫却表示,事实并非如此。​古德沃尔夫向当地电视台通报,在此次泄漏中,很容易找到许多俄亥俄州居民的未加密数据,这些数据中包括执法部门机密调查文件中的人员姓名。然而哥伦布市的市律师向法院提起诉讼,试图阻止被盗信息的传播。该市刚刚获得了一项针对古德沃尔夫的限制令,禁止他访问、下载或传播在线泄露的黑客数据。

    —— 彭博社

  • 美国康奈尔大学研究人员开发出可将尿液转化为纯净饮用水的航天服系统

    新太空服可将尿液转化为纯净饮用水

    美国康奈尔大学威尔医学院研究人员推出了一个用于航天服的新型尿液收集和过滤系统原型。相关论文发表在12日出版的《空间技术前沿》杂志上。研究人员表示,新的服装原型专为即将到来的月球和火星任务而设计。它包括一个基于真空的外部导管,通向组合的正向反渗透单元,可通过多种安全机制提供持续供应的饮用水,能确保宇航员健康。研究人员设计了一种尿液收集装置。收集到的尿液被转移到尿液过滤系统。该系统采用两步集成正反向渗透过滤技术,可以87%的效率回收水分。该系统利用浓度梯度从尿液中去除水分,再用泵将水和盐分分离。净化后的水富含电解质,并被泵入航天服内的饮料袋中,可再次供饮用。收集和净化500毫升尿液仅需5分钟。目前,新服装原型已经完成开发,并准备在模拟条件下进行测试。

    —— 科技日报

  • OpenAI 研究人员“安全 Culture”被忽视了

    离职高级研究员:OPENAI 将“闪亮产品”置于安全之上

    扬•雷克(Jan Leike)曾领导 OpenAI 引导和控制超级强大的人工智能工具的工作,他表示,由于与上级在初创公司投入这些工作的时间和资源上产生分歧,他于周四辞职。雷克在社交媒体网站 X 上的周五帖子中写道:“过去几年里,安全文化和流程已经被闪亮的产品所取代。”“我们迫切需要找出如何引导和控制比我们更聪明的 AI 系统,”雷克写道。“我之所以加入 OpenAI,是因为我认为这是世界上进行这项研究的最佳场所。然而,我与 OpenAI 领导层在公司的核心优先事项上的分歧已经持续了相当长的一段时间,直到我们最终达到了一个决裂点。”雷克表示,超级对齐团队难以获取计算资源,这些资源正在被用于开发新的面向消费者的模型,例如 OpenAI 在周一发布的最新模型 GPT-4o。“在过去的几个月里,我的团队一直在逆风中奋进。有时我们为了计算资源而苦苦挣扎,这使得完成这项至关重要的研究变得越来越困难,”他写道。

    —— 英国金融时报 (全文截图)

  • 苹果研究人员探索人工智能方法来检测用户说话

    苹果研究人员探索放弃“Siri”短语,改用人工智能聆听

    据周五 (3月22日) 发表的一篇论文称,苹果公司的研究人员正在研究是否有可能利用 AI 来检测用户何时在对 iPhone 等设备说话,从而消除对“Siri”等触发短语的技术需求。在一项上传到 Arxiv 且未经同行评审的研究中,研究人员使用智能手机捕获的语音以及来背景噪声的声学数据来训练一个大型语言模型,以寻找可能表明用户何时需要设备帮助的模式。论文中研究人员写道:“该模型部分基于 OpenAI 的 GPT-2 版本构建,因为它相对轻量级,可以在智能手机等设备上运行。”论文描述了用于训练模型的超过129小时的数据和额外的文本数据,但没有说明训练集的录音来源。据领英个人资料,七位作者中有六位列出他们的隶属关系为苹果公司,其中三人在该公司的 Siri 团队工作。论文称,结果令人鼓舞。该模型能够比纯音频或纯文本模型做出更准确的预测,并且随着模型规模的扩大而进一步改进。

    —— 麻省理工科技评论、Arxiv

  • Twitter要求研究人员删除其采集的数据,除非支付 42,000 美元

    Twitter 要求研究人员删除采集的所有数据,除非支付 42,000 美元

    学术研究人员已被设定为本月底的最后期限,以删除他们根据研究Twitter 的历史合同获得的数据,除非他们支付一份每月 42,000 美元的新合同。

    多年来,Twitter 一直提供对一项名为decahose的学术访问服务,可以从 Twitter 的所有推文中抽取 10% 的随机样本,该服务始终在线。通过 Twitter API访问的 decahose 是一种专门供学术界使用的工具,旨在让他们监控社交媒体平台上的对话是如何发生的。

    研究人员使用这些数据来跟踪 Twitter 上的一整天,分析虚假信息和错误信息的传播,并跟踪极端主义的兴起以及它如何渗透到线下生活中。

    但最近几周,该公司一直在联系研究人员,要求他们每月支付 42,000 美元,以访问发布到该平台的所有推文的 0.3%——研究人员此前曾表示,这是完全无法负担的。以前的数据访问合同设定为每月几百美元。

    一封电子邮件表示不签署新合同的研究人员“将需要删除您系统中存储和缓存的所有 Twitter 数据”。研究人员将被要求提交“展示删除证据”的屏幕截图。他们在协议到期后有 30 天的时间来完成该过程。

    —— iNews

  • 明尼苏达大学研究人员向Linux内核提交漏洞的代码

    明尼苏达大学计算机科学和工程系的两名研究人员向Linux内核提交了包含漏洞的代码并在此后修复它们。

    此后Linux内核维护者拒绝了所有明尼苏达大学的补丁。该校在获知后已声明要调查此事。

    研究者表示,这项研究旨在通过提高人们对这类问题的认知来改进修补过程,激励人们开发自动补丁检测和验证工具。