微闻

标签: 大型语言模型

  • 《大型语言模型不会达到人类智能水平》

    Meta人工智能主管杨立昆:大型语言模型不会达到人类智能水平

    Meta 的人工智能主管表示,为 ChatGPT 等生成式人工智能产品提供动力的大型语言模型永远无法实现像人类一样的推理和计划能力,他专注于一种激进的替代方法,即在机器中创造“超级智能”。该公司首席人工智能科学家杨立昆表示,LLM“对逻辑的理解非常有限……不理解物理世界,没有持久的记忆,不能按照任何合理的定义进行推理,也不能进行层次化的规划”。杨立昆说,LLMs的这种进化是肤浅和有限的,只有当人类工程师介入并根据这些信息进行训练时,模型才会学习,而不是像人类那样自然地得出结论。“在大多数人看来,这当然是推理,但主要是利用从大量训练数据中积累的知识。(LLM)尽管有局限性,但非常有用。”

    ——英国金融时报( 全文截图)

  • 美国考虑对外竞争对手限制获取大型语言模型

    美国考虑限制中国等国外竞争对手获取大型语言模型

    三位知情人士透露,美国商务部正在考虑采取新的监管措施,限制专有或闭源人工智能模型的出口,这些模型的软件和训练数据都是保密的。美国政府和私营部门的研究人员担心,美国的对手可能会利用这些模型挖掘大量文本和图像来总结信息并生成内容,发动激进的网络攻击,甚至制造强大的生物武器。消息人士表示,为了制定人工智能模型的出口管制,基于训练模型所需计算能力的门槛可能成为确定哪些人工智能模型将受到出口限制的基础。消息人士强调,该机构还远未最终确定规则提案。

    —— 路透社

  • 苹果公司开发大型语言模型

    古尔曼:苹果致力于开发用于生成式人工智能功能的设备端大型语言模型

    据彭博社的马克·古尔曼报道,苹果公司正在开发自己的大型语言模型 (LLM),该模型可在设备上运行,以优先考虑速度和隐私。古尔曼在他的“Power On”时事通讯中写道,苹果公司的大语言模型为即将推出的生成式人工智能功能奠定了基础。“所有迹象”似乎表明,它将完全在设备上运行,而不是像大多数现有人工智能服务那样通过云端运行。由于苹果公司的人工智能工具将在设备上运行,因此在某些情况下,可能不如直接基于云的竞争对手,但古尔曼表示,该公司可以通过从谷歌和其他人工智能服务提供商获得技术许可来“填补空白”。

    —— macrumors

  • Meta 正开发更强大的新大型语言模型

    Meta 正开发更强大的新大型语言模型,对标OpenAI 的 GPT-4

    据知情人士透露,Meta 正在开发一款新的大型语言模型,并预计其功能将与 GPT-4 一样强大。根据 Meta 的目标,其新 AI 模型将比两个月前刚刚发布的名为 Llama 2 的模型强大数倍。这个新 AI 模型计划明年上线。

    Meta 目前正在搭建这项工作所需的数据中心,并购置更多的 H100 芯片,这是英伟达用于此类 AI 训练的最先进制程芯片。其中一些知情人士说,虽然与微软合作在后者的云计算平台 Azure 上提供 Llama 2 服务,但 Meta 计划在自己的基础设施上训练这个新模型。

    —— 华尔街日报

  • _openai 将发布新开源大型语言模型_

    OpenAI 即将发布一款全新的开源大型语言模型

    The Information 引用了一位了解该计划的人士的话说,OpenAI 正面临着来自开源AI模型的激烈竞争,例如 Meta 的 LLaMA 与它的衍生模型,OpenAI 目前正准备向公众发布一款全新的开源语言模型。报告还称,OpenAI 不太可能发布与 GPT-4 和 GPT-3.5 竞争的模型。

    —— The Information