标签: 人工智能

  • 谷歌将使用你的数据训练人工智能

    谷歌更新隐私政策将加大力度使用你的数据来训练人工智能

    自 2023 年 7 月 1 日起,Google 为用户制定了新的隐私政策。其中有一个关键的更新。

    谷歌有一项政策已经实施了一段时间,允许该公司从其用户那里收集数据并将这些数据用于 “商业目的”。这包括用于 “研究和开发”,其中长期以来包括用于建立和改进谷歌翻译。

    现在,在其政策的最新更新中,谷歌将其人工智能模型纳入了它可以使用你的数据的范围。这也包括使用这些数据来训练 Bard 和云端人工智能 “产品”。

    谷歌使用信息来改善我们的服务,并开发新的产品、功能和技术,使我们的用户和公众受益。例如,我们使用公开的信息来帮助训练谷歌的人工智能模型,并建立产品和功能,如谷歌翻译、Bard 和云端人工智能。如果您的企业信息出现在一个网站上,我们可能会在谷歌服务上索引和显示它。

    这一切都不意味着谷歌打算使用与你的账户有关的私人数据进行培训,而只是使用公共信息。这种情况无论如何都会发生,随着ChatGPT和其他人工智能模型的兴起,这种情况已经很清楚了,但谷歌的新政策清楚地表明,该公司打算对其用户的数据做同样的事情。

    —— 9to5Google

  • OpenAI 使用盗版网站训练ChatGPT

    作者指责 OpenAI 使用盗版网站训练 ChatGPT

    本周,作者 Paul Tremblay 和 Mona Awad 对 OpenAI 提起集体诉讼,指控 ChatGPT 的母公司侵犯版权并违反 DMCA 等。据作者称,ChatGPT 未经许可就对其受版权保护的作品进行了部分培训。

    诉讼中提供的证据看似简单。作者从未授权 OpenAI 使用他们的作品,但 ChatGPT 可以提供他们作品的准确摘要。这些信息一定来自某个地方。

    虽然这些类型的指控并不新鲜,但本周的诉讼指控 OpenAI 使用盗版网站作为训练输入。这可能包括Z-Library ,这是一个拥有数百万册盗版图书的影子图书馆。

    OpenAI 尚未透露 ChatGPT 训练的数据集,但在一篇较旧的论文中引用了两个数据库;“书籍1”和“书籍2”。第一个包含大约 63,000 个标题,后者包含大约 294,000 个标题。

    这些数字孤立起来毫无意义。然而,作者指出,OpenAI 一定使用了盗版资源,因为包含这么多书籍的合法数据库并不存在。唯一提供如此多材料的“基于互联网的图书语料库”只有是盗版图书网站,例如 Library Genesis 、Z-Library、Sci-Hub 和 Bibliotik。

    目前的诉讼将受到人工智能爱好者和权利人的密切关注。这可能会导致 OpenAI 不得不披露一些训练数据。

    —— Torrentfreak

  • 甲骨文在扩展人工智能云计算服务方面花费数十亿美元

    埃里森表示,甲骨文今年在英伟达芯片上花费了“数十亿美元”

    6 月 28 日(路透社)—甲骨文公司正在花费“数十亿美元”购买英伟达公司的芯片,以扩展针对新一波人工智能浪潮的云计算服务。

    甲骨文创始人兼董事长拉里·埃里森周三表示,甲骨文的云部门正在努力与亚马逊网络服务公司和微软公司等规模更大的竞争对手抗衡。为了获得优势,Oracle 专注于构建快速网络,该网络可以处理创建类似于 ChatGPT 的 AI 系统所需的大量数据。甲骨文还购买了大量图形处理单元(GPU),旨在处理人工智能工作的数据。

    埃里森在 Ampere会议上表示,甲骨文还在 Nvidia 芯片上花费了“数十亿”美元,但在其投资的芯片初创公司 AmpereComputing 和 Advanced MicroDevice Inc 的中央处理器单元 (CPU) 上投入更多。

    —— 路透社

  • OpenAI 在伦敦开设首家海外办事处

    OpenAI 将在英国开设首个海外办事处

    OpenAI 表示,其第一个国际办事处将设在伦敦。这一个引人注目的选择,自 2015 年成立以来,OpenAI 一直没有扩展到旧金山总部以外的地方。

    伦敦这座城市还是 Google 最大的人工智能研究部门 DeepMind 的长期总部基地,也是数据科学人才的源泉,因为其丰富的学术历史和著名的大学。

    OpenAI 首席执行官 Sam Altman 表示,此举是“吸引世界级人才的机会”。

    此前,他批评了欧盟拟议的人工智能监管立法,该立法要求公司披露用于训练其系统的内容。与此同时,英国正在计划所谓的“支持创新”法规。

    —— BBC 、彭博社

  • 美国考虑对中国人工智能芯片出口施加新限制

    美国考虑对中国人工智能芯片出口施加新限制

    《华尔街日报》周二援引知情人士的话报道称,美国正在考虑对向中国出口人工智能芯片实施新的限制。

    受此消息影响,Nvidia 股价在盘后交易中下跌超过 2%,而 AMD 股价下跌约 1.5%。

    报道称,美国商务部最早将于 7 月停止向中国客户运送英伟达和其他芯片公司生产的芯片。

    英伟达(Nvidia)、美光(Micron)和AMD等美国芯片制造商都陷入了中国与拜登政府之间的交火。

    9月,英伟达曾表示,美国官员要求该公司停止向中国出口两款用于人工智能工作的顶级计算芯片。

    几个月后,黄仁勋领导的英伟达表示,将在中国提供一款名为 A800 的新型先进芯片,以满足出口管制规定。该公司还在今年年初调整了其旗舰 H100 芯片以符合法规。

    但报告补充说,该部门正在考虑的新限制措施将禁止在没有美国特殊出口许可证的情况下销售 A800 芯片。

    —— 路透社

  • Google 与 YouTube合作开发人工智能配音工具

    YouTube 集成AI配音工具

    YouTube 在周四的 VidCon 上宣布,目前正在测试一款新工具,该工具将帮助创作者免费使用AI自动将视频配音成其他语言。YouTube 与人工智能配音服务Aloud合作,该服务是 Google 内部孵化器 Area 120 的一部分。

    YouTube 创作者产品副总裁 Amjad Hanif 昨天对观众表示,YouTube 正在与数百名创作者一起测试该工具。很快该公司将向所有创作者开放该工具。Aloud 目前提供英语、西班牙语和葡萄牙语版本。不过,未来将会提供更多语言,例如印地语和印尼语等。

    Hanif 补充说,YouTube 正在“努力使翻译后的音轨听起来像创作者的声音,并具有更多的表情和口型同步。”

    —— Techcrunch

  • GPT-4参数暴露

    硅谷圈黑客爆料 GPT-4 参数

    在AI博客节目 Latent Space 上,George Hotz (iPhone 和 PS3 破解第一人) 爆料 GPT-4 其实只比1750亿参数的 GPT-3 大一些,任何人都能用8倍资金得到它。

    GPT-4 是一个8路混合模型,由8个2200亿参数的专家模型组合而成,OpenAI 使用了不同数据训练了同一个模型8次,然后用了一些技巧使它实际做了 16-iter 推理,混合模型是在没有新想法时所会做的。

    —— Latent Space

  • 蚂蚁金服加速开发大语言模型技术

    马云支持蚂蚁金服开发AI模型

    马云支持的蚂蚁集团正在开发大语言模型技术,为 ChatGPT 类服务提供支持,加入寻求在下一代人工智能领域赢得优势的中国公司行列。

    名为“Zhen Yi”的项目正在由一个专门的部门创建,并将部署内部研究。蚂蚁金服发言人证实了这一消息,该消息由星空网率先报道

    蚂蚁金服正在与其关联公司阿里巴巴集团控股有限公司、百度公司和商汤科技集团公司等公司展开竞争。他们的努力反映了美国的发展,Alphabet Inc. 的谷歌和微软公司正在探索生成人工智能,它可以从中创建原创内容只需简单的用户提示,即可将诗歌转化为艺术。

    人工智能已经成为中美科技竞争的下一个大舞台,引发了人们对中国企业能否长期获得开发大规模人工智能模型所需的高端芯片的担忧。

    —— 彭博社

  • 美国难以识别对国家安全构成威胁的人工智能

    虽然计划遏制中国的AI技术,但美国很难界定什么是“有威胁”的人工智能技术

    华盛顿——拜登政府正在努力解决如何识别对国家安全构成威胁的人工智能,这是美国采取行动限制对中国先进技术公司投资的核心挑战。

    拜登政府官员几个月来一直在准备一项新的行政命令,该命令将限制美国对一些地缘政治竞争对手的投资,即中国。他们的目标是阻止美国私募股权和风险投资为中国开发可能有助于北京军队的尖端技术做出贡献。

    华盛顿为保持美国对中国的技术优势所做的努力,包括去年禁止出口一些先进半导体,一直是其与北京关系中的一个决定性问题。国务卿安东尼·布林肯将于本周末前往北京,在那里他可能会面临中国官员的抱怨,他们认为投资限制等举措是美国试图阻碍中国经济增长的举措。

    与此同时,美国官员将即将实施的资本管制视为针对他们认为的国家安全威胁的有针对性的措施。他们力求制定投资规则,以免危及世界两大经济体之间更广泛的投资和贸易流动。

    但据知情人士透露,事实证明,拜登政府很难区分北京可以用来推进其军事发展的技术和中国公司用于日常商业目的的技术,尤其是在人工智能方面。

    知情人士说,这一窘境是该行政命令尚未解决的问题之一,该命令预计将禁止对先进半导体和量子计算的投资,作为为期一年的试点计划的一部分。知情人士说,某些形式的 AI 投资可能会根据规则被禁止,或者只是受到新的披露要求的约束。

    “人工智能在很多方面都是一个毫无意义的类别。它涵盖了从Netflix推荐算法到自主武器系统以及介于两者之间的一系列东西,”彼得森国际经济研究所研究资本和技术控制的Martin Chorzempa说。“这很难定义。”

    —— 华尔街日报

  • OpenAI推出新版GPT-4和GPT-3.5-turbo

    OpenAI在降低定价的同时推出了新的生成文本功能

    随着生成式人工智能领域的竞争日益激烈,OpenAI正在升级其文本生成模型,并同时降低价格。

    今天,OpenAI宣布推出了GPT-3.5-turbo和GPT-4的新版本,后者是其最新的文本生成人工智能,具备称为函数调用的功能。正如OpenAI在一篇博文中解释的那样,函数调用允许开发者描述编程函数给GPT-3.5-turbo和GPT-4,并让这些模型创建代码来执行这些函数。

    例如,函数调用可以帮助创建聊天机器人,通过调用外部工具来回答问题,将自然语言转换为数据库查询,并从文本中提取结构化数据。OpenAI写道:“这些模型经过精细调整,既能检测何时需要调用函数…,又能回复符合函数签名的JSON。函数调用使开发者能够更可靠地从模型中获得结构化数据。”

    除了函数调用,OpenAI还推出了一个具有大大扩展上下文窗口的GPT-3.5-turbo版本。上下文窗口以标记或文本的原始位表示,指的是模型在生成任何其他文本之前考虑的文本范围。具有较小上下文窗口的模型往往会“忘记”甚至是最近的对话内容,导致它们偏离主题,通常是以问题方式偏离主题。

    —— Tech Crunch