微闻

标签: OpenAI

  • OpenAI 使用盗版网站训练ChatGPT

    作者指责 OpenAI 使用盗版网站训练 ChatGPT

    本周,作者 Paul Tremblay 和 Mona Awad 对 OpenAI 提起集体诉讼,指控 ChatGPT 的母公司侵犯版权并违反 DMCA 等。据作者称,ChatGPT 未经许可就对其受版权保护的作品进行了部分培训。

    诉讼中提供的证据看似简单。作者从未授权 OpenAI 使用他们的作品,但 ChatGPT 可以提供他们作品的准确摘要。这些信息一定来自某个地方。

    虽然这些类型的指控并不新鲜,但本周的诉讼指控 OpenAI 使用盗版网站作为训练输入。这可能包括Z-Library ,这是一个拥有数百万册盗版图书的影子图书馆。

    OpenAI 尚未透露 ChatGPT 训练的数据集,但在一篇较旧的论文中引用了两个数据库;“书籍1”和“书籍2”。第一个包含大约 63,000 个标题,后者包含大约 294,000 个标题。

    这些数字孤立起来毫无意义。然而,作者指出,OpenAI 一定使用了盗版资源,因为包含这么多书籍的合法数据库并不存在。唯一提供如此多材料的“基于互联网的图书语料库”只有是盗版图书网站,例如 Library Genesis 、Z-Library、Sci-Hub 和 Bibliotik。

    目前的诉讼将受到人工智能爱好者和权利人的密切关注。这可能会导致 OpenAI 不得不披露一些训练数据。

    —— Torrentfreak

  • OpenAI 在伦敦开设首家海外办事处

    OpenAI 将在英国开设首个海外办事处

    OpenAI 表示,其第一个国际办事处将设在伦敦。这一个引人注目的选择,自 2015 年成立以来,OpenAI 一直没有扩展到旧金山总部以外的地方。

    伦敦这座城市还是 Google 最大的人工智能研究部门 DeepMind 的长期总部基地,也是数据科学人才的源泉,因为其丰富的学术历史和著名的大学。

    OpenAI 首席执行官 Sam Altman 表示,此举是“吸引世界级人才的机会”。

    此前,他批评了欧盟拟议的人工智能监管立法,该立法要求公司披露用于训练其系统的内容。与此同时,英国正在计划所谓的“支持创新”法规。

    —— BBC 、彭博社

  • AI研究员跳槽到OpenAI再跳回Google

    AI回旋镖:著名研究员三个月从 Google 跳槽到 OpenAI 又跳槽回 Google

    AI研究员 Jacob Devlin 是 BERT 的第一作者,今年年初 Devlin 因为AI机器人 Bard 的相关问题离开谷歌并加入 OpenAI ,如今受到 Bard 的主要开发者 Slav Petrov 的邀请重回谷歌。

    此前 Bard 被爆料使用了 ShareGPT (ChatGPT 聊天内容的用户分享网站) 的数据进行训练,得知这一消息后 Devlin 直接警告了谷歌CEO劈柴,认为这违反了 OpenAI 的服务条款并会导致AI机器人趋同。知情人士告诉 The Information,在 Devlin 警告高管和辞职后谷歌停止使用并删除了这些数据。有趣的是,谷歌发言人对 Bard 使用了 ShareGPT 或 ChatGPT 的数据进行训练的传闻表示坚决否认。

    —— The Information

  • OpenAI 将放出更多 GPT-4 API 测试邀请

    OpenAI 将放出更多 GPT-4 API 测试邀请

    OpenAI表示:我们将在接下来的几周邀请更多等待名单上的人来尝试GPT-4,并打算完全移除等待名单。感谢所有耐心等待的人,我们很期待看到您使用GPT-4构建的内容!

    —— OpenAI

  • OpenAI推出新版GPT-4和GPT-3.5-turbo

    OpenAI在降低定价的同时推出了新的生成文本功能

    随着生成式人工智能领域的竞争日益激烈,OpenAI正在升级其文本生成模型,并同时降低价格。

    今天,OpenAI宣布推出了GPT-3.5-turbo和GPT-4的新版本,后者是其最新的文本生成人工智能,具备称为函数调用的功能。正如OpenAI在一篇博文中解释的那样,函数调用允许开发者描述编程函数给GPT-3.5-turbo和GPT-4,并让这些模型创建代码来执行这些函数。

    例如,函数调用可以帮助创建聊天机器人,通过调用外部工具来回答问题,将自然语言转换为数据库查询,并从文本中提取结构化数据。OpenAI写道:“这些模型经过精细调整,既能检测何时需要调用函数…,又能回复符合函数签名的JSON。函数调用使开发者能够更可靠地从模型中获得结构化数据。”

    除了函数调用,OpenAI还推出了一个具有大大扩展上下文窗口的GPT-3.5-turbo版本。上下文窗口以标记或文本的原始位表示,指的是模型在生成任何其他文本之前考虑的文本范围。具有较小上下文窗口的模型往往会“忘记”甚至是最近的对话内容,导致它们偏离主题,通常是以问题方式偏离主题。

    —— Tech Crunch

  • OpenAI的ChatGPT应用程序发布重大更新

    ChatGPT 客户端登陆 iPad,并增加了对 Siri 和快捷方式的支持

    在 App Store 上发布不到一个月后,OpenAI 的 ChatGPT 应用程序迎来了第一次重大更新。今天发布的新版本为 AI 聊天机器人应用程序带来了原生 iPad 支持,并支持将 ChatGPT 与 Siri 和快捷方式一起使用。拖放功能现在也可用,允许用户将单个消息从 ChatGPT 拖到其他应用程序中。

    ——Techcrunch

  • OpenAI网页月活人数首次超10亿

    OpenAI 全球月活用户达到10亿,成为最快达到该里程碑的网站

    OpenAI网站每月独立用户量(Monthly Unique Visitors)直接飙到了10亿次,成为全球网站访问量的顶流中的顶流。

    而且和慢慢积累的网站人气不同,OpenAI的网络流量,从去年秋天的每月约2000万增加到2023年4月的18亿。

    据统计,OpenAI是全球前50的最受欢迎网站中发展增速最快的。

    根据Similarweb的分析,OpenAI的全球排名已经上升到了第16位。

    Veza Digital的首席执行官Stefan Katanic在接受Digital Journal采访时表示,「ChatGPT现象在2022年底像野火一样迅速传播开来,我们预计它将很快打破所有记录,成为在极短的时间内月活跃用户达到10亿的最快网站。」

    Katanic补充说,「这表明大众对AI驱动的解决方案有强烈的兴趣。AI不再是未来,它是现在。」

    —— 新智元公众号

  • OpenAI Future Roadmap

    OpenAI 透露未来路线图:开源GPT-3、翻倍模型规模、整更多GPU

    OpenAI CEO Sam Altman 与AI开发平台 HumanLoop 创始人 Raza Habib 等20多位开发者开展了一次闭门讨论会,透露了 OpenAI 很多未来规划与目前的情况。

    1. OpenAI 正在考虑开源 GPT-3,他们之所以还没有开源是因为他们觉得没多少人和公司有能力妥善管理如此大型的大语言模型。
    2. OpenAI 严重受限于GPU,导致他们推迟了许多短期计划,大部分关于 ChatGPT 可靠性和速度的问题都是由于GPU资源短缺造成。
    3. 给 GPT-4 降本提效是 OpenAI 当前的首要任务。
    4. 更长的 ChatGPT 上下文窗口 (最高可达100万 tokens)。
    5. GPT-4 的多模态功能要到2024年才会公开,在获取更多GPU资源前不能将 GPT-4 的视觉版本扩展到所有人。
    6. 最近很多文章声称的「巨型AI模型的时代已经结束」并不正确,OpenAI 内部数据表明,规模与性能成正比的定律仍成立,OpenAI 未来每年会将模型规模翻倍或三倍 (多方信息表明 GPT-4 参数规模10000亿)。

    —— HumanLoop

  • OpenAI ChatGPT 的全球推广

    OpenAI 的 ChatGPT iOS 应用现已在加拿大、印度、巴西和另外 30 个国家/地区推出

    新国家名单包括阿尔及利亚、阿根廷、阿塞拜疆、玻利维亚、巴西、加拿大、智利、哥斯达黎加、厄瓜多尔、爱沙尼亚、加纳、印度、伊拉克、以色列、日本、约旦、哈萨克斯坦、科威特、黎巴嫩、立陶宛、毛里塔尼亚、毛里求斯、墨西哥、摩洛哥、纳米比亚、瑙鲁、阿曼、巴基斯坦、秘鲁、波兰、卡塔尔、斯洛文尼亚、突尼斯和阿拉伯联合酋长国。

    本周早些时候,OpenAI 将 ChatGPT 应用程序扩展到美国之外的11 个国家。
    阿尔巴尼亚、克罗地亚、法国、德国、爱尔兰、牙买加、新西兰、尼加拉瓜、尼日利亚、韩国、英国。

  • 欧盟人工智能监管规定可能迫使OpenAI离开

    OpenAI CEO表示,如果监管规定变得过于严格,OpenAI可能会离开欧盟。

    路透社伦敦消息:OpenAI CEO周三表示,如果无法遵守即将出台的欧盟人工智能(AI)监管规定,ChatGPT可能会考虑离开欧洲。

    欧盟正在制定全球首个管理人工智能的规定。根据这份草案,部署生成式AI工具(如ChatGPT)的公司将必须披露用于开发其系统的任何受版权保护的材料。

    OpenAI CEO 在伦敦的一次活动中表示,在考虑撤出之前,OpenAI将尝试在欧洲遵守相关法规。

    他告诉路透社:“欧盟AI法案的当前草案过于严格,但我们已经听说它将会撤回。但他们仍在讨论中。”

    本月早些时候,欧洲议会议员就该法案草案达成了共识。现在,该法案将在议会、理事会和委员会代表之间进行辩论,以敲定法案的最终细节。

    ——— 雅虎