微闻

标签: 人工智能

  • Stable LM 3B

    Stability AI 发布最新语言模型:Stable LM 3B

    Stability AI 发布了其最新语言模型:Stable LM 3B,设计用于在手持设备和笔记本电脑等便携式数字设备上运行。

    Stable LM 3B 拥有30 亿个参数(业界通常使用的参数为 70 亿到 700 亿个),是一种紧凑型语言模型。Stable LM 3B 的主要优势之一是其更小的尺寸和更高的效率。与大型模型不同,这些模型需要的资源更少,因此大多数用户都可以轻松使用它们。

    与之前的稳定 LM 版本相比,该版本在保持了快速的执行速度的同时,在生成文本方面明显更好。在常见自然语言处理基准测试(包括常识推理和常识测试)中,它的的下游性能得到了提高。

    —— Stability AI

  • Spotify Development AIs Generated Playlists

    Spotify 可能正在开发通过AI生成播放列表的功能

    继 Spotify 成功推出人工智能 DJ功能以及最近增加对人工智能翻译播客的支持之后,Spotify 现在似乎正在开发另一种在其应用程序中使用人工智能的方式:人工智能播放列表。在该应用程序代码中发现的线索表明该公司可能正在开发生成式人工智能播放列表,用户可以使用提示创建。

    这些新增内容是由技术资深人士转型为投资者的 Chris Messina发现的,他发布了 Spotify 应用程序中的代码屏幕截图,其中提到了“AI 播放列表”和“基于提示的播放列表”。

    Spotify 拒绝证实其有关人工智能播放列表的计划。

    —— TechCrunch

  • 扎克伯格推出新一代虚拟现实头显和人工智能技术

    Meta CEO 马克·扎克伯格启动开发者大会,重点关注人工智能和虚拟现实

    周三,Meta CEO 扎克伯格拉开了这家科技巨头 Connect 开发者大会的序幕,会议重点关注虚拟现实、增强现实和人工智能。

    Meta 推出了虚拟现实头显的下一版本 Quest 3。售价 499 美元,10 月 10 日开始发货。Meta 的 512GB Quest 3 将附带 6 个月的 Quest+ 订阅。

    Xbox 云游戏将于 12 月登陆 Meta Quest 3,但没有提供更具体的发布日期。Roblox 今天在 Meta Quest VR 头显上推出其原生应用。

    高通今天发布了适用于 XR 和 AR 平台的最新芯片:用于 VR 和混合现实设备的 Snapdragon XR2 Gen 2 和专为智能眼镜设计的 AR1 Gen 1。

    Meta 的社交应用 WhatsApp、Messenger、Instagram 等即将推出生成式 AI 贴纸,该功能由新的图像生成基础模型 Emu 提供支持。

    Meta 将在其社交应用人工智能聊天机器人,包括 WhatsApp、Messenger 和 Instagram。从今天起,它们可供美国的部分测试版用户使用。

    —— 美联社

  • Cloudflare推出AI助手

    Cloudflare推出新的人工智能工具,帮助客户部署和运行模型

    为了从人工智能热潮中获利,云服务提供商 Cloudflare 正在推出一系列新的产品和应用程序,旨在帮助客户在网络边缘构建、部署和运行人工智能模型。

    Workers AI 是新产品之一,它允许客户访问由 Cloudflare 合作伙伴托管的 距离用户最近的GPU,以按使用量付费的方式运行 AI 模型。另一个是 Vectorize,它提供了一个矢量数据库来存储由 Workers AI 模型生成的矢量嵌入(数据的数学表示)。第三个是人工智能网关,旨在提供指标,使客户能够更好地管理运行人工智能应用程序的成本。

    Cloudflare 首席执行官 Matthew Prince 表示,推出新的以 AI 为中心的产品套件的动机是 Cloudflare 客户对更简单、更易于使用的 AI 管理解决方案的强烈渴望,该解决方案注重节省成本。

    Workers AI 试图确保人工智能推理始终发生在靠近用户(从地理角度来看)的 GPU 上,以提供低延迟、人工智能驱动的最终用户体验。利用 ONNX(微软支持的中间机器学习工具包,用于在不同人工智能框架之间进行转换),Workers AI 允许人工智能模型在带宽、延迟、连接、处理和本地化限制方面最有意义的处理过程中运行。

    —— TechCrunch

  • OpenAI 推出 GPT-4 多模态版本

    ChatGPT 现在可以看到、听到和说话 —— GPT-4 多模态版本上线

    OpenAI 开始在 ChatGPT 中推出新的语音和图像功能,允许您进行语音对话或向 ChatGPT 展示画面。Plus 和企业用户将在未来两周内体验语音和图像,不久后推出给其他用户组,包括开发人员。

    图像理解由多模态 GPT-3.5 和 GPT-4 提供支持,你现在可以向 ChatGPT 展示一个或多个图像。这些模型可以将其语言推理技能应用于各种图像,例如照片、屏幕截图以及包含文本和图像的文档。

    文本转语音由新的模型提供支持,它能够从几秒钟的真实语音中制作出逼真的合成语音。ChatGPT 的预设语音来自直接合作的专业配音演员。语音转文本由 OpenAI Whisper 模型支持。

    —— OpenAI

  • 亚马逊向人工智能初创公司 Anthropic 投资40亿美元

    亚马逊向人工智能初创公司 Anthropic 投资高达 40 亿美元,以应对日益激烈的技术战

    两家公司周一表示,亚马逊将向 Anthropic 投资高达 40 亿美元,并持有这家人工智能初创公司的少数股权。

    这项投资凸显了大型科技公司将资金投入人工智能领域的趋势,因为它们竞相利用最新一代技术所带来的机遇。

    亚马逊和 Anthropic 表示,这笔交易是更广泛合作的一部分,旨在开发所谓的基础模型,该模型支撑着引起全球关注的生成人工智能系统。

    基础模型也称为大型语言模型,在大量在线信息(例如博客文章、数字图书、科学文章和流行歌曲)上进行训练,以生成类似于人类工作的文本、图像和视频。

    —— 美联社

  • Meta将推出有个性的人工智能聊天机器人

    Meta将推出有个性的人工智能聊天机器人,以吸引年轻用户

    Meta 正计划最快于本周在其各社交媒体应用中发布具有鲜明个性的人工智能聊天机器人,以此吸引年轻用户。

    这些生成式人工智能机器人正在由员工进行内部测试,该公司计划将在本周三会议上宣布。这些机器人将用来推动用户的参与,不过其中一些机器人也可能拥有与生产力相关的技能,比如帮助完成编码或其他任务的能力。

    Meta 计划开发几十个这样的人工智能个性聊天机器人。据知情人士透露,该公司还在开发一款产品,让名人和创作者可以使用自己的人工智能聊天机器人与粉丝和追随者互动。

    《华尔街日报》看到的该公司内部文件显示,正在开发的机器人中有一个叫“机器人鲍勃”(Bob the robot),他自称“智力超群、机智敏锐、说话尖刻”。该聊天机器人被设计成类似于动画片《飞出个未来》中的角色班德, “他是一个活泼的机器人,迎合年轻人喜爱的滑稽幽默类型”。

    —— 华尔街日报

  • GitHub推出人工智能编码聊天机器人

    GitHub 的人工智能编码聊天机器人现已可供个人使用

    微软旗下的 GitHub 正在向更多人推出其人工智能驱动的编码聊天机器人。该公司于 7 月份为企业用户推出了 Copilot Chat 工具的公开测试版,周三,GitHub 宣布该工具可在 Visual Studio 和 Visual Studio Code 中为 GitHub Copilot 个人用户提供公开测试版。

    Copilot Chat 可让用户在编写代码时与人工智能助手交谈以获取帮助。GitHub 在一篇博文中写道:“现在,开发团队和个人都可以使用 GitHub Copilot Chat 来学习新编程语言或框架、解决错误,或者以简单自然的语言输出获得编码问题的答案,所有这些都无需离开 IDE” 。

    如果你还不是订阅者,但想尝试该功能,GitHub 面向个人用户的 Copilot 层级费用为每月 10 美元或每年 100 美元。

    —— theverge

  • 亚马逊推出新的生成式人工智能

    亚马逊为 Alexa 带来生成式人工智能

    今天早上举行的新闻发布会上,亚马逊宣布,它将很快使用新的生成式人工智能模型来改善其 Echo 智能音箱系列设备的体验。

    亚马逊表示,新模型将提供更多的对话体验,考虑人的肢体语言、眼神接触和手势。它将与API互动,以实现新的智能家居功能,推断出诸如“阴森”照明之类描述的含义。它将赋予 Alexa 更大、更有主见的个性。

    亚马逊表示,很快,美国客户将可以通过在他们已经拥有的 Echo 智能音箱设备上免费预览这些新功能。

    —— Techcrunch

  • DALL·E 3

    DALL·E 3

    OpenAI 发布自然语言图像生成模型 DALL·E 3

    DALL·E 3 原生构建在 ChatGPT 上,你可以与 ChatGPT 沟通来进行内容的详细定制。这一点与完全基于 CLIP (图像-文本映射模型) 的其它图像生成AI截然不同,DALL·E 3 有着真正的”思考推理大脑”,这使它对画面的细节有着相当大的掌控力,并且不再需要复杂的 prompt 工程即可理解你的想法。

    —— OpenAI