通过交互式精确变形图像的 DragGAN 刷屏 AI 业界学界
DragGAN 可将图像中的任意部分精确”拖动”到目标位置,从而操纵动物、汽车、人类、风景等不同类别的姿势、形状、表情和布局。当给定想要移动的部分 (操纵点) 和想要移动到的位置 (目标点),AI就会驱动操纵点精确到达相应的目标点。用户也可以局部绘制 (掩码),使掩码以外的部分固定不变。
—— 项目地址
通过交互式精确变形图像的 DragGAN 刷屏 AI 业界学界
DragGAN 可将图像中的任意部分精确”拖动”到目标位置,从而操纵动物、汽车、人类、风景等不同类别的姿势、形状、表情和布局。当给定想要移动的部分 (操纵点) 和想要移动到的位置 (目标点),AI就会驱动操纵点精确到达相应的目标点。用户也可以局部绘制 (掩码),使掩码以外的部分固定不变。
—— 项目地址
金山办公升级WPS AI 接入文字、表格、PPT、PDF四大组件
金山办公旗下生成式人工智能应用 WPS AI对外展示了类微软Copilot的能力,接入了文字、海外版表格、PPT演示文稿、PDF四大日常办公组件。
金山办公CEO章庆元表示,“未来几个月内,我们的产品会逐渐上线这些功能,国内和海外版有所区别,海外版直接使用OpenAI的接口,而国内在知识库构建上可能会更快一点。总的来说,我们的节奏应该比微软快很多。”
《科创板日报》记者了解到,WPS AI正在推进合规工作,正式上线时间以官方发布为准。
—— 财联社
软银宣布加入 AI 竞赛:打造“日版 ChatGPT”
软银公司首席执行官宫川淳一在周三的财报会上表示,该部门于今年 3 月成立了一个新的实体,选择了约 1000 人来开发 OpenAI 公司人工智能聊天技术的日语版本,他没有详细说明该项目的目标或目前的进展情况。
软银集团的创始人兼亿万富翁孙正义多年来一直宣扬人工智能是改变我们使用技术方式的革命性力量,他最近召集了一群工程师,还讨论了 ChatGPT 的可能性。
—— IThome
谷歌在 Google I/O 2023 上全面升级AI技术
PaLM 2 模型发布,相较前代 PaLM 参数更少但能力远超。支持100多种自然语言和20多种编程语言,为超过25种新产品和功能提供支持。有着 Gecko 壁虎 (可移动端本地运行)、Otter 水獭、Bison 野牛、Unicorn 独角兽 四种参数规格。 —— 《PaLM 2 技术报告》
Bard 现由 PaLM 2 驱动,已取消候补名单在180多个地区上线。升级后的 Bard 支持20多种编程语言,自然语言新增支持日语与韩语,很快将扩大支持40种语言包括中文。Bard 现在结合了 Google Lens 的识图能力与 Adobe Firefly 的图片生成能力,未来将有更多第三方工具接入。还更新了图文并茂回复、来源引用、代码/文本导出、深色模式等功能。
Duet AI 进入谷歌办公套件,包括在 Gmail 起草邮件、 Docs 文档编写、Sheets 表格处理、Slides 幻灯片生成、Meet 会议摘要等等。
Google Brain 和 DeepMind 今年开始合作研发的下一代模型 Gemini 双子座 正在训练中,目前已经展现出了以往模型中从未出现过的多模态能力。据 The Information 消息 Gemini 将具有像 GPT-4 一样的万亿参数。
—— LatentSpace
中文AI能力评测发布,即中文通用大模型综合性基准SuperCLUE。
这是针对中文可用的通用大模型的一个测评基准。
它主要回答的问题是:在当前通用大模型大力发展的背景下,中文大模型的效果情况,包括但不限于”这些模型不同任务的效果情况”、”相较于国际上的代表性模型做到了什么程度”、 “这些模型与人类的效果对比如何”。
谷歌计划在搜索结果中加入AI 聊天内容和更多的短视频
谷歌正在改变其呈现搜索结果的方式,以结合与人工智能的对话,以及更多的短视频和社交媒体帖子,这与几十年来一直占据主导地位的网页列表搜索结果大相径庭。
这些变化表明随着包括 ChatGPT 等人工智能机器人的出现,谷歌正因人们在互联网上访问信息的方式发生重大变化而自我改变。 据公司文件和知情人士透露,他们将推动这项服务进一步突破其传统“10条蓝链接”的搜索结果呈现形式。
—— 华尔街日报
OpenAI去年亏损翻倍,未来几年要筹千亿美元升级AI能力
当地时间5月4日,据科技媒体The Information报道,知情人士透露,OpenAI公司在2022年亏损翻倍,至5.4亿美元。数据表明,在该公司开始出售ChatGPT使用权限之前,其机器学习模型的训练成本高昂。
尽管在OpenAI于2月推出付费版聊天机器人后,公司收入有所增长,但随着越来越多的客户使用其人工智能技术,以及该公司对该软件未来版本进行培训,这些成本可能会继续上升。
此前,OpenAI首席执行官Sam Altman曾非公开地暗示,公司可能会在未来几年筹集至多1000亿美元资金,以进一步开发人工智能的能力。
—— 澎湃新闻
微软 Bing Chat AI 现已对所有人开放,即将推出插件
微软今天向所有人开放其 Bing GPT-4 聊天机器人,无需再等待。您需要做的就是使用您的 Microsoft 帐户登录新必应或 Edge,现在您将访问由 GPT-4 提供支持的开放预览版。微软还通过大量新功能甚至插件支持对 Bing Chat 进行了大规模升级。
在微软尝试删除其新的 Bing Chat 功能的候补名单后将近两个月,此次开放预览发布。该聊天机器人最初于 2 月以私有预览(Private Preview)的形式推出,此后微软一直在逐步开放它。
微软现在正在为 Bing Chat 添加更多智能功能,包括图像和视频结果、新的 Bing 和 Edge Actions 功能、持久聊天和历史记录以及插件支持。插件支持将成为开发人员和 Bing Chat 未来的关键补充。
—— The Verge
百度副总裁:在AI技术的加持下,百度贴吧正在成为一个“正能量加速器”
在百度AI技术的赋能下,贴吧通过AI自动审核、实时过滤,可以迅速有效识别拼音、谐音、拆字、形近字、影射等违规文本内容。
在AI技术的加持下,百度贴吧正在成为一个“正能量加速器”, 让平台更安全也更温暖:文本内容理解技术和信息提取技术能够更精准理解吧友提出的问题,并自动分析评论关注点和观点,并输出评论观点标签及观点;基于自然语言理解、深度学习等技术,能够有效识别过滤违规互助内容;通过领先的中文命名实体识别技术,从非结构化的文本中抽取命名实体,并关联到知识库中的实体对象,实现吧友互助正能量内容结构化,加速用户查找、使用、推荐和传播。
技术发展的趋势是客观事实,甚至是全球各国正在进入深度竞争的关键领域。如何将AI技术为我所用,在保障安全的前提下,去推进社会和文明的进步,是需要我们深入思考的问题。百度贴吧会充分发挥技术优势,和用户携手,与AI技术一起,提升内容安全,弘扬正能量,共创有爱的清朗文明家园。”王颖表示。
—— 中国日报 快照
Snapchat 的 AI 聊天机器人对所有用户免费
该公司在其 Snap 合作伙伴峰会上宣布,Snapchat 的人工智能聊天机器人现已面向全球用户开放。该功能最初于 2 月推出,最初允许 Snapchat 的付费用户直接在其应用程序中与由 OpenAI 的 GPT 技术提供支持的人工智能聊天机器人聊天。现在它将免费提供。
Snap 指出,迄今为止,用户每天使用聊天机器人发送近 200 万条消息。随着在全球范围内推出,该功能也正在升级新功能,包括将 My AI 添加到群聊、在 Snap Map 和 Lenses 上获取地点推荐、与 My AI 共享 Snaps 和接收聊天回复的能力。
该公司还表示,之后,My AI 将能够以独特的“生成式”Snaps 回复,而不仅仅是聊天回复,以保持视觉对话的进行。
在此之前,该功能仅适用于 Snapchat+ 每月 3.99 美元的订阅者。Snap 还表示,Snapchat+ 现在拥有超过 300 万订阅者。然而,AI功能现在将被广泛使用,特定的AI功能需要付费升级。
—— TechCrunch