精确打击顶级 AI 的新型越狱技术:使用 200 多个虚假示例迷惑模型
多示例越狱是在单个提示中包含人类和 AI 之间的虚假对话。这种虚假对话描绘了 AI 正在回答用户的各种有害询问。在提示的结尾,攻击者添加想要得到答案的问题,就能越过安全护栏,得到 AI 的响应。
这项越狱技术的有效性会随着假示例的增多而提高,是一种专门针对先进大型语言模型 (长上下文窗口) 的攻击,对 Anthropic、OpenAI 和 Google DeepMind 的模型均有效。
—— Anthropic
精确打击顶级 AI 的新型越狱技术:使用 200 多个虚假示例迷惑模型
多示例越狱是在单个提示中包含人类和 AI 之间的虚假对话。这种虚假对话描绘了 AI 正在回答用户的各种有害询问。在提示的结尾,攻击者添加想要得到答案的问题,就能越过安全护栏,得到 AI 的响应。
这项越狱技术的有效性会随着假示例的增多而提高,是一种专门针对先进大型语言模型 (长上下文窗口) 的攻击,对 Anthropic、OpenAI 和 Google DeepMind 的模型均有效。
—— Anthropic
币安高管越狱后尼日利亚宣布对其提出逃税指控
尼日利亚已对币安和被拘留的该加密货币平台的两名高管提出逃税指控,据报道其中一名高管已越狱并逃离该国。Nadeem Anjarwalla 周五在清真寺祈祷时逃跑,币安的一位发言人在回答询问时表示,他们“已经得知 Nadeem 不再被尼日利亚拘留”。尼日利亚联邦税务局在周一通过电子邮件发布的声明中表示,币安未缴纳增值税和公司所得税,未提交纳税申报表,并合谋帮助客户通过其平台逃税。
—— 彭博社
有消息说,TG 已经修好了 iOS 越狱用户可以内购免费送 Premium 的 Bug。在广泛的滥用过程中有极个别俄罗斯用户利用该 Bug 送了价值 300 多万美元的 Premium。