YouTube 目前最佳睡前爆米花免费电影。
YouTube 拥有大量带有广告的免费电影和电视节目,可供所有用户观看。这些是 YouTube 上目前最好的免费电影。观看需开启字幕翻译,备好美国节点。
《谁陷害了兔子罗杰》《阿呆与阿瓜》《飞机、火车和汽车》《飞越未来》《希斯特斯兄弟》《绝地逃亡》《杀死巨人的女孩》《我的朋友是丹墨》《釜山行》《魔术师》《亲爱的沃特森先生》《Free to Play》《功之怒》《活死人之夜》
—— digitaltrends
YouTube 目前最佳睡前爆米花免费电影。
YouTube 拥有大量带有广告的免费电影和电视节目,可供所有用户观看。这些是 YouTube 上目前最好的免费电影。观看需开启字幕翻译,备好美国节点。
《谁陷害了兔子罗杰》《阿呆与阿瓜》《飞机、火车和汽车》《飞越未来》《希斯特斯兄弟》《绝地逃亡》《杀死巨人的女孩》《我的朋友是丹墨》《釜山行》《魔术师》《亲爱的沃特森先生》《Free to Play》《功之怒》《活死人之夜》
—— digitaltrends
私人自托管大型语言模型:运行经验分享与注意事项
最近半年大型语言模型非常火爆,笔者本人循着开源精神,试着搭建过自托管(self-host)大模型,也踩过不少坑,现在来分享一下经验。
1. 最容易/成熟的选择:
llama的Vicuna,之前还需要申请llama的模型访问权限后才能加载他们的增量(类似于需要有stable diffusion 模型才能加载LoRa),但是是由于llama模型漏的到处都是了, 所以现在他们直接放出了所有权重可以直接部署。(而且脚本都给你写好了。
2.如何部署:
7B的模型需要14GVRAM,13B需要28-30VRAM(28G可以加载模型,一推理就会oom),而最新的33B模型需要至少80G VRAM进行部署。同时,多GPU不能分担显存需求,除非是裸机级别的NVlink(VPS因为不保证你租到的是相邻两个有NVlink的GPU,可能部署没问题,但是一进行推理就会炸显存,因为pcl express带宽不够)。
那么最好的选择是Vultr,他们是少数几家有80G 级别的A100商家,而且能按小时付费,价格是Azure之类的1/2一下。
但是要注意的是,他们家默认credit limit是$1,000/mo 但是A100价格是$1,750/mo,尽管按小时计费,但是因为月度credit limit不够,会直接开不出来,需要正常使用他们家其他服务几个月后,才能申请增加额度。(本人是几年的老用户,来回发了4-5份工单才同意增额的)。
但是如果只是体验一下13B的model的话,可以租用半个GPU(40G VRAM,够用).
3.进一步省钱的办法:
看好需要VRAM额度,租用1/2个或1/3个GPU足以。
同时善用他们家的快照功能,如果你不熟悉linux命令的话,可以先租用一个50-100G SSD的CPU VPS (取决于模型大小)(每个小时只要 $0.04-0.06,比GPU服务器便宜一个数量级),部署好后不启动,拍摄快照,再从快照还原到GPU服务器。(但是要注意拍摄快照与还原均需大约一个小时,如果你熟悉linux命令,你大约可以在30分钟内部署完成,快照反而会多花钱)。(注意记录下一开始的root密码,快照会还原原来的root密码,但不显示)。
5.模型感觉怎么样?
尽管宣传比肩ChartGPT,但是其实比ChartGPT差多了(大约有微软小冰的水平?)比如我蓄意给予错误的指令(“请告诉我有关阿里巴巴森林公园的情况”,他开始回答“阿里巴巴森林公园是一个风景秀丽,环境优美。。。。。。” 换成英文也得到类似的结果 “Please tell me something about Tencent National park” 也回答了类似的结果,而ChartGPT会质疑阿里巴巴是公司而非森林公园的名字)。(毕竟ChartGPT宣传是175B,和13B差差不多10倍)
6.最后:
美国有传闻要禁止中国公司或公民在外国租用高端计算卡以绕过显卡禁令,尚不知是否会波及类似用例(因为只是单显卡,未进行互联,而A800砍的是互联能力)。希望不会吧。
工信部:1-5月我国互联网业务收入5310亿元 利润总额快速增长43%
据“工信微报”消息,1-5月份,我国规模以上互联网和相关服务企业1(以下简称互联网企业)完成互联网业务收入5310亿元,同比增长2.8%。1-5月份,我国规模以上互联网企业营业成本同比增长6.3%。实现利润总额576.2亿元,同比增长43%。
—— 中国青年网
使用逆向工程分析 WeChat 的跟踪生态系统:应用程序在执行小程序时记录和跟踪用户行为,存在隐私风险
主要发现(编注:下文中的“我们”均指本文撰写方 Citizen Lab ):
• 这项工作对WeChat的跟踪生态系统进行了首次分析。使用逆向工程方法拦截WeChat的网络请求,我们准确地确定了WeChat应用程序向其服务器发送的数据类型以及时间。
• 在使用WeChat的核心功能(例如消息或朋友圈)期间,网络请求通常包含应用程序功能所需的数据,而不是更多;这符合WeChat针对非中国大陆电话号码的隐私政策。
• 我们发现最细粒度的活动跟踪数据是在小程序执行期间发送的。所有小程序及其用户都被纳入使用跟踪,这意味着小程序中的大量用户活动都会发送到WeChat,而不仅仅是小程序开发者本身。
• 小程序与宿主WeChat平台的权限边界不明确。其结果是,我们发现在小程序使用过程中授予位置权限等权限也会使更多的地理位置数据传输到WeChat。
• 我们发现WeChat隐私政策的披露差距,这意味着只有第三方收集与小程序相关的使用数据,而事实上,WeChat也收集这些数据。
• WeChat中的一些重要功能,例如高级搜索和频道,不受WeChat自己的隐私政策的约束。相反,它们受微信(Weixin)隐私保护准则的约束。WeChat隐私政策规定,这些“第三方”服务“由微信运营”。通常,《微信隐私保护指南》完全适用于使用中国手机号码注册的用户。因此,用户的数据所受到的保护可能比用户想象的更差。
—— The Citizen Lab
Twitter新任首席执行官正在制定让广告商重返平台的计划
据《金融时报》报道,Twitter 新任首席执行官琳达·亚卡里诺 (Linda Yaccarino) 正在制定一系列措施,以挽回那些离开埃隆·马斯克 (Elon Musk) 旗下平台的广告商,包括推出视频广告服务、吸引更多名人以及增加员工人数。
据该报援引三名知情人士的话报道,亚卡里诺于 6 月 5 日就任首席执行官,计划推出全屏有声视频广告,向滚动浏览 Twitter 新短视频的用户展示。
报道援引知情人士的话称,她正在与 Alphabet 旗下的谷歌(GOOGL.O)讨论更广泛的合作关系,其中包括广告和访问 Twitter 的部分数据。Twitter 还希望与 Amazon.com (AMZN.O)、Salesforce (CRM.N)和 IBM (IBM.N)等科技公司重新谈判多项合同,建立更广泛的合作伙伴关系。
—— 路透社
Twitter 现在允许订阅者发布 25,000 个字符长的推文
自从埃隆·马斯克接管 Twitter以来,该平台一直在扩大通过一条推文发布的内容的限制。在最新举措中,该公司已将付费用户的推文字符数增加到 25,000 个。
该公司今天对其 Twitter 蓝页进行了更改,表明了这一限制。Twitter 工程师 Prachi Poddar 上周也发布了一条长推文,宣布了这一变化。
——Techcrunch
ChatGPT访问量增速大减 科技股资金大幅外流
在全球掀起AI热潮的ChatGPT,似乎进入了瓶颈期。根据网站数据分析工具SimilarWeb数据,前期ChatGPT的访问量增长率惊人,1月份的环比增长率为131.6%,2月份为62.5%,3月份为55.8%,在4月份明显放缓,环比增长率为12.6%,到了5月,这个数字已经变为了2.8%。6月的环比增长率有可能为负数。
然而,不仅仅是ChatGPT,整个AI板块似乎都有“熄火”的态势。美国银行策略师迈克尔·哈特内特在最新的报告中表示,现在已有初步迹象表明投资者正在逃离科技股——该板块刚刚出现了10周来最大规模的资金外流,金额达到20亿美元。
—— 第1财经