标签：数据处理

中国人工智能模型DeepSeek因数据处理争议暂停韩国服务

中国人工智能模型DeepSeek在韩国的服务恢复时间仍不确定。据韩联社报道，韩国个人信息保护委员会于1月31日向该公司发送质询函，指出其用户信息处理方式存在争议。随后，DeepSeek于2月15日晚六时起暂停在韩新用户下载服务。

对此，韩国个人信息保护委员会委员长高鹤洙表示，中国公司已承诺将努力遵守韩国《个人信息保护法》。然而，整改过程可能需要相当长时间，具体恢复时间尚未确定。DeepSeek方面承认，在推出全球版本时对韩国隐私法规考虑不够充分，并高度重视韩国市场，正积极配合讨论整改措施。

韩国监管机构认为，为防止担忧进一步扩散，建议DeepSeek暂停服务并进行必要的改进。尽管公司已采取行动指派专人处理此事，但整改工作仍需时间完成，目前尚无法确定何时能够恢复服务。

2025年3月28日
腾讯元宝Excel表格解析功能全新升级

腾讯元宝今日全新升级，新增Excel表格解析能力，为用户提供更高效的数据处理体验。用户只需上传表格并提出问题，系统即可自动完成数据计算、分析与重点提取，无需手动编写公式。无论是预算表、成绩单还是各类统计报表，腾讯元宝都能精准理解需求并快速生成分析结果。

对于数据量庞大的表格，用户可选择切换至混元模型的快思考模式（Turbo S），自动生成代码以高效处理复杂数据。目前该功能已全面覆盖手机版、电脑版及网页版，并支持DeepSeek与混元双模型运行。除了本地文件上传外，还支持从微信和腾讯文档导入Excel文件。

此外，腾讯元宝还可对表格进行解析并生成柱状图等可视化图表，帮助用户更直观地理解数据。这一功能升级进一步提升了AI搜索及解析能力，可一次性处理最多50个文件，并支持超长文本和各类链接的解析，为用户提供更加智能便捷的数据分析服务。

2025年3月21日
Gemini 数据分析能力不足

Gemini 数据分析能力并不像宣称的那么好

谷歌 AI 模型 Gemini 1.5 Pro 和 1.5 Flash 据称能够凭借其“长上下文”完成以前不可能完成的任务，例如总结数百页的文档或搜索电影镜头中的场景。但新的研究表明，这些模型实际上在这些方面并不是很擅长。两项独立研究调查了 Gemini 模型和其他模型如何很好地理解大量数据。两项研究都发现 Gemini 1.5 Pro 和 1.5 Flash 很难正确回答有关大型数据集的问题；在一系列基于文档测试中，这些模型给出正确答案的概率只有40%到50%。

马萨诸塞大学阿默斯特分校博士后、其中一项研究的合著者 Marzena Karpinska 说：“虽然像 Gemini 1.5 Pro 这样的模型在技术上可以处理长篇上下文，但我们已经看到许多案例表明，这些模型实际上并不‘理解’内容。”

—— Techcrunch

2024年12月5日
苹果计划在虚拟黑匣子中处理人工智能数据

苹果人工智能服务器将使用“机密计算”技术来处理数据保护用户隐私

据四名参与该项目的前苹果员工称，苹果公司计划在虚拟黑匣子中处理来自人工智能应用程序的数据，使其员工无法访问这些数据。过去三年来，该公司一直在开展一个秘密项目，内部称为“苹果数据中心芯片”(ACDC)，该项目将允许进行此类黑匣子处理。其方法在概念上类似于“机密计算”，这是一个行业术语，意味着即使在处理数据时，数据也是保密的。借助“机密计算”方法，苹果公司将能够在云端处理人工智能相关数据，同时即使在数据泄露的情况下，黑客也很难解密访问数据。这还将减轻苹果公司在政府或执法部门要求时必须交出其服务器中的个人数据的负担。

—— The Information

2024年12月5日
Gmail中的新矢量算法

Gmail中部署的新矢量算法将大幅度提高垃圾和钓鱼邮件的识别率

Google最近在 Google Colab 上开源了一个名为 RETVec 的新型多语言文本矢量化器，这个矢量化器已经部署在 Gmail 上，用来提升垃圾邮件和钓鱼邮件的识别率，同时降低误报率。

为什么要训练这样一种模型呢？因为 Gmail 每天收发的邮件都在千万级别，如果包含各类垃圾邮件的话可能有几十亿，而垃圾邮件制造者会对Google的检测系统进行规避，例如使用同形字。

根据Google自己的统计，将 RETVec 应用到 Gmail 后，垃圾邮件检测率比基准提高 38%、误报率降低 19.4%、张量处理单元 (TPU) 使用率降低了 83%。

—— cnBeta

2024年12月5日
应用程序数据处理活动加强风险监测

国家网信办：开展应用程序数据处理活动应加强风险监测，不得危害国家安全、公共利益

国家互联网信息办公室发布《移动互联网应用程序信息服务管理规定（征求意见稿）》。

其中提到，开展应用程序数据处理活动，应当履行数据安全保护义务，建立健全全流程数据安全管理制度，采取保障数据安全技术措施和其他安全措施，加强风险监测，不得危害国家安全、公共利益，不得损害个人、组织的合法权益。

查看意见稿全文（Archive互联网档案馆快照）

2024年12月5日

标签： 数据处理

中国人工智能模型DeepSeek因数据处理争议暂停韩国服务

腾讯元宝Excel表格解析功能全新升级

Gemini 数据分析能力不足

苹果计划在虚拟黑匣子中处理人工智能数据

Gmail中的新矢量算法

应用程序数据处理活动加强风险监测

标签：数据处理