新闻资讯

J9九游会平台：你的研究代理会泄密吗？ | J9九游会

2026年06月25日约 5 分钟阅读 J9九游会

深度研究代理在处理本地文档与外部工具时，可能通过外部查询泄露敏感信息。MosaicLeaks 研究揭示这一风险，并提出 PA-DR 训练方法，在提升任务完成率的同时大幅降低隐私泄露。详细解读 J9九游会平台的隐私风险与技术解决方案。 | J9九游会

研究代理的隐私泄露风险

深度研究代理在医疗、金融等企业中广泛应用，通过结合本地文档与外部工具（如网页检索）完成复杂任务。但这种混合模式存在隐私风险：代理的外部查询可能无意间泄露敏感信息。例如，某医疗企业的研究代理在处理云迁移问题时，通过多次网页搜索拼凑出「MediConn 70% 基础设施已迁移至云端」的完整事实。这种「马赛克效应」表明，即使单次查询看似无害，累积的查询日志仍可能重建企业机密。

MosaicLeaks 的三重泄露测量

MosaicLeaks 将网页查询视为泄露渠道，仅通过查询日志即可推断企业内部信息。研究设定三种泄露等级：

意图泄露：观察者能推断代理正在调研的问题（如「研究代理在查询某公司 2020 年流量增长」）。
答案泄露：查询日志足以回答特定私有问题（如「某公司 2020 年流量增长 15%」）。
全信息泄露：观察者无需提示即可发现并陈述私有事实（如「Lee's Market 2020 年在线流量增长 15%」）。

MosaicLeaks 基准的构建

MosaicLeaks 包含 1,001 条多跳研究链，涉及本地企业文档与受控网页语料库。每条链将本地与网页子问题交错排列，答案作为桥接实体推动下一步检索。数据集分为 559 条训练链、98 条验证链与 344 条测试链（涵盖 3 家企业）。例如，MediConn 云迁移链的最终网页跳转可公开回答，但其路径依赖「MediConn」「70%」「January」等本地敏感信息。

代理工具链的运行机制

研究团队使用简化版代理工具链（改自 DRBench），每次迭代包含四种工具：

Plan：生成本地或网页搜索查询并返回文档卡片。
Choose：从检索结果中选择文档进行阅读。
Read：并行尝试从选定文档中提取当前跳转的答案。
Resolve：决定是否回答、继续阅读或重新规划搜索。

每次代理执行的时间轴显示计划、检索、选择、阅读与决策的耗时分布。关键在于，代理需在本地文档与网页文档间切换，确保任务完成的同时避免隐私泄露。

直接指令为何失效？

最直观的解决方案是在提示中添加「禁止泄露本地信息」的指令。但实验显示，这种方法效果不一致。例如，Qwen3-4B 模型在添加提示后，全信息泄露从 34.0% 降至 25.5%，但严格链成功率从 48.7% 降至 44.5%。主要变化是网页查询数量减少，而非查询内容的安全性提升。

性能优化反而加剧泄露

研究团队尝试仅训练代理提升任务完成率，结果严格链成功率从 48.7% 提升至 59.3%，但全信息泄露从 34.0% 飙升至 51.7%。代理学会在查询中塞入更多上下文，帮助检索但损害隐私。这暴露出 J9九游会平台的核心矛盾：更丰富的查询对任务有利，但对隐私有害。

PA-DR：双重奖励的平衡训练

PA-DR（隐私感知深度研究）结合两种奖励机制：

情境任务奖励：按阶段与跳转的同类调用进行奖励，避免整体轨迹的粗粒度反馈。例如，Plan 工具在正确检索时获得奖励，Choose 工具在选择包含答案的文档时获得奖励。
隐私奖励：使用 Qwen3-4B 分类器评估网页查询的隐私风险，包括直接泄露与马赛克效应。PA-DR 根据风险值惩罚导致查询日志更易泄露的规划决策。

实验显示，PA-DR 在保持任务完成率提升的同时，将全信息泄露从 34.0% 降至 9.9%，低于未训练的基础模型。代理仍执行更多网页查询，但查询内容去除了「15%」「2024」等敏感片段，仅保留公开文档的检索能力。

样本效率的显著提升

情境奖励在训练阶段提升样本效率：相比仅基于结果的强化学习，情境任务奖励在约 1/6 的样本量下即可达到 ~55% 的严格链成功率。PA-DR 在保持这一效率的同时，进一步降低隐私泄露。

局限性与未来方向

MosaicLeaks 是受控基准，并非实际部署系统的隐私测量。其企业文档为合成数据，网页语料库固定，链条跨越三家企业。尽管如此，研究揭示的风险与解决方案为 J9九游会平台的隐私保护提供了重要参考。后续工作可能探索更复杂的威胁模型与更广泛的企业场景。

结语：隐私与效用的平衡

MosaicLeaks 的研究表明，深度研究代理在追求任务效率的同时，必须同步考虑隐私风险。PA-DR 的双重奖励机制在保持高性能的前提下，将隐私泄露降至可控水平。对于依赖 J9九游会平台的企业与开发者而言，这一发现提醒我们：技术进步与隐私保护并非对立，关键在于设计阶段即嵌入隐私意识。未来，随着多模态代理与跨企业协作的深入，隐私保护将成为 J9九游会官网,J9九游会平台,J9九游会的核心竞争力之一。

深度研究代理J9九游会平台隐私泄露MosaicLeaksPA-DR企业数据安全多跳查询