人闸门确认机制
人闸门(Human Gate)是 DesireCore 安全体系的核心机制——在智能体执行高风险操作前,强制暂停并请求你的确认。
什么操作会触发人闸门
智能体在执行任务时,以下类型的操作会自动触发人闸门:
| 操作类型 | 示例 | 风险等级 |
|---|---|---|
| 发送消息 | 发邮件、发消息给他人 | 中 - 高 |
| 修改文件 | 写入或删除文件 | 中 |
| 执行命令 | 运行脚本或系统命令 | 中 - 高 |
| 外部调用 | 调用第三方 API 或服务 | 中 - 高 |
| 财务操作 | 涉及支付、转账等 | 高 - 严重 |
| 发布/公开 | 发布内容到外部平台 | 高 |
| 删除操作 | 删除数据或资源 | 高 |
| 权限变更 | 修改访问权限 | 严重 |
不是所有操作都需要确认
读取文件、分析数据、生成草稿等只读操作通常不需要确认。智能体会自主完成这些低风险操作,提高效率。
确认对话框
当人闸门被触发时,你会看到一个确认对话框:
确认对话框包含的信息
| 信息 | 说明 |
|---|---|
| 操作类型 | 智能体想要执行什么操作 |
| 影响范围 | 这个操作会影响什么资源 |
| 风险等级 | 操作的风险程度(低/中/高/严重) |
| 来源追溯 | 为什么要执行这个操作,源自哪个任务 |
| 详情 | 具体的操作内容(可展开查看) |
三种选择
批准
确认执行这个操作:
你:[点击 ✓ 允许]
智能体:"好的,正在执行..."
如果勾选了 "允许并记住",下次遇到同类操作(如写入相同目录下的文件)将自动允许,不再弹出确认。
拒绝
阻止这个操作:
你:[点击 ✗ 拒绝]
智能体:"好的,我不会执行这个操作。
我将调整计划:改为把报告内容展示在对话中,
而不是写入文件。继续吗?"
智能体会根据你的拒绝理由调整后续行为。
修改
你同意执行,但想修改某些参数:
你:[点击 ✎ 修改]
[编辑面板打开]
文件路径:docs/审查报告-XX-2025-001.md
→ 修改为:docs/drafts/审查报告-XX-2025-001-草稿.md
你:"保存到草稿目录,并在文件名中标注'草稿'。"
风险等级与确认频率
不同风险等级的操作,触发确认的频率不同:
| 风险等级 | 标识 | 确认策略 | 示例 |
|---|---|---|---|
| 低 | 🟢 | 默认自动允许 | 读取文件、搜索信息 |
| 中 | 🟡 | 默认询问,可设为自动允许 | 写入文件、运行安全命令 |
| 高 | 🟠 | 始终询问,可勾选"记住" | 发送邮件、调用外部 API |
| 严重 | 🔴 | 始终询问,不可跳过 | 删除数据、财务操作、权限变更 |
严重风险操作不可自动批准
涉及财务、删除、权限变更等严重风险的操作,即使你勾选了"记住",系统也会每次都要求确认。这是为了保护你免受不可恢复的损失。
管理"记住"的规则
你之前通过"允许并记住"创建的规则,可以在设置中管理:
你:"列出所有自动允许的规则。"
智能体:"当前有 3 条自动允许规则:
1. ✅ 允许写入 docs/ 目录下的 .md 文件
创建时间:3 天前
2. ✅ 允许执行 git 相关命令
创建时间:1 周前
3. ✅ 允许调用翻译 API
创建时间:2 周前
你可以编辑或删除这些规则。"
你可以随时删除某条规则,让智能体恢复为每次都询问的状态。
信任是渐进的
刚开始使用智能体时,建议保持较多的确认。随着你对它的信任增加,再逐步放开自动允许的范围。这就像现实中带新人——先看着他做,确认没问题了,再慢慢放手。
下一步
当智能体完成任务后,会生成一份详细的执行回执。前往 执行回执 了解如何解读回执信息。