跳到主要内容

人闸门确认机制

人闸门(Human Gate)是 DesireCore 安全体系的核心机制——在智能体执行高风险操作前,强制暂停并请求你的确认。

什么操作会触发人闸门

智能体在执行任务时,以下类型的操作会自动触发人闸门:

操作类型示例风险等级
发送消息发邮件、发消息给他人中 - 高
修改文件写入或删除文件
执行命令运行脚本或系统命令中 - 高
外部调用调用第三方 API 或服务中 - 高
财务操作涉及支付、转账等高 - 严重
发布/公开发布内容到外部平台
删除操作删除数据或资源
权限变更修改访问权限严重
不是所有操作都需要确认

读取文件、分析数据、生成草稿等只读操作通常不需要确认。智能体会自主完成这些低风险操作,提高效率。

确认对话框

当人闸门被触发时,你会看到一个确认对话框:

确认对话框

确认对话框包含的信息

信息说明
操作类型智能体想要执行什么操作
影响范围这个操作会影响什么资源
风险等级操作的风险程度(低/中/高/严重)
来源追溯为什么要执行这个操作,源自哪个任务
详情具体的操作内容(可展开查看)

三种选择

批准

确认执行这个操作:

你:[点击 ✓ 允许]
智能体:"好的,正在执行..."

如果勾选了 "允许并记住",下次遇到同类操作(如写入相同目录下的文件)将自动允许,不再弹出确认。

拒绝

阻止这个操作:

你:[点击 ✗ 拒绝]
智能体:"好的,我不会执行这个操作。
我将调整计划:改为把报告内容展示在对话中,
而不是写入文件。继续吗?"

智能体会根据你的拒绝理由调整后续行为。

修改

你同意执行,但想修改某些参数:

你:[点击 ✎ 修改]

[编辑面板打开]
文件路径:docs/审查报告-XX-2025-001.md
→ 修改为:docs/drafts/审查报告-XX-2025-001-草稿.md

你:"保存到草稿目录,并在文件名中标注'草稿'。"

风险等级与确认频率

不同风险等级的操作,触发确认的频率不同:

风险等级标识确认策略示例
🟢默认自动允许读取文件、搜索信息
🟡默认询问,可设为自动允许写入文件、运行安全命令
🟠始终询问,可勾选"记住"发送邮件、调用外部 API
严重🔴始终询问,不可跳过删除数据、财务操作、权限变更
严重风险操作不可自动批准

涉及财务、删除、权限变更等严重风险的操作,即使你勾选了"记住",系统也会每次都要求确认。这是为了保护你免受不可恢复的损失。

管理"记住"的规则

你之前通过"允许并记住"创建的规则,可以在设置中管理:

你:"列出所有自动允许的规则。"

智能体:"当前有 3 条自动允许规则:

1. ✅ 允许写入 docs/ 目录下的 .md 文件
创建时间:3 天前

2. ✅ 允许执行 git 相关命令
创建时间:1 周前

3. ✅ 允许调用翻译 API
创建时间:2 周前

你可以编辑或删除这些规则。"

你可以随时删除某条规则,让智能体恢复为每次都询问的状态。

信任是渐进的

刚开始使用智能体时,建议保持较多的确认。随着你对它的信任增加,再逐步放开自动允许的范围。这就像现实中带新人——先看着他做,确认没问题了,再慢慢放手。

下一步

当智能体完成任务后,会生成一份详细的执行回执。前往 执行回执 了解如何解读回执信息。