三层可控性
DesireCore 的安全设计围绕一个核心理念:你始终是最终决策者。 智能体是你的助手,不是你的管理者。为了确保这一点,我们构建了三层可控性体系。
第一层:可见(Visible)
你能看到智能体在做什么。
智能体的每一步操作都对你透明可见,不存在"暗箱操作"。
具体体现:
- 操作前确认:当智能体需要执行写入文件、调用 API 等操作时,会弹出确认对话框,清楚展示操作类型、影响范围和风险等级
- 来源追溯:每个操作请求都会说明"为什么要执行这个操作",追溯到你的哪条指令触发了它
- 详情展开:你可以展开查看完整的操作参数,例如要修改的文件内容 diff、要执行的命令全文
- 执行回执:每次任务完成后生成详细回执,记录工具调用链、决策依据和产出物
提示
可见性不等于信息轰炸。DesireCore 会根据风险等级决定展示信息的详略程度——低风险操作简要提示,高风险操作详细展示。
第二层:可控(Controllable)
你能随时干预和修改。
看到了不够,你还需要能够影响智能体的行为。
具体体现:
- 三选一决策:面对智能体的操作请求,你可以选择"允许"、"拒绝"或"修改"
- 允许:让智能体执行操作
- 拒绝:取消操作,智能体需要调整方案
- 修改:打开编辑面板,手动调整操作参数后再执行
- 规则记忆:对于信任的操作,勾选"允许并记住",下次类似操作自动放行
- 权限规则管理:在设置中集中查看和管理所有已记住的权限规则,支持编辑、禁用和删除
- 中断能力:任务执行过程中,你随时可以点击停止按钮中断
第三层:可逆(Reversible)
任何操作都能撤销。
即使你允许了一个操作,事后发现不对也没关系,所有变更都可以回退。
具体体现:
DesireCore 支持四级回滚粒度:
| 回滚级别 | 说明 | 恢复速度 |
|---|---|---|
| Patch 级 | 撤销最近一次单个文件修改 | < 100ms |
| Turn 级 | 撤销最近一轮对话产生的所有修改 | < 500ms |
| Session 级 | 恢复到本次会话开始时的状态 | < 2s |
| Version 级 | 选择任意历史快照进行恢复 | 取决于差异大小 |
中断恢复:当你中断一个正在执行的任务后,系统会提供恢复选项面板,你可以选择:
- 继续执行
- 重试当前步骤
- 跳过当前步骤
- 回滚本次任务的所有修改
- 放弃任务但保留已有修改
三层协同
三层可控性并非独立存在,而是层层递进、相互配合:
可见 → 你知道发生了什么
↓
可控 → 你决定是否继续
↓
可逆 → 即使决策有误,也能安全回退
这套机制确保你在享受智能体带来便利的同时,不会失去对系统的掌控。无论智能体多么"聪明",最终决定权始终在你手中。
信息
DesireCore 的安全设计借鉴了 NIST AI 安全框架的人机协作原则,同时根据桌面应用的特点做了本地化适配。我们相信,好的安全机制应该让你感到安心,而不是感到束缚。