跳到主要内容

三层可控性

DesireCore 的安全设计围绕一个核心理念:你始终是最终决策者。 智能体是你的助手,不是你的管理者。为了确保这一点,我们构建了三层可控性体系。

第一层:可见(Visible)

你能看到智能体在做什么。

智能体的每一步操作都对你透明可见,不存在"暗箱操作"。

具体体现:

  • 操作前确认:当智能体需要执行写入文件、调用 API 等操作时,会弹出确认对话框,清楚展示操作类型、影响范围和风险等级
  • 来源追溯:每个操作请求都会说明"为什么要执行这个操作",追溯到你的哪条指令触发了它
  • 详情展开:你可以展开查看完整的操作参数,例如要修改的文件内容 diff、要执行的命令全文
  • 执行回执:每次任务完成后生成详细回执,记录工具调用链、决策依据和产出物
提示

可见性不等于信息轰炸。DesireCore 会根据风险等级决定展示信息的详略程度——低风险操作简要提示,高风险操作详细展示。

第二层:可控(Controllable)

你能随时干预和修改。

看到了不够,你还需要能够影响智能体的行为。

具体体现:

  • 三选一决策:面对智能体的操作请求,你可以选择"允许"、"拒绝"或"修改"
    • 允许:让智能体执行操作
    • 拒绝:取消操作,智能体需要调整方案
    • 修改:打开编辑面板,手动调整操作参数后再执行
  • 规则记忆:对于信任的操作,勾选"允许并记住",下次类似操作自动放行
  • 权限规则管理:在设置中集中查看和管理所有已记住的权限规则,支持编辑、禁用和删除
  • 中断能力:任务执行过程中,你随时可以点击停止按钮中断

第三层:可逆(Reversible)

任何操作都能撤销。

即使你允许了一个操作,事后发现不对也没关系,所有变更都可以回退。

具体体现:

DesireCore 支持四级回滚粒度:

回滚级别说明恢复速度
Patch 级撤销最近一次单个文件修改< 100ms
Turn 级撤销最近一轮对话产生的所有修改< 500ms
Session 级恢复到本次会话开始时的状态< 2s
Version 级选择任意历史快照进行恢复取决于差异大小

中断恢复:当你中断一个正在执行的任务后,系统会提供恢复选项面板,你可以选择:

  • 继续执行
  • 重试当前步骤
  • 跳过当前步骤
  • 回滚本次任务的所有修改
  • 放弃任务但保留已有修改

三层协同

三层可控性并非独立存在,而是层层递进、相互配合:

可见 → 你知道发生了什么

可控 → 你决定是否继续

可逆 → 即使决策有误,也能安全回退

这套机制确保你在享受智能体带来便利的同时,不会失去对系统的掌控。无论智能体多么"聪明",最终决定权始终在你手中。

信息

DesireCore 的安全设计借鉴了 NIST AI 安全框架的人机协作原则,同时根据桌面应用的特点做了本地化适配。我们相信,好的安全机制应该让你感到安心,而不是感到束缚。