一魂万模:借助 .klickd 实现开源智能体的可移植记忆

发布日期:2026-05-23 10:01:40   浏览量 :0
发布日期:2026-05-23 10:01:40  
0

2026西湖龙井茶官网DTC发售:茶农直供,政府溯源防伪到农户家 

一张图表,展示赫尔墨斯智能体作为工作流运行器,以及 .klickd 作为可移植状态层。它说明了赫尔墨斯如何运行任务、工具、报告和产物,而 .klickd 则在不同模型和智能体会话之间携带项目记忆、验证关卡、人工否决规则、声明来源和基准上下文。

这是提交给赫尔墨斯智能体挑战赛的作品:使用赫尔墨斯智能体进行构建

我构建的内容

我构建了赫尔墨斯智能体.klickd之间的原型集成,后者是一种用于人工智能智能体的开放可移植记忆格式。

我想探索的问题很简单:

每个新的智能体会话往往需要再次付出代价,去重新发现已经存在的上下文。

这种重复的上下文成本表现为:

  • 重新解释项目状态;
  • 重新加载约束条件;
  • 重新发现之前的决策;
  • 重新构建交接说明;
  • 重新运行测试只是为了找到相同的失败;
  • 失去对哪些操作需要人工批准的跟踪。

.klickd旨在将这种重复的上下文转化为一个可移植、加密、版本化的文件,智能体可以在工作开始前加载该文件。

赫尔墨斯智能体非常适合测试这一点,因为它是一个开源、自托管的智能体运行时,具备技能、插件、钩子、审批、本地执行和智能体工作流编排功能。

在这个项目中:

赫尔墨斯运行工作流。.klickd承载状态。

该原型专注于一个名为上下文成本基准的基准测试,它比较两种模式:

  1. 基线冷启动

    每次都将完整上下文粘贴到提示词中。

  2. .klickd加载模式

    结构化上下文从.klickd固件中加载,并注入到智能体工作流中。

该基准测试旨在衡量:

  • 重复输入的令牌数;
  • 输出令牌数;
  • 估算成本;
  • 延迟;
  • 连续性错误;
  • 违反锁定决策的情况;
  • 违反工具权限的情况;
  • 交接质量;
  • 不必要的昂贵命令重新运行。

目标并非声称有神奇的百分比改进。目标是可重复地衡量:

仅仅因为智能体必须重新发现我们已经产生的状态,我们为此支付了多少令牌和错误成本?

演示

为了参加赫尔墨斯智能体挑战赛,我在klickdskill仓库中创建了一个实验性的赫尔墨斯集成。

该演示使用赫尔墨斯智能体来驱动本地的.klickd上下文成本基准测试。

hermes_klickd_agent_session_messages_json
关于我们
热门推荐
合作伙伴
免责声明:本站部分资讯来源于网络,如有侵权请及时联系客服,我们将尽快处理
支持 反馈 订阅 数据
回到顶部