抽象概念
符号推理的原语
活的记忆
多数 harness 用一份只增不减的扁平日志来记忆。Xihe 的记忆是一张会提炼、会重组、会遗忘的图谱——浮上来的是信号,不是流水账。
一个库,四位住民
skills、genes、facts、evolution events 通常是四套系统。在这里,它们是一张 SQLite 数据库的四个寄存器——彼此之间有桥,还有一台让它们自我演化的飞轮。无 embedding、无 GPU、无向量服务。
$ cp substrate.db backup.db $ sqlite3 substrate.db \ "select layer, key, confidence from facts limit 5"
多数记忆是一个你只能盲信的向量索引。这是一张你用手边工具就能查的表。
L6 → L0
抽象概念
符号推理的原语
战略模式
跨任务可复用的策略
行为基因
BM25 检索,幂等迁移
实体图谱
带溯源的时序知识图谱
结构化事实
经校验、过克制闸门的写入
压缩情节
做梦裁剪后的聚类
原始日志
短暂、未经整理
Lifecycle · 三道闸门
每条事实落库前都必须活过可证伪校验。幻觉永远无法变成记忆。
agent 闲置时,记忆自己去重、压缩、重组。熵减让检索始终锋利。
最近性、置信度、相关性驱动退役。有意图的遗忘是特性,不是泄漏。
你不去整理记忆。记忆自己整理自己。
什么允许被写
agent 说的并非每句都值得被记。每次写入都过 validateFactWrite + 克制闸门;只有声明过的 namespace 才放行,且默认关闭——除非一条 fact 证明它该被记。
幻觉永远不会变成记忆。这道闸,是聊天记录与知识库的分界。
从 tentative 到可信
新 fact 先进 tentative——被记住,但不起作用。只有被佐证才升 confident:证据跨 session 反复出现。而只有 confident 的 fact 才被注回去驱动行为。
被记住、从不行动 · 约 30 天过期
驱动行为 · 每轮重新注入
层是一个轴——多抽象。信任是另一个轴——多被佐证。一条 fact 可以位高却仍是冷的;只有又热又高信任的区,才触发行为。
agent 对自己的判断保持松握,直到证据为它撑腰。熔断器阻止一条 fact 反复横跳、或一拥而上挤进信任。
Genes 基因
一个行为基因是一段可复用的“怎么做”。BM25 搜索为手头任务找到最近的匹配,并幂等地迁移进来——无需重训、不漂移、不浪费。
复用胜过召回。最好的记忆,是你再也不必查第二次的那条。
会自学习的技能
同一张库,既记忆也自我改进。运行时的信号被挖成能力、写回库里——于是 harness 每跑一次都更锋利,而不是从冷启开始。agent 提议,你批准。没有静默自改。
route_hit + 五个生产者从运行中触发
episodic miner 提炼 confident + worked 的模式
起草一个新 skill 或 gene
去重 · 修剪 · 收缩——bundle 永不臃肿
held-out 闸 · 仅提议 · 你批准
↻它会回环:confident 模式成 gene,gene 成 skill,skill 喂下一次运行。是飞轮,不是定死的 prompt。
The curated core
点开任一技能,看核心要点
无平台依赖 · 无品牌绑定 · 无私有密钥
领域接地
通用 harness 不绑定任何领域。但记忆生来就能接一个 domain pack:一组 namespace、校验器,以及为你个人或专业领域准备的 grounding 词表。装上它,模型就在要紧处不再瞎猜——它的答案带着你可以核对的出处。
domain pack 声明在你的领域里什么允许被记住、什么绝不可以。写闸强制执行,reject-by-default。
grounding 闸盯住需要权威的论断,把它们绑到你的领域词表——法定数字、领域术语、那些绝不能被幻觉的事实。
domain pack 承载你的逻辑、你的术语、你的来源。开源底座从不吸收它们——换领域不动内核。
通用内核,领域在上。模型从你的大地作答,而非它的猜测。