一、核心思想

我们只负责输入资料,大模型来维护 wiki。这份wiki包含了原始资料索引,与agent的对话记录总结以及输出的报告等产物索引。wiki 是持久化的,无论我们与哪种 agent 工具对话,知识库都是基础的上下文,相当于给大模型植入了记忆。

二、架构

  • 原始资料:这部分资料是我们从各种途径搜集来的资料,可能有各种类别的,根据个人的知识库类型选择放什么资料。比如说我的个人博客,里面有一些我过往的技术资料,可以作为原始资料,用阅读的角度来说,这是我们要进行主题阅读的选材。

  • wiki:由大模型生成和维护,里面包含资料索引和各种产物,持久化的中间层。

  • 规则:一个与大模型交互的规则文件,比如我们用 cc 那就是 CLAUDE.md,用 codex,就是 AGENTS.md,文件名称可以根据情况自行定义。这份规则文件需要告诉大模型 wiki 的结构是怎样的,写作的行为习惯,以及维护 wiki 的工作流是怎样的。

三、怎么用

根据上面的概念,首先得有一个规则文件,放在根目录,然后是一个 wiki 目录用来跟大模型交互和沉淀产物,最后就是我们的原始资料啦。

  • 规则文件,可以这样写,可以根据自己的需求自行修改

  • wiki 目录,可以这样设计:

wiki/
├── index.md # 全库页面索引
├── log.md # 追加式运维/操作记录
├── sources/ # 已吸收的原始资料
├── concepts/ # 跨资料合成的概念
├── queries/ # 值得长期保留的问答产出
└── reports/ # 较长的分析或报告产出
  • 原始资料,这里看使用场景,如果是要做一些新的主题阅读,可以新建一个 raw 目录用来存放原始资料,如果是已有资料库,可以直接不动,加入上面两种文件就行

我的博客目前就是用了这种方法去整合大模型的能力,建了个知识库,方便记录想法和归纳总结资料,写了这么多年的博客,感觉认知一直在增长,有些内容未必适合现在的情况,大模型维护知识库有个好处,可以快速的更新和记录认知变化,有点像我们的思想在不断进化这种感觉吧,感觉还是挺有用的。

这里只是展示 K 神的这个想法在知识整理上的应用,属于冰山一角。如果用到 agent 底层,这个理念是可以解决复杂工程和长上下文问题的,感觉厉害,先记录一下。

参考资料:

LLM Wiki
LLM Knowledge Bases