摘要

作者在排查 race condition 时消耗大量对话 token 仍失败;受 Karpathy 的 auto-research 思路启发,在流程中增加一句约束:把所有假设和证据写到 DEBUG.md。模型列出多个假设后,作者根据「某假设无任何反对证据」缩小范围,用极少行数实验确认根因并快速修复。作者归纳四条调试规则,并将对应能力做成 Claude Code / Gemini CLI 的 skill,开源在 GitHub。

原文要点(来源声称)

  1. 改代码之前必须先列假设。
  2. 每次实验最多改约 5 行。
  3. 所有证据写入文件,减轻上下文压缩导致的推理链丢失。
  4. 同一方向连续失败两次则强制更换假设。

外部链接

关联概念