Claude Code 代码的递归自我改进，已经可以实现了

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

• 请不要在回答技术问题时复制粘贴 AI 生成的内容

大家都在讨论 AGI 的递归自我改进——AI 改进自己，变得更强，再改进自己。

但其实，代码的递归自我改进，现在就能实现。不需要等 AGI 。

原理很简单：

AI Agent 写代码 → 代码进入代码库 → 下次会话 AI 读这些代码作为上下文 → 代码质量决定 AI 下次写得好不好

如果有一个传感器能测量代码结构质量，告诉 AI 分数：
- AI 看到分数 → 知道要改进 → 改进代码 → 分数上升
- 分数上升 → 代码库更清晰 → AI 下次读到更好的上下文 → 写出更好的代码
- 循环。每次迭代都在变好。

这就是递归自我改进。不是改进模型本身，是改进模型工作的环境。

我用 Rust 写了 sentrux ，就是这个传感器：
- tree-sitter 扫描（ 52 种语言）
- 5 个根因指标 → 一个质量分（ 0-10000 ）
- MCP 接入 Claude Code ，Agent 直接能看到分数
- 几何平均值聚合（ Nash 定理）——没法刷分，只有真正改善架构才能提分

实测：Claude Code Opus 4.6 从零构建 FastAPI 项目，初始分 2627 ，经过反馈循环迭代后到 6772 。不是因为模型变了——是因为有了传感器。

纯 Rust ，单文件，MIT 开源。
GitHub: https://github.com/sentrux/sentrux

欢迎讨论。

10 条回复 • 2026-03-18 00:34:33 +08:00

p1094358629

3 小时 1 分钟前

小白不懂，那我装好后就不用管了，每次对话完他会自查提分？

yisen123

2 小时 59 分钟前 via iPhone

@p1094358629 是的，mcp 服务器会和 ai agent 对话

p1094358629

2 小时 57 分钟前

那我重启 claude 后呢？他沉淀下来的技巧和思路固话在哪

moudy

2 小时 46 分钟前 via iPhone

我理解应该是用解决的问题后的反馈去调整 RL 权重。存储自己写过的代码当知识只不过是自己给自己喂屎，最后就是疯牛病

icyalala

2 小时 34 分钟前

你用同一个模型来改进代码质量仍然是 Vibe Coding ，说好听点也不过是 Agentic Coding
真正的改进是这些对话被大模型公司拿去做后训练

bybyte

2 小时 21 分钟前

我的理解是给模型一个明确的改进方向（客观的评价指标），通过这个指标的反馈指导改进方向。是这么理解不

billzhuang

2 小时 20 分钟前 via iPhone

自我强化

sampeng

1 小时 30 分钟前

问题还是把一个问题抽象成数学问题，确实是一个探索的方向。

但是数学问题准不准是另一个故事。

核心就是

5 个根因指标 → 一个质量分（ 0-10000 ）？

那质量分怎么定义？ sonar 就有质量定义。和每次写完跑 sonar 是不是一回事？

那这个指标定义又怎么定义，你这就等于是给代码打分。。。那打分就玩法很多了。

这是第一个疑问

第二个疑问，agent 凭什么听你的，一定要分够就觉得好。。我让他和 codex 结对，10 次里有 1 次就给我来句我觉得没问题就这么着吧。。。

再抽象一下，不用搞传感器那么麻烦。
和你把根因指标的计算方式给他，让他自己动起来也其实没区别。。

yangyaofei

29 分钟前

https://github.com/joi-lab/ouroboros self-modified agent, 已经有了

yusf

11 分钟前

其实就是设计一套系统来给代码质量评分