V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
yisen123
V2EX  ›  程序员

Claude Code 代码的递归自我改进,已经可以实现了

  •  
  •   yisen123 · 3 小时 20 分钟前 · 736 次点击
    大家都在讨论 AGI 的递归自我改进——AI 改进自己,变得更强,再改进自己。

    但其实,代码的递归自我改进,现在就能实现。不需要等 AGI 。

    原理很简单:

    AI Agent 写代码 → 代码进入代码库 → 下次会话 AI 读这些代码作为上下文 → 代码质量决定 AI 下次写得好不好

    如果有一个传感器能测量代码结构质量,告诉 AI 分数:
    - AI 看到分数 → 知道要改进 → 改进代码 → 分数上升
    - 分数上升 → 代码库更清晰 → AI 下次读到更好的上下文 → 写出更好的代码
    - 循环。每次迭代都在变好。

    这就是递归自我改进。不是改进模型本身,是改进模型工作的环境。

    我用 Rust 写了 sentrux ,就是这个传感器:
    - tree-sitter 扫描( 52 种语言)
    - 5 个根因指标 → 一个质量分( 0-10000 )
    - MCP 接入 Claude Code ,Agent 直接能看到分数
    - 几何平均值聚合( Nash 定理)——没法刷分,只有真正改善架构才能提分

    实测:Claude Code Opus 4.6 从零构建 FastAPI 项目,初始分 2627 ,经过反馈循环迭代后到 6772 。不是因为模型变了——是因为有了传感器。

    纯 Rust ,单文件,MIT 开源。
    GitHub: https://github.com/sentrux/sentrux

    欢迎讨论。
    10 条回复    2026-03-18 00:34:33 +08:00
    p1094358629
        1
    p1094358629  
       3 小时 1 分钟前
    小白不懂,那我装好后就不用管了,每次对话完他会自查提分?
    yisen123
        2
    yisen123  
    OP
       2 小时 59 分钟前 via iPhone
    @p1094358629 是的,mcp 服务器会和 ai agent 对话
    p1094358629
        3
    p1094358629  
       2 小时 57 分钟前
    那我重启 claude 后呢?他沉淀下来的技巧和思路 固话在哪
    moudy
        4
    moudy  
       2 小时 46 分钟前 via iPhone
    我理解应该是用解决的问题后的反馈去调整 RL 权重。存储自己写过的代码当知识只不过是自己给自己喂屎,最后就是疯牛病
    icyalala
        5
    icyalala  
       2 小时 34 分钟前
    你用同一个模型来改进代码质量仍然是 Vibe Coding ,说好听点也不过是 Agentic Coding
    真正的改进是这些对话被大模型公司拿去做后训练
    bybyte
        6
    bybyte  
       2 小时 21 分钟前
    我的理解是给模型一个明确的改进方向(客观的评价指标),通过这个指标的反馈指导改进方向。是这么理解不
    billzhuang
        7
    billzhuang  
       2 小时 20 分钟前 via iPhone
    自我强化
    sampeng
        8
    sampeng  
       1 小时 30 分钟前
    问题还是把一个问题抽象成数学问题,确实是一个探索的方向。

    但是数学问题准不准是另一个故事。

    核心就是

    5 个根因指标 → 一个质量分( 0-10000 ) ?

    那质量分怎么定义? sonar 就有质量定义。和每次写完跑 sonar 是不是一回事?

    那这个指标定义又怎么定义,你这就等于是给代码打分。。。那打分就玩法很多了。

    这是第一个疑问

    第二个疑问,agent 凭什么听你的,一定要分够就觉得好。。我让他和 codex 结对,10 次里有 1 次就给我来句我觉得没问题就这么着吧。。。

    再抽象一下,不用搞传感器那么麻烦。
    和你把根因指标的计算方式给他,让他自己动起来也其实没区别。。
    yangyaofei
        9
    yangyaofei  
       29 分钟前
    https://github.com/joi-lab/ouroboros self-modified agent, 已经有了
    yusf
        10
    yusf  
       11 分钟前
    其实就是设计一套系统来给代码质量评分
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   1576 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 26ms · UTC 16:46 · PVG 00:46 · LAX 09:46 · JFK 12:46
    ♥ Do have faith in what you're doing.