天智精选装上 AI:怎么让它进化,又不把我信任的旧系统搞坏
本文最后更新于 2026年7月5日 下午
上一篇我给「天智精选」配了个不掺人工的裁判——天智信号盘,用一条净值曲线回答”选股准不准”。
这一篇要解决的是下一个、也更危险的问题:我想让 AI 去改进这套选股,但我又不敢让它乱动。
一个跑了两个月、我开始信任的系统,和一个聪明但不可预测的 AI,怎么让它们共处?这两天做的所有事,都是在回答这一个问题:如何让 AI 进化一个系统,同时保证它永远推不翻这个系统。
一、一个危险的念头
天智精选的旧引擎(我叫它 selection.select)逻辑很朴素:每个交易日收盘后,从 9 张看涨策略表里挑出”同时命中 ≥3 个策略”的票,再叠加个股资金流、大宗交易、行业资金流打个综合分,降序排出当日名单。稳定、可解释、跑了两个月。
念头是这样冒出来的:既然 AI 这么能算,能不能让它把这套选股变得更聪明? 让它识别市场状态、动态调权、给每只票打分排序……
但紧接着就是一身冷汗:
AI 是个黑箱。它今天可能帮你多赚 3%,明天也可能一拍脑袋让你满仓一只垃圾股。我凭什么把一个已经能用的系统,交给一个我无法预测的东西去改?
大多数”AI 接管”的项目死在这里——要么不敢上,要么上了之后 AI 把原来的逻辑冲得七零八落,出了事都不知道是谁的锅。
我给自己定的规矩是:AI 可以来,但它得先证明自己;在证明之前,它一根手指都碰不到我的生产系统。
二、第一原则:旧系统是不可动摇的锚
所有设计的地基,是一条铁律:
selection.select(旧系统)永远原样运行,任何代码路径都不许改写它、覆盖它、或把 AI 的结果写回它的账户。
AI 能做的,只是在旧系统输出之后叠加一层。旧系统就像一个永远在场的锚——不管 AI 怎么折腾,它始终在跑,始终是那个我可以随时退回去的”安全版本”。
这条原则后来固化成了三条安全不变式,写进代码,每个模式下都恒真:
| 不变式 | 含义 |
|---|---|
old_always_runs |
任何模式下,旧系统都在跑 |
ai_can_override_selection = False |
没有任何路径让 AI 改写旧策略或写它的账户 |
ai_sole_source = False |
旧系统永远并行,AI 永远不是唯一信号源 |
有了这层保底,我才敢往下让 AI 越走越深——因为我知道,最坏情况也坏不到哪去。
三、融合层:AI 只重排,冲突永远取保守
第一步落地的是 hybrid 融合层。它做两件事:
- 重排:旧系统选出的看涨票,用 AI 的打分重新排序(融合分 = 0.5×旧分位 + 0.5×AI分位)。
- 信号裁决:AI 给每只票一个 BUY/HOLD/SELL,和旧策略的意见做一次”取保守”的裁决。
裁决规则是整个融合层的灵魂,核心就俩字——保守:
- AI 看空(SELL)→ 一票否决:哪怕旧策略看好,也判 SELL。回避永远比贪婪安全。
- 旧看涨 + AI 不反对 → BUY:旧系统当稳定闸,AI 不唱反调才买。
- AI 想买、但旧策略没选 → 降级为 HOLD:绝不因为 AI 单方面看好就去追一只旧系统都没相中的票。
- AI 没数据 → 直接回落纯旧策略:AI 链一旦空转,系统无缝退回旧引擎,照常运转。
你会发现,这套规则里 AI 的权力是高度不对称的:它有”否决权”(防你踩雷),却没有”提名权”(不能拉旧系统之外的新票进来)。让 AI 帮你少犯错,而不是让它替你做主——这是我给 AI 的第一层镣铐。
四、”有没有用”必须证明:冠军 vs 挑战者
融合听起来很美,但它到底比旧系统强,还是只是看起来花哨?不能靠感觉,得靠账。
于是有了一套 冠军/挑战者(champion / challenger) 的对照结构:
- 冠军盘(
tianzhi账户):纯旧策略,我信任的那个,继续跑它的真实战绩。 - 挑战者盘(
ai账户):纯融合信号,完全独立的一套虚拟账户,和冠军盘同本金、同规则、互不干扰地影子交易。
两条净值曲线一摆,接口 /api/ai/compare/performance 直接算出 {旧收益, AI收益, alpha, 胜率差, 回撤差}。AI 到底行不行,从此是一个可度量的数字,不是一场辩论。
关键在于:挑战者盘永远只是影子。它照着 AI 信号买卖、记账、被度量,但它的结果永远不会流回生产账户。这就是所谓 safety gate——AI 在擂台上打得再漂亮,也只是在自己的沙盘里;它想上场,得先赢够场次。
五、渐进解锁:让 AI 的话语权从 0 长起来
就算 AI 证明了自己,我也不想”一刀切”地把生产盘交给它。系统的切换应该像调音量,而不是拨开关。
所以有了第三个账户——渐进融合生产盘(blend)。它的排序公式是:
1 | |
这个 w(我叫它 ai_influence,AI 影响力)就是那个”音量旋钮”:
- w = 0 时,公式完全退化成纯旧策略——这是结构性的安全保证:影响力归零,等于 AI 从没来过。
- AI 在挑战者盘上连续跑赢旧系统,
w才被允许往上调一点;一旦落后,w自动往下收。 - 而且
blend盘里,AI 依然只重排、不换股、不否决——候选严格限定在旧系统选出的看涨票里。AI 能改变的只是”先买哪只”,动不了”买哪些”。
换句话说:AI 的话语权不是我给的,是它自己一天天挣来的;挣来了随时可能被收回。
六、给 AI 戴上镣铐:上限、降档、熔断
自动调节 w 听着很酷,但”让 AI 自己决定自己的权力”本身就很危险。所以每一层都压着护栏:
- 分档硬顶:不同模式给
w设不同天花板,越激进的模式放得越宽,但永远有个绝对上限——AI 的影响力在结构上就到不了 50%,旧系统的骨架永远占大头。 - 高波动降档:市场波动率一旦冲高,
w的生效值被强制打折。行情越乱,越把方向盘交回给稳定的旧系统。 - 熔断机制:这是最后一道保险——AI 若连续几天大幅跑输,
w直接归零并冻结一段时间,期间任你手动怎么设都不生效,到期自动解冻。相当于给 AI 一个会自动拉闸的保险丝,我不用盯着,它自己就熔断了。
我特意把奖惩做成不对称的:跑赢要”连续且明显”才加一点点,跑输则收得又快又狠。对一个动别人钱的系统,慢一点变强、快一点变弱,才是对的。
最外面还套了一层稳定性门控:用一个综合了”收益一致性 + 回撤 + 波动”的稳定分,去卡住每一次调节——分数不够,只准降不准升。AI 想扩权,不光要跑赢,还得跑得稳。
七、一个反直觉的坑:为什么需要两个 AI 账户
做到一半我差点删掉挑战者盘(ai),觉得有了渐进融合盘(blend)就够了。幸好停下来想了想——这里藏着一个会让整个机制失效的死循环。
问题在于:blend 盘在 w=0 时,行为和旧策略一模一样。那它相对旧系统的”超额收益”(gap)就恒等于 0。而我调 w 的依据,正是这个 gap。
gap 恒为 0 →
w永远不涨 →blend永远等于旧策略 → gap 永远是 0……
一个永远解锁不了自己的死结。
破解的办法,就是必须有那个纯 AI 的挑战者盘:它满仓跑 AI 信号(w 恒等于 0.5),才能持续产出一个真实的、非零的 gap,用它的表现去驱动 blend 的 w。
一个负责”证明”,一个负责”生产”;度量盘和执行盘必须分开。 这个坑很隐蔽,但它让我想明白了一件事:想让一个系统自我进化,你得先给它一面”照得出真实差距的镜子”。
八、谁能上场:mode 治理与”默认最安全”
最后,所有这些账户由一个模式开关统一治理,它只决定”谁自动交易、谁是权威”,绝不改变各层自己的逻辑:
| 模式 | 谁自动交易 | 权威生产源 |
|---|---|---|
stable(默认) |
只有旧策略盘 | 旧策略 |
ai_experiment |
追加 ai + blend 上场做 A/B | 旧策略 |
full_ai |
ai/blend 全上 | AI 融合盘(但须达标,否则强制回落旧策略) |
注意默认是 stable——这是刻意的。系统部署上线后,AI 并不会自动开始交易,它安安静静待在接口后面当军师。要让 AI 真下场,得我亲手把开关拨到实验模式。 一个会动钱的 AI,最安全的默认状态就是”暂停”。
哪怕拨到最激进的 full_ai,AI 也得先在对照实验里连续跑赢达标(gate),才真正拿到权威;没达标就自动退回旧策略,而旧策略永远并行运行作安全网。AI 主导,从来不等于 AI 独裁。
九、写在最后
两天下来,天智精选的 AI 层长成了这样:
1 | |
回头看,这套东西的重点其实不在”AI 有多强”,而在给了 AI 多大的自由、又上了多少道锁。我给 AI 的最终定位是一句话:
它不是增长引擎,是收益增强器 + 风险观测器。
它的活儿是让一个本来就能用的系统”锦上添花”,顺便帮我盯着风险——而不是去当那个”救世主”。做 AI 系统最大的诱惑,是把方向盘整个交出去;而我这两天做的所有工程,几乎都是在克制这个诱惑:让 AI 进来,但让它每一分权力都可度量、可回收、可熔断。
上一篇我写过一句话,这里依然成立:好的设计不是堆架构,是知道哪些不要。 这次要补一句——
好的 AI 系统,不是让 AI 无所不能,是让它就算失控,也翻不了船。
👉 欢迎光临「天智精选」 tianzhi.vgtmy.com ,请提出宝贵意见。
本文仅记录个人系统的设计思路,不构成任何投资建议;文中系统为纸面模拟,不涉及真实下单。