天智精选装上 AI：怎么让它进化，又不把我信任的旧系统搞坏

本文最后更新于 2026年7月5日下午

上一篇我给「天智精选」配了个不掺人工的裁判——天智信号盘，用一条净值曲线回答”选股准不准”。

这一篇要解决的是下一个、也更危险的问题：我想让 AI 去改进这套选股，但我又不敢让它乱动。

一个跑了两个月、我开始信任的系统，和一个聪明但不可预测的 AI，怎么让它们共处？这两天做的所有事，都是在回答这一个问题：如何让 AI 进化一个系统，同时保证它永远推不翻这个系统。

一、一个危险的念头

天智精选的旧引擎（我叫它 selection.select）逻辑很朴素：每个交易日收盘后，从 9 张看涨策略表里挑出”同时命中 ≥3 个策略”的票，再叠加个股资金流、大宗交易、行业资金流打个综合分，降序排出当日名单。稳定、可解释、跑了两个月。

念头是这样冒出来的：既然 AI 这么能算，能不能让它把这套选股变得更聪明？ 让它识别市场状态、动态调权、给每只票打分排序……

但紧接着就是一身冷汗：

AI 是个黑箱。它今天可能帮你多赚 3%，明天也可能一拍脑袋让你满仓一只垃圾股。我凭什么把一个已经能用的系统，交给一个我无法预测的东西去改？

大多数”AI 接管”的项目死在这里——要么不敢上，要么上了之后 AI 把原来的逻辑冲得七零八落，出了事都不知道是谁的锅。

我给自己定的规矩是：AI 可以来，但它得先证明自己；在证明之前，它一根手指都碰不到我的生产系统。

二、第一原则：旧系统是不可动摇的锚

所有设计的地基，是一条铁律：

selection.select（旧系统）永远原样运行，任何代码路径都不许改写它、覆盖它、或把 AI 的结果写回它的账户。

AI 能做的，只是在旧系统输出之后叠加一层。旧系统就像一个永远在场的锚——不管 AI 怎么折腾，它始终在跑，始终是那个我可以随时退回去的”安全版本”。

这条原则后来固化成了三条安全不变式，写进代码，每个模式下都恒真：

不变式	含义
`old_always_runs`	任何模式下，旧系统都在跑
`ai_can_override_selection = False`	没有任何路径让 AI 改写旧策略或写它的账户
`ai_sole_source = False`	旧系统永远并行，AI 永远不是唯一信号源

有了这层保底，我才敢往下让 AI 越走越深——因为我知道，最坏情况也坏不到哪去。

三、融合层：AI 只重排，冲突永远取保守

第一步落地的是 hybrid 融合层。它做两件事：

重排：旧系统选出的看涨票，用 AI 的打分重新排序（融合分 = 0.5×旧分位 + 0.5×AI分位）。
信号裁决：AI 给每只票一个 BUY/HOLD/SELL，和旧策略的意见做一次”取保守”的裁决。

裁决规则是整个融合层的灵魂，核心就俩字——保守：

AI 看空（SELL）→ 一票否决：哪怕旧策略看好，也判 SELL。回避永远比贪婪安全。
旧看涨 + AI 不反对 → BUY：旧系统当稳定闸，AI 不唱反调才买。
AI 想买、但旧策略没选 → 降级为 HOLD：绝不因为 AI 单方面看好就去追一只旧系统都没相中的票。
AI 没数据 → 直接回落纯旧策略：AI 链一旦空转，系统无缝退回旧引擎，照常运转。

你会发现，这套规则里 AI 的权力是高度不对称的：它有”否决权”（防你踩雷），却没有”提名权”（不能拉旧系统之外的新票进来）。让 AI 帮你少犯错，而不是让它替你做主——这是我给 AI 的第一层镣铐。

四、”有没有用”必须证明：冠军 vs 挑战者

融合听起来很美，但它到底比旧系统强，还是只是看起来花哨？不能靠感觉，得靠账。

于是有了一套 冠军/挑战者（champion / challenger） 的对照结构：

冠军盘（tianzhi 账户）：纯旧策略，我信任的那个，继续跑它的真实战绩。
挑战者盘（ai 账户）：纯融合信号，完全独立的一套虚拟账户，和冠军盘同本金、同规则、互不干扰地影子交易。

两条净值曲线一摆，接口 /api/ai/compare/performance 直接算出 {旧收益, AI收益, alpha, 胜率差, 回撤差}。AI 到底行不行，从此是一个可度量的数字，不是一场辩论。

关键在于：挑战者盘永远只是影子。它照着 AI 信号买卖、记账、被度量，但它的结果永远不会流回生产账户。这就是所谓 safety gate——AI 在擂台上打得再漂亮，也只是在自己的沙盘里；它想上场，得先赢够场次。

五、渐进解锁：让 AI 的话语权从 0 长起来

就算 AI 证明了自己，我也不想”一刀切”地把生产盘交给它。系统的切换应该像调音量，而不是拨开关。

所以有了第三个账户——渐进融合生产盘（blend）。它的排序公式是：

1	`最终排序 = 旧策略 × (1 − w) + AI × w`

这个 w（我叫它 ai_influence，AI 影响力）就是那个”音量旋钮”：

w = 0 时，公式完全退化成纯旧策略——这是结构性的安全保证：影响力归零，等于 AI 从没来过。
AI 在挑战者盘上连续跑赢旧系统，w 才被允许往上调一点；一旦落后，w 自动往下收。
而且 blend 盘里，AI 依然只重排、不换股、不否决——候选严格限定在旧系统选出的看涨票里。AI 能改变的只是”先买哪只”，动不了”买哪些”。

换句话说：AI 的话语权不是我给的，是它自己一天天挣来的；挣来了随时可能被收回。

六、给 AI 戴上镣铐：上限、降档、熔断

自动调节 w 听着很酷，但”让 AI 自己决定自己的权力”本身就很危险。所以每一层都压着护栏：

分档硬顶：不同模式给 w 设不同天花板，越激进的模式放得越宽，但永远有个绝对上限——AI 的影响力在结构上就到不了 50%，旧系统的骨架永远占大头。
高波动降档：市场波动率一旦冲高，w 的生效值被强制打折。行情越乱，越把方向盘交回给稳定的旧系统。
熔断机制：这是最后一道保险——AI 若连续几天大幅跑输，w 直接归零并冻结一段时间，期间任你手动怎么设都不生效，到期自动解冻。相当于给 AI 一个会自动拉闸的保险丝，我不用盯着，它自己就熔断了。

我特意把奖惩做成不对称的：跑赢要”连续且明显”才加一点点，跑输则收得又快又狠。对一个动别人钱的系统，慢一点变强、快一点变弱，才是对的。

最外面还套了一层稳定性门控：用一个综合了”收益一致性 + 回撤 + 波动”的稳定分，去卡住每一次调节——分数不够，只准降不准升。AI 想扩权，不光要跑赢，还得跑得稳。

七、一个反直觉的坑：为什么需要两个 AI 账户

做到一半我差点删掉挑战者盘（ai），觉得有了渐进融合盘（blend）就够了。幸好停下来想了想——这里藏着一个会让整个机制失效的死循环。

问题在于：blend 盘在 w=0 时，行为和旧策略一模一样。那它相对旧系统的”超额收益”（gap）就恒等于 0。而我调 w 的依据，正是这个 gap。

gap 恒为 0 → w 永远不涨 → blend 永远等于旧策略 → gap 永远是 0……

一个永远解锁不了自己的死结。

破解的办法，就是必须有那个纯 AI 的挑战者盘：它满仓跑 AI 信号（w 恒等于 0.5），才能持续产出一个真实的、非零的 gap，用它的表现去驱动 blend 的 w。

一个负责”证明”，一个负责”生产”；度量盘和执行盘必须分开。 这个坑很隐蔽，但它让我想明白了一件事：想让一个系统自我进化，你得先给它一面”照得出真实差距的镜子”。

八、谁能上场：mode 治理与”默认最安全”

最后，所有这些账户由一个模式开关统一治理，它只决定”谁自动交易、谁是权威”，绝不改变各层自己的逻辑：

模式	谁自动交易	权威生产源
`stable`（默认）	只有旧策略盘	旧策略
`ai_experiment`	追加 ai + blend 上场做 A/B	旧策略
`full_ai`	ai/blend 全上	AI 融合盘（但须达标，否则强制回落旧策略）

注意默认是 stable——这是刻意的。系统部署上线后，AI 并不会自动开始交易，它安安静静待在接口后面当军师。要让 AI 真下场，得我亲手把开关拨到实验模式。 一个会动钱的 AI，最安全的默认状态就是”暂停”。

哪怕拨到最激进的 full_ai，AI 也得先在对照实验里连续跑赢达标（gate），才真正拿到权威；没达标就自动退回旧策略，而旧策略永远并行运行作安全网。AI 主导，从来不等于 AI 独裁。

九、写在最后

两天下来，天智精选的 AI 层长成了这样：

旧系统 selection.select（永远运行 · 不可覆盖 · 稳定锚）
  └─ hybrid 融合：AI 重排 + 冲突取保守（SELL 一票否决，只否决不提名）
       ├─ ai 挑战者盘：纯 AI 影子交易 → 产出真实 gap（度量）
       └─ blend 生产盘：旧×(1−w) + AI×w，w 由 gap 挣来 / 可被收回
            └─ 护栏：分档上限 · 高波动降档 · 熔断冻结 · 稳定性门控
  治理：stable（默认暂停）/ ai_experiment / full_ai（须达标）
  不变式：旧系统永远跑 · AI 不能覆盖 · AI 永不唯一

回头看，这套东西的重点其实不在”AI 有多强”，而在给了 AI 多大的自由、又上了多少道锁。我给 AI 的最终定位是一句话：

它不是增长引擎，是收益增强器 + 风险观测器。

它的活儿是让一个本来就能用的系统”锦上添花”，顺便帮我盯着风险——而不是去当那个”救世主”。做 AI 系统最大的诱惑，是把方向盘整个交出去；而我这两天做的所有工程，几乎都是在克制这个诱惑：让 AI 进来，但让它每一分权力都可度量、可回收、可熔断。

上一篇我写过一句话，这里依然成立：好的设计不是堆架构，是知道哪些不要。 这次要补一句——

好的 AI 系统，不是让 AI 无所不能，是让它就算失控，也翻不了船。

👉 欢迎光临「天智精选」 tianzhi.vgtmy.com ，请提出宝贵意见。

本文仅记录个人系统的设计思路，不构成任何投资建议；文中系统为纸面模拟，不涉及真实下单。

系统设计

#人工智能 #自动化 #量化交易 #A股 #系统设计

天智精选装上 AI：怎么让它进化，又不把我信任的旧系统搞坏

https://www.vgtmy.com/2026/07/05/tianzhi-ai-fusion/

作者

二郎神表弟

发布于

2026年7月5日

更新于

2026年7月5日

许可协议

AI 动态周报 | 2026.06.28 - 2026.07.05 下一篇