今天最值得关注的信号是 **Agent 系统正从「加工具」转向「重构训练范式」**。复旦与通义提出的 CUA 训练、港大黄超的「CLI 是 Agent 母语」理念、以及 CoHyDE 的工具检索方案,都在指向同一个方向:Agent 需要被更系统地训练如何选择和调用工具,而非简单堆砌 API。与此同时,RLHF 被曝存在 Alignment Tampering 漏洞,表明当前主流对齐方法存在根本性缺陷,这为 Agent 安全部署敲响警钟。建议 AI builder 关注 RepoT 的可恢复推理和 PANDO 的在线蒸馏等实用技术,它们能直接提升生产环境中的 Agent 可靠性。